自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

2503_92191991的博客

作物遗传育种博士研究生在读,日常记录R数据处理及统计绘图、单细胞转录组、全基因组关联分析、重测序(BSA)、群体遗传结构分析的学习笔记,欢迎交流学习。

  • 博客(28)
  • 收藏
  • 关注

原创 20 GWAS分析实操-gwas结果解读

本研究通过曼哈顿图和QQ图分析基因组数据,发现存在极端表型值。曼哈顿图显示基因组中存在显著异常信号点,提示可能与特殊表型相关;QQ图进一步验证了数据分布偏离正态预期,暗示存在潜在遗传关联位点。这些异常发现值得进一步研究其生物学意义。

2025-08-02 10:06:37 157

原创 07 连锁不平衡和群体结构分析原理

本文介绍了群体遗传学中的三个核心概念:连锁不平衡、亲缘关系和群体结构。连锁不平衡描述了同染色体上等位基因的非随机组合现象,常用r²和D'指标衡量,并通过LD衰减分析评估标记间的关联程度。亲缘关系矩阵用于量化个体间的遗传相似性,可通过系谱或分子标记数据计算。群体结构分析则通过PCA和Structure等方法揭示群体内的遗传分层,帮助识别亚群和离群样本。文中还介绍了相关计算方法和常用软件工具(如Plink、GCTA等),为群体遗传学研究提供了实用的分析框架。

2025-08-01 09:31:50 1149

原创 05 GWAS表型数据处理原理

摘要:表型数据处理需区分质量性状(二分类/多分类)和数量性状(后者需正态化并剔除异常值)。R中可用shapiro.test检验正态性,必要时进行Box-cox或INV转换。多年多点数据可采用均值、BLUP或BLUE方法分析。重测序指对已知基因组物种个体进行测序以分析差异,是基因组研究的重要方法。数据处理方法选择直接影响后续分析结果的可靠性。

2025-07-31 21:12:08 130

原创 02 基因型数据质控过滤原理

本文介绍了基因组学研究中常见的变异类型(SNP、Indel、SV)及相关数据处理方法。主要内容包括:基因型数据质控(个体和位点层面的质量控制指标)、缺失数据填充技术,以及常用的数据格式(VCF、Plink ped/bed、Hapmap),详细说明了每种格式的文件组成和用途。这些内容是基因组数据分析的基础知识,适用于生物信息学领域的研究人员参考学习。

2025-07-31 18:08:26 255

原创 01 全基因组关联分析原理

摘要:全基因组关联分析(GWAS)是一种通过检测全基因组范围内的遗传变异(如SNP),将基因型与表型相关联的研究方法。文章介绍了GWAS的基本原理、材料选择、表型和基因型数据获取、常用分析模型(线性模型和混合线性模型)及结果可视化方法(曼哈顿图和QQ图)。同时概述了GWAS在作物遗传研究中的应用案例,包括小麦、芝麻、棉花和蓖麻等作物的性状分析,展示了GWAS在定位重要农艺性状相关基因方面的应用价值。文中还提及了常用的GWAS分析软件和数据解读工具。

2025-07-31 17:45:18 1062

原创 本地运行GAPIT时报错!!!

GAPIT运行报错分析与解决方案 在运行GAPIT进行GWAS分析时出现关键错误:Error in crossprod((snps), (snps)) : "crossprod"不是BUILTIN函数,并伴随多个memory.size() is no longer supported警告。主要问题可能源于: R环境异常:基础函数crossprod未正常加载,可能是R版本过旧或核心包损坏。 函数冲突:用户自定义代码覆盖了crossprod函数。 过时函数调用:GAPIT包中调用了已弃用的m

2025-07-30 12:03:33 1205

原创 细胞发育轨迹构建代码解释!

本文介绍了利用单细胞测序数据构建细胞发育轨迹的方法流程。通过预处理步骤(大小因子估计和离散度估计)后,进行差异表达分析筛选显著基因(qval<0.01),并将其作为排序基因。随后进行降维处理和细胞排序,最终构建细胞发育轨迹。文中强调了数据质量检查、基因筛选合理性、降维方法选择以及生物学验证的重要性,为单细胞伪时间分析提供了完整的技术路线。

2025-07-27 10:14:36 952

原创 单个样本的单细胞转录组拟时序分析代码报错解决小技巧!

您的单细胞RNA分析代码报错原因是细胞类型标识中可能存在特殊字符格式问题。错误显示无法找到"CD8 T"细胞类型,尽管该标识出现在levels列表中。建议检查标识中的空格是否为标准ASCII空格,而非特殊字符。可通过utf8ToInt()检查字符编码,用gsub()替换非标准空格,再尝试子集化操作。修正步骤包括:1)检查现有标识字符编码;2)清除特殊字符;3)重新执行subset()函数。特别注意复制粘贴时可能引入的非标准字符,确保所有标识格式一致。

2025-07-26 23:34:30 664

原创 Day 9-zhou一个单细胞单样本数据的处理

本文介绍了使用R语言进行单细胞RNA测序数据分析的基本流程。首先通过untar()解压原始数据文件,使用Read10X()读取10X格式的单细胞数据,然后使用Seurat包创建Seurat对象。对数据进行初步探索后,使用subset()进行下采样处理。文章展示了如何查看数据维度、类型和内容,包括稀疏矩阵和Seurat对象的结构。最后,通过head()函数查看元数据信息,以及如何提取基因表达矩阵。该流程为单细胞数据分析提供了基础框架,适用于后续的细胞聚类和差异表达分析。

2025-07-23 17:06:09 1078

原创 Day 8-zhou R包批量安装小补充!!!

本文介绍了在R环境中安装和管理Bioconductor及CRAN包的详细方法。首先说明使用BiocManager安装Bioconductor核心包S4Vectors和BiocGenerics的步骤,包括检查BiocManager安装、处理依赖关系和版本兼容性。其次介绍了update.packages()函数的使用,重点解释了ask=FALSE和checkBuilt=TRUE参数的作用,以及更新过程中的注意事项。最后针对一个批量安装包的代码片段进行分析,指出其存在的镜像源和安装方法问题,并提供了改进方案,将B

2025-07-23 09:28:57 1034 1

原创 Day 8-zhou 关于Windows11本地笔记本电脑下的单细胞R包安装问题解决及环境搭建

安装scRNAseq和celldex包报错解决方案 主要错误分析 依赖冲突: 关键错误信息:namespace 'DelayedArray' 0.32.0 is already loaded, but >= 0.33.3 is required 多个包版本冲突(BiocGenerics/S4Vectors) 安装流程问题: 镜像URL末尾包含多余空格(示例中可见https://.../CRAN/ ") 依赖包版本过低 解决方案 1. 清理环境并更新所有依赖包 # 清理工作环境 rm(list

2025-07-23 09:17:43 1101

原创 Day 8-zhou 任务二 单细胞转录组学背景知识与数据查找

单细胞测序数据获取与应用指南 摘要:本文介绍了单细胞测序数据的获取途径和分析方法。随着测序成本下降(从2万元/样本降至数千元),研究者可通过公共数据库获取单细胞数据。主要数据来源包括GEO、Single Cell Portal、Human Cell Atlas等,其中GEO最为常用。文章详细说明了在GEO中搜索单细胞数据的技巧(通过"Series"入口,识别"scRNA"关键词),并指导如何下载不同格式的数据文件。最后布置了实践作业:查找领域相关数据,记录样本信息,并

2025-07-22 19:39:21 678

原创 Day 8-zhou批量装包

本文介绍了单细胞数据分析的R语言环境配置指南。首先要求R版本≥4.4.0,并建议Windows用户安装Rtools以支持GitHub包的安装。文章提供了批量安装R包的方法:先设置CRAN和中国科技大学镜像源,然后分别定义需要从CRAN和Bioconductor安装的包列表(包括tidyverse、Seurat、monocle等常用分析工具包)。通过for循环实现自动检测和批量安装功能。但在实际安装过程中,由于镜像源访问问题(科大镜像无法连接)和R版本兼容性问题,导致多个包安装失败。建议读者检查镜像源可用性并

2025-07-22 19:09:22 1269

原创 Day 7-zhou测序基础知识

本文系统梳理了测序技术的发展历程与技术特点。Sanger测序作为一代技术,具有高准确性但通量低;二代测序(NGS)如Illumina平台通过边合成边测序实现高通量,但读长短;三代单分子测序(PacBio/Nanopore)突破读长限制,可直接检测修饰但错误率较高。文章详细比较了各代技术的原理、参数指标(读长、通量、错误率)、应用场景及局限性,并介绍了数据格式、存储方案和实验设计要点,为选择合适测序策略提供技术参考。

2025-07-21 16:13:40 281

原创 GWAS-基因型数据质控过滤原理之数据格式

本文介绍了基因组变异分析中的关键数据类型和质控流程。主要内容包括三种常见变异类型(SNP、InDel、SV),基因型数据的质控步骤(个体和位点两个层面),以及VCF、Plink(PED/MAP)、BED、Hapmap四种常用数据格式的结构特点。特别强调了质控过程中缺失率、杂合率、MAF等关键指标的重要性,并展示了各数据格式的示例图。这些内容为基因组变异分析提供了基础的数据处理和质量控制指导。

2025-07-20 18:08:13 282

原创 Day 6-zhou R包学习

本文介绍了R包的基本概念及其安装方法。R包是R语言中函数、数据和文档的集合,可通过CRAN或Bioconductor获取。安装时建议先设置国内镜像(如清华镜像)以加快下载速度,使用install.packages()或BiocManager::install()进行安装。特别指出,安装源码包需要预先安装对应版本的RTools。文中通过stringr和limma包的安装示例,详细说明了常见问题(如镜像限流、权限不足等)的解决方法,并提供了更换镜像、检查RTools状态等实用代码片段,帮助用户顺利完成R包安装。

2025-07-20 12:02:05 1224

原创 Day 5-zhou 向量和数据框

先定义yy <- 3a[x, y]

2025-07-19 12:11:11 957

原创 Linux环境变量-PATH

摘要:本文介绍了Linux环境变量PATH的基础知识及配置方法。主要内容包括理解Linux命令查找机制、环境变量设置流程,以及如何将软件(如circos)添加到PATH中。通过echo、which等命令演示变量查看和路径查找,并详细说明了通过修改~/.profile文件和source命令更新环境变量的具体操作步骤,帮助用户解决"command not found"问题。适用于Ubuntu/Centos系统下生物信息学软件的安装配置。

2025-07-18 21:21:10 181

原创 Day 4-zhou

本文介绍了R和RStudio的基础使用指南。主要内容包括:RStudio的界面介绍及简单绘图演示(plot和runif函数);管理工作目录的两种方法(setwd和Rproject);R语言基本操作如运算、赋值、变量管理;以及RStudio的实用功能如字体设置、历史命令查看等。重点强调了使用Rproject管理项目的优势,包括自动设置工作目录、恢复工作环境等功能,并提供了新建Rproject的详细步骤。文章还包含多个代码示例和配图说明,适合R语言初学者快速入门基础操作。

2025-07-18 11:24:59 848

原创 Linux之awk命令(表格处理)

awk命令简明教程 本文介绍了文本处理工具awk的基本用法,主要包括: awk基本语法结构:awk 'BEGIN{} {command1;command2} END{}' file 常用选项:-F指定分隔符(支持正则表达式)、OFS设置输出分隔符 核心功能:字段提取、条件筛选、正则匹配、数值计算等 实用技巧:NR记录行号、NF获取字段数、IGNORECASE忽略大小写 综合应用示例:处理基因数据文件,包含多条件筛选、字段重排、输出重定向等 文中还强调了保存命令到脚本文件的工作习惯,便于批量执行和重复使用。

2025-07-17 22:01:53 838

原创 Linux管道运用

所有能打印到屏幕(标准输出)的内容都可以通过管道传递给下一个命令(前提条件是下一个命令可以接收标准输入)grepcatzcat。

2025-07-17 19:57:40 403

原创 Day 3-zhou拓展(后遗症解决)

(rna-seq) bio04@iZwz91gfpi4vgyxd8iiun3Z:~$ fastqc #唤起fastqc,查看是否操作成功。Day 3-zhou~~~后遗症解决完毕!

2025-07-17 19:19:43 882

原创 Linux文件编辑修改命令sed

sed [选项]command输入文件搜索举例: sedfile.txt直接修改文件内容(危险动作)-i 选项。

2025-07-17 18:46:56 586

原创 Linux基础命令(操作)

BASH提示符#、$命令一般由三个部分组成(英文状态)命令名+命令选项+命令参数ls列出目录内容ls命令用来列出目录内容相关选项:ls -a 显示所有文件(包括隐藏文件)”ls -l 显示详细信息 llls -t 按时间顺序显示文件ls -a -lls -alls -t -lcd切换路径cd切换目录上一级目录"…"当前目录".”用户家目录"~”上一个工作目录"-”空 回到家目录cd 目录cd Desktop。

2025-07-17 13:22:13 782

原创 Day 3-zhou 扩展 记错日期版!!!

推荐使用系统包管理器安装libxtst6等依赖库,这是最直接有效的解决方案。从错误信息来看,fastqc运行时出现了 Java 库依赖问题,具体是缺少 libXtst.so.6 这个图形库文件。以下是解决方案:问题原因FastQC 是基于 Java 的工具,运行时需要图形库支持。错误信息表明:这是因为系统中缺少必要的 X11 图形库依赖。解决方案方法一:安装系统级依赖(推荐)在终端执行以下命令安装缺失的库:方法二:在 Conda 环境中安装库(若无 root 权限)

2025-07-17 12:04:18 1031

原创 Day 3-zhou记错日期版!!!

Welcome to Ubuntu 18.04.6 LTS (GNU/Linux 4.15.0-213-generic x86_64)Welcome to Alibaba Cloud Elastic Compute Service !Last login: Wed Jul 16 22:20:47 2025 from 111.55.25.118bio04@iZwz91gfpi4vgyxd8iiun3Z:~$ ll #列举一下当前目录下的文件详细信息total 68drwxr-xr-x 8 bio04

2025-07-17 11:33:46 1380

原创 # Day 3-zhou

cat 文本文件名: 查看并直接将文本文件的内容输出到屏幕。mv file1 file2 将file1重命名为file2。注意-n与head之间有空格,-n和3之间空格可有可无。mv file 路径 移动file到某路径下。tail 文本文件名:默认输出后10行,head 文本文件名: 默认输出前10行,cd 与cd ~ 都是回到用户目录。复制file1,命名为file2。cd -返回上次进入过的目录。rm -r 删除目录。vi 新建脚本或txt文档。

2025-07-16 15:18:13 333

原创 Day 1-Zhou

谷歌、必应、虫部落快搜、搜狗微信&知乎、Github。有道云笔记、onenote、csdn、腾讯云社区。代码,回车enter。大于号>加空格接内容。

2025-07-15 12:55:58 104

【Linux系统管理】常用命令详解:文件操作、权限管理及命令行工具应用指南

内容概要:本文档详细介绍了Linux命令的基本用法,涵盖了命令的基本结构(命令名+命令选项+命令参数)、常用的文件和目录操作命令(如ls、cd、pwd、touch、rm、mkdir、cp、mv)、文件权限管理(chmod)、文件内容查看与处理命令(cat、zcat、head、tail、more、less、wc、grep、cut)、高级查找命令(find)、获取帮助的方式(man、--help),以及文本编辑器Vim的使用方法。此外,还简要提及了远程编辑Linux服务器文件的工具Editplus和sed命令的用法。; 适合人群:适用于对Linux系统有一定了解,希望深入学习Linux命令行操作的初学者和中级用户。; 使用场景及目标:①快速掌握Linux命令行的基本操作,如文件和目录管理;②熟练使用命令查看、编辑文件内容;③学会使用高级命令进行文件查找和批量处理;④掌握Vim编辑器的使用技巧,提高文本编辑效率;⑤能够通过命令获取帮助信息,解决日常操作中遇到的问题。; 阅读建议:建议读者按照命令分类逐步学习,结合实际操作练习,尤其是文件和目录操作、权限管理、文件内容查看与处理等常用命令。对于Vim编辑器的学习,建议先熟悉命令模式下的基本操作,再逐步掌握插入模式和ex模式的使用。同时,可利用提供的在线资源进一步深入了解各个命令的具体用法。

2025-07-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除