自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(132)
  • 收藏
  • 关注

原创 测序原始数据上传公共数据库

NCBI提交包括三个步骤:1)创建Bioproject项目并填写元数据;2)提交Biosample样本信息,需注意表格格式要求;3)准备SRA数据提交,建议使用Aspera工具上传原始数据文件,需确保使用完整路径。文中特别强调了表格填写细节和文件上传注意事项,如避免重复行、使用绝对路径等

2025-07-22 08:25:51 659

原创 毒力因子快速注释

VirulenceFinder 2.0

2025-07-07 17:27:49 90

原创 BRAKER:真核微生物cds和蛋白注释

摘要:本文介绍BRAKER3基因组注释工具的使用流程。首先通过Docker运行测试脚本,生成GTF、FASTA和GFF3格式的基因集。然后详细说明RepeatMasker的安装和运行步骤:1)使用conda创建环境并安装软件;2)建立基因组数据库;3)运行RepeatModeler和RepeatMasker进行重复序列屏蔽。最后展示BRAKER3正式运行命令,使用屏蔽后的基因组和蛋白质序列进行注释。关键输出文件包括.masked文件和多种格式的注释结果。

2025-07-03 22:37:59 259

原创 EukDetect:基因标记基因的真核微生物注释

摘要:本文介绍了EukDetect软件在真菌组分析中的应用及其安装使用流程。EukDetect通过比对NCBI数据库中的标记基因来检测真核生物序列,具有较高的准确性。安装过程包括克隆GitHub仓库、下载数据库、创建conda环境等步骤。配置文件需设置输出路径、测序数据参数(如read长度150bp)、样本名称等关键信息。运行命令使用32个核心进行全流程分析。该工具为宏基因组数据中的真菌检测提供了有效解决方案,弥补了现有软件和数据库的不足。

2025-06-23 17:01:53 219

原创 EukCC:真核MAG完整性检验

摘要:EukCC是一款用于评估从宏基因组分析中获得真核生物基因组质量的工具。安装过程包括下载数据库(eukcc2_db_ver_1.2)并设置环境变量,通过conda创建eukcc环境并激活。使用时只需指定输入文件夹(包含.fa后缀的基因组文件)、输出文件夹和线程数等参数即可运行。该工具简化了真核基因组质量评估流程,适用于宏基因组学研究。

2025-06-19 16:00:08 186

原创 GutEuk:反刍动物宏基因组真核序列注释

文介绍GutEuk微生物基因组分析工具的安装和使用方法。

2025-06-18 16:21:01 166

原创 Deseq2:MAG相对丰度差异检验

本研究构建了一套完整的宏基因组关联分析流程:首先利用drep工具将contigs与MAGs进行关联,通过bwa-mem2进行序列比对并统计reads计数;随后开发Python脚本整合不同样本的raw reads数据,并通过contig-bin映射关系将计数转化为bin水平;最终使用DESeq2进行差异分析,识别显著差异的MAGs,并通过火山图可视化结果。

2025-05-31 20:38:48 288

原创 contigs的raw counts转化到bin的raw counts

摘要:该Python脚本用于将原始contig水平的reads计数聚合到bin水平。通过读取contig-to-bin映射文件和contig计数矩阵,脚本合并数据后按bin分组求和,最终输出bin水平的计数矩阵。

2025-05-31 17:01:07 262

原创 md5sum:批量检查文件是否完整

摘要:本文简要介绍了如何准备和使用MD5校验文件。首先需要准备一个包含校验信息的文件(如公司提供的文件),然后使用md5sum命令对该文件进行校验,生成md5.txt校验文件。这一过程通常用于验证文件的完整性和真实性。

2025-05-24 14:40:29 189

原创 mOTUs4:根据标记基因预测宏基因组物种相对丰度

mOTUs是一款用于基于标记基因的OTU(操作分类单元)分析的工具,适用于微生物组研究。

2025-05-19 12:47:31 193

原创 CoverM:contig/bin的相对丰度计算

GitHub上的CoverM工具用于计算宏基因组学中的读段比对统计信息。安装过程包括使用Mamba创建环境、激活环境并安装CoverM。使用CoverM时,可以通过命令行工具coverm -h查看帮助信息。示例脚本展示了如何批量处理fastq.gz格式的测序数据,使用CoverM计算基因组的相对丰度和覆盖度,并将结果输出到指定目录。脚本首先激活conda环境,然后遍历指定目录下的文件,针对每个样本调用CoverM进行分析,最终生成统计结果文件。

2025-05-17 22:33:18 399

原创 MetaHipMer2:从头组装宏基因组

本文介绍了如何安装和配置MetaHipMer2(MHM2)环境,以支持Terabase级别的宏基因组共组装。首先,通过Conda创建并激活名为mhm2_env的环境,并安装必要的依赖项,如CMake、GCC、UPC++、Make、Git和CUDA工具包(如果需要GPU支持)。接着,下载并解压UPC++和MHM2的源代码,配置UPC++的安装路径,并编译安装。然后,通过修改build.sh脚本中的CMake配置,指定MPI C++编译器,并执行编译过程。最后,通过运行mhm2.py脚本验证安装是否成功。整个过

2025-05-14 22:12:05 281

原创 COMEBin:分箱软件安装与使用

GitHub项目ziyewang/COMEBin提供了一种通过对比多视图表示学习对宏基因组contigs进行有效分箱的方法,相关研究发表在《Nature Communications》上。安装过程包括使用Mamba创建环境、安装依赖包和GPU支持的PyTorch,以及克隆项目代码库。使用步骤涉及预处理生成BAM文件,包括构建索引、比对生成排序后的BAM文件,以及为排序的BAM文件建立索引。最后,激活环境并运行脚本进行分箱处理。这一流程旨在利用GPU加速,提高处理效率。

2025-05-13 13:32:11 164

原创 nohup进程删除

【代码】nohup进程删除。

2025-04-13 19:43:56 248

原创 hmmscan结果处理,计算功能TPM(代码)

【代码】hmmscan结果处理,计算功能TPM(代码)

2025-03-27 08:38:45 384

原创 KofamKOALA:KEGG本地化注释

f 输出文件格式 (我选 detail-tsv)

2025-03-25 17:10:47 357

原创 excel:中位数,IQR计算

【代码】excel:中位数,IQR计算。

2025-03-23 14:41:58 204

原创 期刊缩写搜索 web of science法

进入endnotes--Library--Open Term lists--Journal Term lists。Edit Term,如果没有这个期刊,就New Term。找到缩写“ISO ABBREVIATION”

2025-03-17 13:45:06 311

原创 PHASTEST:前噬菌体注释本地化

【代码】PHASTEST:前噬菌体注释本地化。

2025-03-15 00:16:53 330

原创 将bam文件转换为bw文件

【代码】将bam文件转换为bw文件。

2025-03-13 11:51:05 174

原创 做16s/ITS发育树时发现比对结果很差

有可能是因为公司给的一代测序fasta和你在ncbi下载的fasta是反向互补序列的原因。翻转过来之后再去MEGA-X做多序列比对发现比对结果很好了,可以做树。

2025-03-11 15:39:12 119

原创 taxonkit使用例子一个:知道物种名字,获取完整界门纲目科属种

【代码】taxonkit使用例子一个:知道物种名字,获取完整界门纲目科属种。

2025-03-11 13:18:33 172

原创 病毒分类分配管道(VITAP)

【代码】病毒分类分配管道(VITAP)

2025-03-10 18:30:23 271 2

原创 minimap2安装与使用

【代码】minimap2安装与使用。

2025-03-05 09:53:34 185

原创 cutadapt:双端16s的Raw.fastq的去引物

【代码】cutadapt:双端16s的Raw.fastq的去引物。

2025-02-23 01:04:23 177

原创 DRAM-v:病毒辅助代谢基因AMG注释

得到 Metric_files/VIRSorter_affi-contigs.tab。用作 DRAM-v 的输入。注释和蒸馏病毒重叠群需要一些预处理和额外的输入。参考上述博文获取DRAM-v的原理和结果构成。进行处理,处理后的病毒重叠群和。

2025-02-18 21:07:11 965 6

原创 CRISPR spacers数据库;CRT和PILER-CR用于MAGs的spacers搜索

之前介绍了这个方法来预测病毒宿主,今天来介绍另一种比较用的多的方法CRISPR比对。

2025-02-16 20:11:33 600 3

原创 qiime2:安装与使用

【代码】qiime2:安装与使用。

2025-02-11 14:19:38 432

原创 eggnog后kegg结果提取和注释

kegg的对应level,在excel钟使用vlookup函数对应即可。写个代码看看把keggKO和tpm关联起来。用python处理一下。

2025-02-08 00:09:42 693

原创 drep:宏基因组MAG去冗余

【代码】drep:宏基因组MAG去冗余。

2025-01-21 16:25:23 314

原创 RGI:CARD库注释抗性基因

【代码】RGI:CARD库注释抗性基因。

2025-01-14 16:04:05 1674 4

原创 Linux小知识(4)

查看一个分隔符分割文件,的第四列有多少个非冗余字符串。

2024-12-13 09:24:25 288

原创 BAT:确定宏基因组bin的物种(GTDB-tk注释较差的时候)

今天用GTDB-tk注释了我的几百个bin,结果一坨family水平的都有大量不可读的注释因此,尝试用BAT做注释,BAT是CAT软件中的一个部分。

2024-12-05 13:59:46 306

原创 自建代码:根据每组的TPM,流行率过滤低丰度宏基因组Bin

【代码】自建代码:根据每组的TPM,流行率过滤低丰度宏基因组Bin。

2024-12-04 20:57:46 485

原创 MetaPhlAn4:宏基因组快速物种注释

【代码】MetaPhlAn4:宏基因组快速物种注释。

2024-12-02 17:35:39 615

原创 MaAsLin2:确定表型、环境、暴露、协变量和微生物元组学特征之间的多变量关联

对于模型,如果您的输入是计数,则可以使用NEGBIN(负二项分布)和ZINB(零膨胀负二项分布),而对于非计数(例如百分比、CPM或相对丰度)输入,您可以使用LM(线性模型)和CPLM(复合泊松线性模型)。在MaAsLin中,可以用于关联测试的有几种不同类型的统计模型。metadata示例。taxonomy示例。

2024-12-02 09:29:24 658

原创 宏基因组:MAG丰度计算(个人想法)

步骤:将去冗余的MAGs的所有contig,构建bin_contig关系后,合并为一个fasta文件,以这个文件为reference,构建bwa-mem2的index,然后将所有样品的clean_reads映射map到这个reference上,根据比对情况求取所有contigs的TPM,最后将同一bin的contigs的TPM进行求和,得到MAGs的TPM表格。

2024-11-30 20:29:47 772

原创 16S,18S引物覆盖度测试:SILVA和PR2

结果进入:Inspect Results inTaxonomy Browser。可选择感兴趣的物种group,红框里面的是覆盖度和扩增长度。进入:Test your primer set。

2024-11-12 11:04:48 497

原创 MetaGeneMark:宏转录组转录本基因预测

【代码】 MetaGeneMark:宏转录组转录本基因预测。

2024-11-07 23:04:43 408

原创 宏转录组组装:rnaSPAdes

之前写过Trinity,也是个老牌软件今天看文献有人用rnaSPAdes,可能大家比较了解SPAdes,用在宏基因组和单菌组装比较多之前也写过,在下载metaSPAdes时,其实已经把rnaSPAdes给下载了。

2024-11-06 20:27:13 601

提取eggNOG结果文件中的GO号并计数

自己写的小代码

2023-04-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除