【一起学生信】根据reads名称提取bam

本文介绍了一种使用Picard工具根据reads名称高效提取BAM文件的方法。通过调整验证标准,可以避免因BAM文件格式不规范而产生的错误,从而提高处理效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

上文(https://lipidong.blog.csdn.net/article/details/88975801) 提到了根据参考基因组的位置来提取bam信息,
根据基因组区域来提取其实是比较容易的,即便没有现成的软件我们将bam排序后,用awk也可以快速提取,但是如果是根据reads名称来提取就比较麻烦了,自己写脚本或者用grep速度会比较慢,今天推荐用picard来操作。

java -jar picard.jar FilterSamReads \
       I=input.bam \ 
       O=output.bam \ 
       READ_LIST_FILE=read_names.txt \ 
      FILTER=includeReadList

如果bam文件没有加入 SM tag, 可能会报错,这时候我们需要picard 放宽条件,要用到这个参数 VALIDATION_STRINGENCY=LENIENT

java -jar picard.jar FilterSamReads \
       I=input.bam \ 
       O=output.bam \ 
       READ_LIST_FILE=read_names.txt \ 
      FILTER=includeReadList \
      VALIDATION_STRINGENCY=LENIENT

VALIDATION_STRINGENCY 这个参数的含义是: Validation stringency for all SAM files read by this program. Setting stringency to SILENT can improve performance when processing a BAM file in which variable-length data (read, qualities, tags) do not otherwise need to be decoded ,默认是 STRICT(严格),就会对bam文件的格式规范卡的比较严格,一言不合就报错,所以我们把这里设置为LENIENT(宽松)。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

探索者v

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值