Mutect2 call mutations 时需要用到一个af-only-gnomad.hg19.vcf.gz文件,如果使用hg38参考基因组,这个文件可以从gatk的resource of bundle上下载,但是对于hg19,并不提供这个文件。但是,我们可以找到gnomAD的完全版,使用bcftools来提取AF信息,并生成新的文件,过程如下:
# 下载后的文件
wget https://hgdownload.soe.ucsc.edu/gbdb/hg19/gnomAD/vcf/gnomad.exomes.r2.0.2.sites.vcf.gz
wget https://hgdownload.soe.ucsc.edu/gbdb/hg19/gnomAD/vcf/gnomad.exomes.r2.0.2.sites.vcf.gz.tbi
# 提取AF,压缩并索引
bcftools annotate -x ^INFO/AF gnomad.exomes.r2.0.2.sites.vcf.gz > af-only-gnomad.hg19.vcf
# 修改染色体名,和ref一样
zcat af-only-gnomad.hg19.vcf.gz|grep "#" > af_19.head
zcat af-only-gnomad.hg19.vcf.gz|grep -v "#" >af-only-gnomad.hg19.vcf.tmp
sed -i "s/^/chr&/g" af-only-gnomad.hg19.vcf.tmp # -i 直接修改原文件
cat af_19.head af-only-gnomad.hg19.vcf.tmp > af-only-gnomad.hg19.vcf
# 修改
#vim af-only-gnomad.hg19.vcf
#插入chr 如 ##contig=<ID=Y> 改为 ##contig=<ID=chrY>
# 压缩,建索引
bgzip af-only-gnomad.hg19.vcf
bcftools index -t af-only-gnomad.hg19.vcf.gz