gatk 实现基于染色体合并gvcf文件,并获取变异

发布时间 2023-10-07 10:39:09作者: 小鲨鱼2018

 

001、基于染色体合并gvcf文件

gatk CombineGVCFs -R reference.fna -V gvcf.list -L chrN -O chrN.merged.g.vcf.gz

其中:

referen.fna 是参考基因组;

gvcf.list是将要合并的gvcf文件的列表文件,一行一个个体;格式如下:

ERR2985607.g.vcf
ERR2985608.g.vcf
ERR2985609.g.vcf
ERR2985610.g.vcf

chrN是染色体的名称:跟参考基因组中的染色体名称一致(不带>号)

-o指定输出文件。

 

002、获取单个染色体的vcf文件

 

 

 

003、最后合并所有染色体的vcf文件。

 

.