seqkit软件根据染色体名称从fasta文件中批量提取数据

发布时间 2023-10-13 17:30:21作者: 小鲨鱼2018

 

001、

[root@pc1 test1]# ls
a.fa  chr.list
[root@pc1 test1]# cat a.fa             ## 测试fasta
>chr1
tttcccggg
>chr2
tttggg
ccc
>chr3
cccttt
>chr4
aaaaattt
[root@pc1 test1]# cat chr.list         ## 染色体列表
chr2
chr4
[root@pc1 test1]# seqkit -w 8 grep -f chr.list a.fa > result.fa   ## -w指定每行输出的碱基数目
[INFO] 2 patterns loaded from file
[root@pc1 test1]# cat result.fa         ## 结果文件
>chr2
tttgggcc
c
>chr4
aaaaattt