批量修改Fasta文件中序列的名称

发布时间 2023-10-30 10:57:08作者: Bonjour_!

比如一个Fasta文件的内容如下:

seq001|aaa
ATCGGGG
seq002|bbb
AAAATTTT

删除序列名称中“|”后的内容,只保留seq001, seq002这样的名称

点击查看代码
#!/usr/bin/env python
import sys
import pysam

with pysam.FastxFile(sys.argv[1]) as fh:
    for r in fh:
        new_name = r.name.split('|')[0]
        print(">"+new_name)
        print(r.sequence)

python rename_fasta.py test.fa > rename.fa