有时候需要手动拆分demultiplexing fastq
- 你递交给测序商的index是不对的,得到的只有Undetermined fastq;
- 类似10x的库,有非常多的index需要拆分;
一个现成的工具:demultiplex
需要先构建一个tsv index文件:ATACSeq_oligos.txt
默认index在read name里
这里我们的index在read本身,所以用了参数-r,然后index所在的fastq要放在第一位,而不是第二位。
demultiplex demux -r -s 1 ATACSeq_oligos.txt Undetermined_Undetermined_22GFCYLT3_L4_2.fq.gz Undetermined_Undetermined_22GFCYLT3_L4_1.fq.gz
注意,gzip压缩非常耗时,所以非常不建议处理gz的文件,最好先解压缩为fastq文件。
另一个可以参考的工具:https://github.com/Molmed/fastq_demux