生物信息-转录组实验记录09/04

发布时间 2023-09-04 22:19:41作者: 月隐雲後

8.29
流程:使用Trimommatic 软件进行过滤,bwa构建参考基因组索引,bwa mem算法比对失败(sam文件无内容)

  1. '[M::bwa_idx_load_from_disk] read 0 ALT contigs':BWA在加载参考基因组索引时,未读取到任何备选(ALT)的contigs。这可能意味着你的参考基因组没有额外的备选序列,只有主要序列。

  2. '[W::bseq_read] the 2nd file has fewer sequences.':第2个文件(输入的反向读文件)比第1个文件(输入的前向读文件)包含更少的序列。这可能是因为两个输入文件中的读没有正确配对。

  3. '[M::mem_pestat] # candidate unique pairs for (FF, FR, RF, RR): (4, 7, 2, 1)':对于前向-前向(FF)、前向-反向(FR)、反向-前向(RF)和反向-反向(RR)的读配对,存在的可能唯一配对数目是(4, 7, 2, 1)。这些数字表示在读配对中,按照给定的配对方向(前向或反向)进行了计数。

  4. '[mem_sam_pe] paired reads have different names: "SRR6023854.2", "SRR6023854.166"':部分读对的名字不相同,例如"SRR6023854.2"与"SRR6023854.166"。BWA期望读对的名称完全匹配,所以这些不同的名称可能会导致读对无法正确配对。
    注:备选ALT
    理解双末端测序原理
    理解参考基因组
    理解bwa比对原理(目前只研究过BWT算法)

1.考虑bwa文件不适合比对转录组,市面上的软件通常使用tophat,hisat,hisat2,STAR等

2.推荐哈佛大学生物信息学课程,讲的很简洁很全面

3.了解RNA-Seq技术栈,这是一个完整的体系