LocPatcH An efficient long-read hybrid error correction algorithm based on local pHMM

发布时间 2023-12-26 09:35:20作者: 王闯wangchuang2017

该文档主要介绍了一种基于装配的方法和概率隐藏马尔科夫模型 (pHMM) 用于纠正长读序列的错误。文档详细描述了对酵母数据进行实验的结果、纠正方法的拓扑结构以及实验设置和数据集。

 
这种基于装配的纠正方法相对于直接纠正存在哪些优势?
pHMM 的拓扑结构是怎样的?
在实验中使用了什么样的数据集?
提示:AI将基于您添加的资源进行思考~
 
 
这种基于装配的纠正方法相对于直接纠正存在哪些优势?
 

基于装配的纠正方法相对于直接纠正存在以下优势:

  1. 不需要高测序深度:相较于自我纠正方法,基于装配的纠正方法不需要高测序深度。
  2. 较高的纠正性能:基于装配的纠正方法能够提供较高的纠正性能,通过将长读序列与由短读组装而成的contigs进行比对,从而利用比对生成的相邻信息进行纠正。
  3. 减少计算资源消耗:相较于其他基于机器学习的方法,基于装配的纠正方法能够节省至少三分之一的计算资源。
  4. 较低的内存使用:基于装配的纠正方法相较于基于比对和装配的方法,对内存的使用要求较低。

请注意,以上回答是根据通用知识进行的推断,并非从上下文中获取的信息。

 
 
LocPatcH An efficient long-read hybrid error correction algorithm based on local pHMM.pdf
1
2
4
5
6
6
 
 
pHMM 的拓扑结构是怎样的?
 

pHMM的拓扑结构如下图所示:起始和结束状态初始设置为匹配状态,最大连续插入状态的数量设置为10,最大连续删除状态的数量设置为3。请注意,这是根据提供的上下文信息做出的推测回答。

 
 
 
A Long read hybrid error correction algorithm based on segmented pHMM.pdf
1
2
 
 
 
在实验中使用了什么样的数据集?
 

在实验中,使用了来自 Escherichia coli K-12 MG1655 (E. coli) 和 Saccharomyces cerevisiae S288C (酵母菌) 的数据集,这些数据集是通过 Pacbio、Oxford Nanopore 和 Illumina 技术获得的。数据集的详细信息列在了论文中的表格1中。

 
 
LocPatcH An efficient long-read hybrid error correction algorithm based on local pHMM.pdf
2
2
5
5
6
6