基于第三代测序技术的基因组SNP和Indel变异检测关键算法研究

发布时间 2023-05-31 09:32:07作者: wangchuang2017

基于第三代测序技术的基因组SNP和Indel变异检测关键算法研究

廖小青

哈尔滨工业大学

摘要:随着生活水平的提升,人们对于自身的好奇促使人们对基因进行研究。其中,变异是人类疾病的一个重要诱因,对变异进行研究可以推动基础生物学和医学的发展。相比于大区域基因组的结构变异,SNP和Indel变异这种小区域的变异,更难以被检测,小位点变异仍然是比较困难的工作。随着时代的发展,检测变异的技术也不断迭代更新,检测的效果也不断提升。从最开始的第一代测序技术到如今的第三代测序技术,先辈们耗费了大量心血,研究出许多方法,为人类的健康做出了卓越的贡献。为了对第三代测序技序列进行分析研究,本文调查研究基于第三代测序技术的SNP和Indel变异检测算法,提出一套检测变异流程。大致分为三步:一是对数据进行特征提取以及找到可能变异的位点和变异信息,二是对可能变异的位点,以此为中心取200bp序列片段进行多序列比对,得到共识序列,三是计算利用贝叶斯统计方法计算变异的基因型概率。其中最重要的方法是多序列比对方法。在原始的多序列比对方法中,数据有很多冗余信息,并且是基于两两比对的方法,这既耗费时间也耗费空间。本论文采用基于偏序图结构的动态规划算法,偏序图结构摒弃了冗余信息,并且在不损失信息的情况下压缩了数据。动...更多
  • 专辑:

    基础科学

  • 专题:

    生物学

  • DOI:

    10.27061/d.cnki.ghgdu.2020.000734

  • 分类号:

    Q811.4

导师:

刘博;

学科专业:

软件工程(专业学位)