基于长读数和重比对的结构变异检测方法研究

发布时间 2023-05-31 09:32:07作者: wangchuang2017

基于长读数和重比对的结构变异检测方法研究

杜彩云

河南理工大学

摘要:人类基因中普遍存在结构变异,一些结构变异的发生会产生重大的基因型疾病,这对人类的健康来说是一个巨大的威胁。为了有效治疗这些基因型疾病,最关键的一步是准确检测相应的结构变异类型和位置。常见的结构变异有插入、缺失、倒位和串联重复。其中倒位和缺失检测是结构变异研究中两个重要而又复杂的问题,目前的研究并未取得令人满意的结果。长读数测序技术的出现,弥补下一代测序技术产生的双端读数长度短的不足,为发生在重复区的结构变异检测研究奠定基础。本文基于第三代测序技术产生的长读数,利用长读数异常比对结果检测结构变异中发生倒位和缺失位置。本文的主要研究工作如下:(1)本文提出一种基于长读数和重比对的倒位变异检测方法,目的是提高倒位变异检测的准确性。首先,该方法将长读数和参考基因序列的比对结果文件作为输入数据,从比对文件中提取长读数比对信息和发生剪切的部分序列,即剪切读数,并根据每条长读数比对信息中剪切的次数,分为双端剪切读数和一端剪切读数。其次,该方法使用比对工具将剪切读数重比对到一个参考基因序列上,产生剪切读数比对文件。再次,该方法根据长读数和剪切读数之间的比对位置关系确定长读数来自参考基因序列的正链或负链...更多
  • 专辑:

    基础科学;信息科技

  • 专题:

    生物学;计算机软件及计算机应用

  • DOI:

    10.27116/d.cnki.gjzgc.2021.000275

  • 分类号:

    TP311.13;Q811.4

导师:

罗军伟;