高通量测序技术的应用与发展前景

发布时间 2023-06-10 23:31:09作者: sweetie9
小组成员及分工:
许湉 22020080055 整理汇总全文,关于高通量测序的开发与应用的文本编辑
王娅娣 22020080048 资料搜集,关于高通量测序的未来发展和局限性的文本编辑
魏依璐 22020080051 关于高通量测序的前言、背景的文本编辑
吴栩涵 22020080052 关于高通量测序各项技术的文本编辑

  人类基因组序列深刻地改变了我们对生物学、人类多样性和疾病的理解。从第一个序列草案到我们个人基因组和基因组医学的新生时代的道路之所以成为可能,是因为过去10年来DNA测序技术的非凡进步。在这里,我们讨论了常用的高通量测序平台,围绕它们开发的测序分析阵列,以及当前测序平台及其临床应用面临的挑战。

一.前言

  2001年,人类基因组序列以草案的形式完成,随后确定了几种模式生物的基因组序列。这些壮举是通过Sanger DNA测序完成的,它的产量有限且成本高。事实上,第一个人类基因组序列大概耗费了5-10亿美元,这些限制降低了DNA测序用于治疗应用的潜力。在“成品”人类基因组发布后,美国国家人类基因组研究所创建了一项耗资7000万美元的DNA测序技术计划,旨在在10年内实现1000美元的人类基因组,并出现了一系列高通量测序技术。

  从这一角度来看,到人类基因组计划完成时,对传统Sanger测序的改进使每个碱基的成本降低了约100倍。然而,要达到1000美元的基因组门槛,还需要额外的五个数量级的飞跃。大部分问题已经被解决——一个基因组序列的成本目前不到2000美元。达到这个目标会涉及许多商业HTS平台,它们在细节上有所不同,但通常遵循类似的一般范式:模板制备、克隆扩增,然后是大规模并行测序的周期性循环。我们关注的是当今最常用的平台以及更多的最新发展。我们还概述了不断增长的HTS应用,并强调了它们被基因组学界用来阐明以前生物学中的表内主题。

二、选定商用HTSP平台概述--Illumina

  Illumina/Solexa于2006年发布了基因组分析仪II,在这几年里,Illumina技术的进步在很大程度上为增加产量和降低成本奠定了基础。Illumina目前生产出一套针对各种吞吐量和周转时间进行优化的测序仪。MiSeq是一个快速的个人台式测序仪,运行时间低至4小时,输出用于小基因组的靶向测序和测序。并且HiSeq 2500专为高通量应用而设计,可在6天内产生1Tb的电流输出。

  2014年初,Illumina推出了NextSeq 500以及HiSeq X Ten。然而,NextSeq能够在不到30小时内产生120Gb或单个303基因组。NextSeq500系统还采用了一种新的双通道测序策略。在这种方法中,胞嘧啶标记为红色,胸腺嘧啶标记为绿色,腺嘌呤有效地为黄色,鸟嘌呤未标记。与MiSeq和HiSeq平台中使用的四通道策略相比,两通道测序只需要两张图像即可进行核苷酸检测,减少了数据处理时间,提高了吞吐量。

  HiSeq X Ten是一个人口规模的全基因组测序系统,它能够在3天内输出1.8 Tb,或以每年303个覆盖率输出18000个基因组。目前,Illumina仅支持HiSeq X Ten系统上的WGSof人体样本。除了增强的光学和计算能力外,HiSeq X还通过引入一种新型的流动池技术来改善集群生成化学,从而显著提高吞吐量。图案化的流动池包含数十亿个纳米阱,这些纳米阱使簇的间距和大小标准化,从而实现更高的簇密度。

三、高通量测序技术发展现状

  高通量测序技术堪称测序技术发展历程的一个里程碑,该技术可以对数百万个 DNA 分子进行同时测序。这使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,因此也称其为深度测序或下一代测序技术。目前,所说的高通量测序技术主要包括第二代测序技术以及单分子测序技术,此外还包括Ion PGM 测序技术,纳米孔测序技术等。

3.1 第二代测序技术

  基于焦磷酸测序法的超高通量基因组测序系统,开创了第二代序技术的先河。此后,Illumina公司推出了Solexa技术,并于2006年发布了基因组分析仪II。近年来,Illumina技术的为产量的增加和成本的降低做了巨大贡献。因此,Illumina机器目前主导着HTS市场。Solexa测序过程主要边合成边测序,即生成新DNA互补链时,要么加入的dNTP通过酶促反应催化底物激发出荧光,要么直接加入被荧光标记的dNTP或半简并引物,在合成或连接生成互补链时释放出荧光信号。通过捕获光信号并转化为一个测序峰值,获得互补链序列信息。

  Illumina目前生产了一整套针对各种测序通量和周转时间进行优化的测序仪。MiSeq运行时间低至4小时,用于输出小基因组的靶向测序。而HiSeq 2500专为高通量应用设计,可在6天内输出1Tb的电流,且成本较低。

3.2 Ion PGM 测序技术

  Ion PGM 测序技术的模板制备和测序步骤在概念上类似于焦磷酸测序。但与焦磷酸测序不同的是,Ion PGM 测序仪的设计是基于半导体芯片技术,在半导体芯片的微孔中固定DNA 链.随后依次掺入 ACGT,在DNA延伸过程中氢离子释放引起的pH变化。位于微孔底部的传感器检测这些pH变化并转换为电压信号。此外,Ion Torrent在测序中避免了用光学扫描来辨别核苷酸,显著地加快了测序时间,降低了成本。

3.3 纳米孔测序技术

  基于纳米孔的测序技术是一种新兴的单分子测序技术,近年来取得了重大进展。纳米孔测序可以采取多种形式,目前主要依赖于DNA或单个核苷酸通过一个通道进行转换。在目前的技术中,包括有数百个独立的微孔,每个微孔都包含一个由生物纳米孔穿孔的合成双层。当碱基通过分子运动蛋白穿过孔时,电流会发生特征变化,通过测量这种不同的变化即可以完成测序。

四、高通量测序技术的开发与应用

4.1 绘制基因组调控信息

  高通量测序不仅仅是简单地对基因组进行测序,还是高分辨率的 DNA 调控元件的全基因组图谱。这些技术中的第一个是 ChIP-seq,其中与转录因子 (TF) 或染色质修饰相关的 DNA 被免疫选择,然后使用高通量测序进行测序。将序列映射回基因组可以揭示结合区域或染色质修饰的位置。

4.2 映射基因组的 3D 组织

  我们对染色体的全局组织和区室化的理解已经通过高通量测序技术得到了深刻的推进。 染色质相互作用可以使用多种高通量测序测定法进行研究,例如通过双端标签测序和 Hi-C 进行的染色质相互作用分析。这些测定中的每一种都依赖于基于邻近度的交联、剪切染色质结扎,然后进行测序以得出接触图。 Hi-C 是第一项允许对染色质组织进行无偏见的全基因组询问的技术,并揭示了基因组广泛地分为开放和封闭染色质状态。

  Hi-C技术的最新进展与极深度测序相结合,产生了更高分辨率的接触图。Hi-C 数据的建模还表明分形小球染色质状态,这是一种既能最大化包装又能保持访问任何基因组位点的灵活性的构象。

4.3 表征转录组

  高通量测序的出现大大增强了我们对RNA多种细胞作用的认识。许多思想上的进化是许多高通量测序应用的直接结果,这些应用旨在系统地识别各种类型的 RNA 以及表征 RNA 结构、RNA-蛋白质相互作用和基因组定位。

  了解这些新发现的转录本的结构和生物学导致了其他高通量测序应用的开发,能够全面而详细地研究RNA生物学,从而增强我们对RNA在正常细胞稳态和人类疾病中发挥的各种作用的认识。

4.4 微生物组测序

  高通量测序的进步使宏基因组样本的广泛编目成为可能,从而深入了解来自各种来源的微生物物种的多样性。这些研究既使用 16S rRNA 基因测序来确定系统发育关系,也使用更全面的鸟枪法测序来预测详细的物种和基因组成。这些研究发现身体部位栖息地和不同个体之间存在广泛差异,从而产生了“个人微生物组”的概念。更深入的理解将需要更详细地描述不同健康状态下微生物群落的动态特征,以及更多的综合研究来调查微生物群、宿主和环境之间的功能相互作用。

4.5 癌症基因组测序

  癌症是HTS应用效果显著的另一个重要领域。癌症基因组图谱和国际癌症基因组联盟已经对数千对正常肿瘤进行了基因组和外显子组测序。这些研究描述了20多种癌症类型的突变景观,表明肿瘤在突变的类型和数量上都有很大差异。这些全局描述对于检测癌症驱动基因所必需的背景突变率的发展是不可或缺的。HTS的规模和敏感性也使得肿瘤异质性、克隆进化和耐药机制的全局描述成为可能。通过使用单细胞测序技术跟踪原发性乳腺癌细胞的拷贝数畸变。HTS还被用于比较原发肿瘤与复发病变,从而表征化疗效果以及对治疗耐药的分子机制。总之,这些癌症的分子图谱正在形成癌症诊断和治疗新范式的基础。

五、当前高通量测序技术的局限性和可能性

  越来越清楚的是,虽然今天的技术可能能够为研究人员和临床医生提供人群水平的测序,但关键的局限性仍然存在。从技术角度来看,整个基因组的准确性和覆盖率仍然存在问题,特别是对于富含GC的区域和长均聚物延伸。此外,目前大多数平台产生的短读取长度严重限制了我们准确表征大重复区域、许多索引和SV的能力,使基因组的大部分不透明或不准确。正如瓶中基因组联盟所设想的那样,建立一个金标准基因组,以及CLARITY挑战中规定的数据处理、变体调用和报告标准,对于比较和报告不同平台和研究的准确性将是有价值的。考虑到不同平台的局限性和偏见,准确的基因组测序也可能需要多种技术的结合,性化医疗的全部承诺依赖于更全面的技术的常规临床应用。

  为了使大规模基因组学完全融入临床,我们需要减少与基因组数据存储和解释相关的成本和时间尺度。然而,最重要的是,我们必须提高我们理解未知意义变异的生物学和临床后果的能力。这类改变在个人基因组序列中最常见,包括影响已知致病基因编码序列的新变异,但也可以指以前与疾病无关的基因或基因组调控区域的变异。这些变异的解释将受益于额外的基因组测序以及大型基因组学项目提供的数据,这些项目可以生成更完整的参考数据库。开放获取项目,如个人基因组计划和综合个人组学分析,也将为将表型与序列联系起来提供宝贵的社区资源。结合新变异的高通量生化测量和详细的健康记录以及开放数据共享,将最大限度地提高我们解释个人基因组和更好地了解人类健康和疾病的能力。

参考文献:

[1] Abyzov, A., Uban, A.E., Snyder, M., and Gerstein, M. (2011). CNVnator: an approach to discover, genotype, and characterize typical and atypical CNVs from family and population genome sequencing. Genome Res. 21, 974–984.

[2] Bentley, D.R., Balasubramanian, S., Swerdlow, H.P., Smith, G.P., Milton, J.,Brown, C.G., Hall, K.P., Evers, D.J., Barnes, C.L., Bignell, H.R., et al. (2008).Accurate whole human genome sequencing using reversible terminator chemistry. Nature 456, 53–59.

[3] Brownstein, C.A., Beggs, A.H., Homer, N., Merriman, B., Yu, T.W., Flannery, K.C., DeChene, E.T., Towne, M.C., Savage, S.K., Price, E.N., et al. (2014).An international effort towards developing standards for best practices in analysis, interpretation and reporting of clinical genome sequencing results in the CLARITY Challenge. Genome Biol. 15, R53.

[4] Chen, R., Mias, G.I., Li-Pook-Than, J., Jiang, L., Lam, H.Y.K., Chen, R.,Miriami, E., Karczewski, K.J., Hariharan, M., Dewey, F.E., et al. (2012). Personal omics profifiling reveals dynamic molecular and medical phenotypes.Cell 148, 1293–1307.

[5] Drmanac, R., Sparks, A.B., Callow, M.J., Halpern, A.L., Burns, N.L., Kermani,B.G., Carnevali, P., Nazarenko, I., Nilsen, G.B., Yeung, G., et al. (2010). Human genome sequencing using unchained base reads on self-assembling DNA nanoarrays. Science 327, 78–81.

[6] Guo, J., Xu, N., Li, Z., Zhang, S., Wu, J., Kim, D.H., Sano Marma, M., Meng, Q.,Cao, H., Li, X., et al. (2008). Four-color DNA sequencing with 30 -O-modifified nucleotide reversible terminators and chemically cleavable flfluorescent dideoxynucleotides. Proc. Natl. Acad. Sci. USA 105, 9145–9150.

[7] Smith, M.G., Gianoulis, T.A., Pukatzki, S., Mekalanos, J.J., Ornston, L.N.,Gerstein, M., and Snyder, M. (2007). New insights into Acinetobacter baumannii pathogenesis revealed by high-density pyrosequencing and transposon mutagenesis. Genes Dev. 21, 601–614.[8] Snyder, M., Du, J., and Gerstein, M. (2010). Personal genome sequencing:current approaches and challenges. Genes Dev. 24, 423–431.