Mol Plant | 黄学辉等教授综述植物泛基因组及其应用

发布时间 2023-12-10 17:02:55作者: 生物信息与育种


今日分享一篇去年底今年初发表的植物泛基因组综述,作者史俊鹏、田志喜、赖锦盛、黄学辉,全员大佬。

该文详细介绍了植物泛基因组的概念、研究进展和应用。

摘要

植物基因组高度多样化,很大一部分序列在不同个体间并不共享。

泛基因组包括变异DNA序列和保守的核心序列,代表一个物种中所有非冗余的DNA。

该文综述了植物泛基因组的最新进展,包括造成结构变异的主要驱动力、代表泛基因组的方法创新、构建植物泛基因组的主要成功案例。

也总结了解码端粒到端粒(T2T)或无间隙(Gapless)植物基因组中剩余“暗物质”的最新研究。

泛基因组的重要性

植物基因组极其复杂和多样。第一个植物基因组(拟南芥)于2000年发布,此后技术进步使得现在有超过1000个植物基因组,涵盖约800个物种。

基因组大小的巨大变化、转座元件的系谱特异活性、与物种形成及多样化相关的多倍体化和二倍体化事件等特征已被解码。

早期认为大多数DNA序列在物种内的个体间是共享的(核心基因组)。然而,越来越多的证据表明许多DNA序列是可变的,只在部分个体间共享(可有可无基因组)。

泛基因组代表一个物种中所有DNA序列的多样性,其完整性和准确性预计优于常用的单一线性参考基因组。泛基因组的研究已扩展至许多其他植物物种。

植物社区也致力于同一物种内更多个体的测序,因为植物内部种群的多样性可能非常高。泛基因组对功能基因组学的发现具有巨大潜力。

植物泛基因组的主要结构变异(SV)驱动力

最初的植物泛基因组是通过组装七个野生大豆基因组构建的,揭示了多个与抗病性、种子成分和开花时间相关的可变基因。

结构变异的主要来源有:

  • 转座元件(TEs):是植物基因组中最丰富的功能元素,通过“复制粘贴”、“剪切粘贴”和“滚动循环”机制转座。
  • 非等位基因同源重组(NAHR):当非等位重复DNA序列在减数分裂期间错配时发生,导致删除、复制等。
  • 遗传渗入/水平基因转移(HGT):可以使物种获得原本不存在于其基因库中的DNA序列。
  • 多倍体植物中的基因丢失(分离):全基因组复制事件产生的基因冗余可以缓冲基因组变异的有害效应。

植物泛基因组中与变异DNA序列相关的结构变异(SVs)的主要驱动力概览。
(A) 转座元件的活动(包括转座和切除)导致常见的SVs,这可能与表型变异有关(以玉米种子颜色变异为例)。
(B) 两个非等位重复DNA(A-B和A'-B')之间的NAHR(非等位基因同源重组)产生两个重组等位基因,一个带有插入物(A'-B),另一个则删除了两个位点(B-A')。
(C) HGT(水平基因转移)可以使植物快速获得原本不在其基因库中的基因,甚至可以跨界从真菌/细菌到植物。
(D) 多倍体植物中全基因组复制后重复基因的差异性分离产生了个体间的PAV(存在/缺失变异)基因。

植物泛基因组的发展

早期尝试使用短读序列识别全基因组范围内的SV。"map-to-pan"策略用于组装未映射的短读序列并构建泛基因组。

最近使用高质量基因组组装比较构建泛基因组。包括水稻、玉米、小麦、大豆、棉花和番茄等多种作物已经成功建立了泛基因组。

主要植物的泛基因组研究概括。还有黄瓜、油菜、绿豆等。

T2T/gapless植物基因组的构建。

主要植物泛基因组研究时间线。

2000年,第一个模式植物——拟南芥的参考基因组发布,随后发布了包括水稻、葡萄、玉米、大豆、番茄和小麦在内的重要农作物的首个参考基因组(上)。随着植物参考基因组的可用性和短读序列测序技术(2010年)的成熟,使用新型计算算法进行全基因组复杂结构变异(SVs,包括插入、删除、重复、反转等)的鉴定成为可能。2016年,提出了“map-to-pan”策略,用于未映射短读的组装和泛基因组的构建。几乎在同一时间,PacBio和Nanopore长读序列测序技术的进步促进了高质量基因组组装和比较,以公正鉴定PAV序列和泛基因组构建。2020年,第一个基于图的植物泛基因组在大豆中构建;这预计将是比传统线性泛基因组方法更好的选择,以进行更有效的泛基因组分析。

植物泛基因组应用育种

植物泛基因组应用育种,包括应用于关联定位、群体基因组分析、表观研究、GS和基因编辑等。

使用泛基因组作为新的参考标准可能鉴定更多与重要性状相关的新位点,尤其是那些在线性参考基因组中缺失的复杂结构变异(SVs)(左部分)。泛基因组还可能由于遗传变异的更高准确性,改善群体基因组分析。使用图基因组调用的群体SVs已被证明可以部分解释复杂性状的“遗传力缺失”,这对基因组选择非常重要(底部部分)。图基因组还显示出减少常见的映射偏差的潜力,这种偏差通常在将来自遗传上相距较远的个体的表观遗传数据与单一线性参考基因组对齐时报告,从而实现无偏见的表观等位基因识别(上部分)。最后,泛基因组可以帮助识别用于编辑的重要可变基因,并在新作物物种或品种中建立新的编辑系统,用于新的作物驯化(右部分)。

总之,此文详细介绍了植物泛基因组的重要性、研究进展和方法学发展,突显了泛基因组对于植物遗传学和育种的巨大潜力。大佬们灌水都是香的,小编记录下,也许哪天PPT里能用上几张图片。

Shi J, Tian Z, Lai J, Huang X. Plant pan-genomics and its applications. Mol Plant. 2023;16(1):168-186.

更多信息请关注: