泛基因组助力作物育种改良

发布时间 2023-09-10 22:20:28作者: 生物信息与育种

结构变异SV

基于单个参考基因组鉴定SV

三类方法:reads depth, reads pair, split reads

缺点:(1)参考基因组的不完全组装或真正的个体间的缺失使得某些基因座序列不能很好的被鉴定;(2)不同的reads比对效率较低,(3)短reads的不均匀覆盖偏差可能导致不准确的鉴定。

弥补:10x,Hi-C和Strand-Seq等通过构建特殊文库,使用短reads来获取较长的基因组信息;Bionano,PacBio和Oxford Nanopore等测序技术能够获得参考基因组中缺失的复杂序列。

通过构建泛基因组来鉴定SV

一是多个参考基因组比较,成本很高,尤其是复杂基因组,可以考虑单倍型分离,但难以整合到一个参考系或坐标系中;

map-to-pan及graph pan-genome可总结归类SV信息。

转座元件与作物改良的相关性

TEs作为结构变异的驱动因素,与作物表型的相关性已被反复证明。

TEs可以通过多种方式在功能上相关,包括修改转录的基因产物的结构和数量。

TEs的准确性除了依赖于高质量组装,还有家族水平的注释。三种常规方法:一是基于同源性,如Repbase和P-MITE;二是基于序列拷贝数;三十根据结构特征从头识别。常用工具EDTA和RepeatModeler2,小编认为现在基本上用EDTA就可以了。

利用pan-genome进行QTL定位和GWAS

基于单个参考基因组的QTL定位或GWAS的一个主要问题是参考偏差。如果与性状相关的变异在参考基因组中不存在,则无法定位到它们。另一个问题是,由于技术问题(如序列覆盖率低),相对于参考基因组的真正缺失与缺失数据无法区分。在真缺失中插补等位基因变异会导致检测显著关联的功效降低。

SV GWAS可以作为SNP GWAS结果补充,在油菜、大豆、桃、绿豆中都有研究。

利用pan-genome进行基因组预测

基于单个参考基因组鉴定的SNP已被用于基因组选择,但是实际上会引入许多限制和偏差。需要新的方法来识别泛基因组框架内的标记,以提高预测的准确性。

实用单倍型图(The Practical Haplotype Graph, PHG)成功处理了复杂性状和植物育种计划所需的物种泛基因组的复杂性。在PHG方法中,育种计划创始系的现有基因组资源(例如,全基因组重测序数据和/或全基因组组装)被加载到图泛基因组数据库中。基于图泛基因组数据库得出的一致单倍型,实现了育种群体中低序列覆盖度个体(低至0.01x覆盖率)的准确填补。PHG是一种有前途的策略,可以降低基因分型的成本,同时也在大型育种群体中捕获更广泛的多样性。

环境基因型互作(G×E)降低了在新环境中生长个体的基因组预测的准确性,将SV数据纳入GxE预测模型可能进一步提高预测准确性。但并非所有SV都会被SNP标记,由未标记的SV驱动的表型变异将被预测模型遗漏。额外添加SV标记目前在育种计划中可能不切实际,因为它们需要新的数据生成和分析基础设施。育种家需要平衡对不同标记进行评分的成本与基因组预测和遗传增益效率的提高。目前,如果现有的SNP基因分型技术包括与表型重要SV的强LD标记,则来自泛基因组的SV信息将最容易被利用。对于未被SNP标记的SV,使用新方法表征这些变异只有在遗传增益足够大的情况才会被考虑。

泛基因组应用育种的挑战与机遇

多倍体基因组的复杂性

异源多倍体和同源多倍体在植物中很常见,几乎所有被子植物在进化史上至少经历了两轮多倍化事件。多倍化可以增加等位基因的多样性,扩大基因的互补性,产生新的表型变异,并有助于适应新的环境。利用这一点,植物育种家还产生了人工多倍体,来获得育种目的。

多倍体物种除了高质量基因组组装较为困难外,还面临着进一步育种改良的复杂问题:(1)当变异没有正确比对到亚基因组时,复杂性状的遗传结构的剖析可能会被混淆(2)生物学上,多倍体中更广泛的上位效应和亚基因组之间的调节反馈会使得基于基因型的表型预测复杂化。

多倍体作物内部的结构变异程度将大于二倍体作物,SVs可能是多倍体作物改良中特别富有成效的特征。

研究不足的作物基因组资源

对于大多数研究不足的作物物种,转录组组装目前被用作基因组的替代。小编之前看过泛转录组的文章,其实也是水文的好方向。

快速驯化新物种

最近高质量基因组和泛基因组的出现使作物驯化的新时代成为可能。借助泛基因组信息,育种者可以更有效地识别潜在的驯化性状的因果遗传变异(例如,SNP,CNV,PAV),并应用基因编辑工具在野生植物中快速获得理想的农艺性状。如番茄、水稻等研究。

从作物野生亲缘种中识别和利用遗传多样性一直是作物改良的主要焦点。与野生近缘种相比,驯化大大降低了作物的遗传多样性。泛基因组信息和CRISPR/Cas9技术能够从头驯化野生植物,并可以减少使用二级和三级基因库(野生近缘种)遗传变异的障碍。

本文要点摘自2021年美国爱荷华州立大学生态、进化与有机生物学系的Matthew B. Hufford和明尼苏达大学农学和植物遗传学系的Candice N. Hirsch教授的综述论文:Della Coletta R, Qiu Y, Ou S, Hufford MB, Hirsch CN. How the pan-genome is changing crop genomics and improvement. Genome Biol. 2021;22(1):3. Published 2021 Jan 4. doi:10.1186/s13059-020-02224-8