由基因型-组织表达项目(GTEx)联想开去

发布时间 2024-01-09 21:39:44作者: 生物信息与育种

近日,由丹麦奥胡斯大学、华南农业大学、中国农科院基因组所、美国农业部、马里兰大学、爱丁堡大学和等多家单位联合发起的猪基因型-组织表达计划(PigGTEx)取得阶段性进展,成功构建猪基因型-组织表达图谱,相关文章 “A compendium of genetic regulatory effects across pig tissues” 发表在《Nature Genetics》上。

在本研究中,汇集了来自公共数据库和联盟成员的测序数据,总计包括了34个组织的5457个RNA-seq数据以及1602个全基因组重测序数据(包含国内外数据库中所有猪重测序数据,且新增深度重测序个体510个)。通过不同组织间的比较,评估了遗传调控的组织特异性,并使用多组学的数据阐明了其中作用的分子机制,对207种复杂表型的QTL进行了定位,为猪的基因组选择和基因编辑育种提供重要依据。最后与人类进行了比较,证明了猪和人在复杂表型背后的遗传调控方面的相似性,说明猪可以作为人类生物模型的重要性,具体可访问:http://piggtex.farmgtex.org


PigGTEx是农场动物GTEx(FarmGTEx)项目的一部分。为了对猪、牛、鸡等家养动物实现生物学驱动的选择育种,需要对动物中的遗传变异和基因进行注释,由此启动FarmGTEx,其目的是在于发现家畜物种调控变异和提供分子表型预测的公共资源。目前为止,已经构建了牛、鸡、猪、绵羊、山羊、鸭等畜禽基因型-组织表达项目。中国在这些国际合作项目中扮演着重要角色,发表了好几篇高水平文章。

FarmGTEx地址:https://www.genome.gov/Funded-Programs-Projects/Genotype-Tissue-Expression-Project

GTEx项目最初来自人类研究,全称Genotype-Tissue Expression (基因型-组织表达),旨在建立全面的公共资源来研究组织特异性基因的表达和调控,即找到序列与实际性状(疾病)的关系,确定不同基因究竟如何影响表达。GTEx计划是现有规模最大的人类器官转录组研究计划,主要由美国NIH(国立卫生研究院)的公共基金计划连续资助了10年(2010-2019),研究成果最终以 15 篇论文的形式发表在 Science、Cell 等顶尖期刊中。

GTEx地址:https://www.genome.gov/Funded-Programs-Projects/Genotype-Tissue-Expression-Project

在生物学研究领域,往往人类研究领先,其次动物,再者植物。那么,有植物GTEx项目吗?小编简单检索了下,似乎没有像人类和动物这样的大项目。但是在一些文章中是有提及的,比如Rice GTEx出现在2023年华中农大谢为博老师发表在NC的全转录组关联分析文章中,描述如下:

In humans, the Genotype-Tissue Expression (GTEx) project collects and analyzes transcriptome data of multiple tissues from different individuals, demonstrating the effectiveness of population transcriptome data in identifying genetic variations that can explain differences in gene expression among individuals, known as expression quantitative trait loci (eQTLs). Currently, we are running a Rice GTEx project that aims to build a comprehensive resource to study tissue-specific gene expression and regulation in rice. This will help identify causal genes and understand the molecular processes through which genetic variations affect agronomic traits.

但实际上,这并非一个权威发布的GTEx项目,毕竟只有275个样本,相比于上述成千上万的转录组样本显得微不足道。但在植物研究中,上百份转录组样本已经少见,多时空组织的全生命周期样本更是稀有,拟南芥兴许有,但我没调研。所以,植物的功能基因表达调控研究任重道远,测序成本再降几倍也许能启动类似项目。

人类的基因组做了这么多精细研究,为啥基因组预测还是没有大规模流行(注:在人类中一般用polygenic score (PGS)或 polygenic risk score (PRS)来预测人类疾病风险,目前已有一些疾病临床应用。)?说白了还是P=G+E太复杂了。动植物反而在GP应用上如火如荼。所以,作物有作物的研究方法,既然单一个体价值低,那么就用群体来筛,我不要求每一个都精准,从群体里捞一捞,增加一些高价值个体选中的概率,总能捞到好的。