为什么做GO/KEGG富集分析

发布时间 2023-07-09 20:57:44作者: 西柚岚

  在进行差异表达分析的时候,我们会得到很多的差异表达基因,富集分析可以把这些差异基因概述成整体事件。A信号通路与症状有关,而不是A1/A2/A3等基因与症状有关。GO和KEGG就是基于不同的分类,而储存的基因相关功能的数据库。

  利用GO数据库,我们就可以得到我们的目标基因在CC, MF和BP三个层面上,主要和什么有关。GO数据库,全称是Gene Ontology(基因本体),他们把基因的功能分成了三个部分分别是:细胞组分(cellular component, CC)、分子功能(molecular function, MF)、生物过程(biological process, BP)。

  KEGG数据库:除了对基因本身功能的注释,基于基因参加的人体各个通路而形成的数据库就是通路相关的数据库。而KEGG就是通路相关的数据库的一种。其实通路数据库有很多,类似于wikipathway,reactome都是相关的通路数据库。只是因为KEGG比较被人熟知,所以基本上都做这个分析的。

  富集分析就是一个把这些功能进行进行整合计算,是一种算法

  GO和KEGG是基础,而富集是过程,最后得到的结果就是整合后的

2023/7/9搬运于知乎hedgehogxuan