使用R语言查询某物种所有通路及通路内的基因

发布时间 2023-09-13 17:10:04作者: --看日出--

  使用R语言查询某物种所有通路及通路内的基因,这里使用Y书的clusterProfiler包。

  这里以人类为例查询所有通路及通路内的基因:

library(R.utils)
R.utils::setOption("clusterProfiler.download.method","auto")
hsa_kegg <- clusterProfiler::download_KEGG("hsa")

  这里使用的是clusterProfiler包内的download_KEGG函数对人类(hsa)通路信息进行下载(注:这里的R.utils::setOption是为了设置下载方式,可以防止一些warnings)。

  运行以上代码后会产生以下结果,hsa_kegg是一个列表,里面包含KEGGPATHID2EXTIDKEGGPATHID2NAME,其中每个的内容均为数据框格式。

 

  分别对其进行查看:

   其中KEGGPATHID2EXTID的内容为两列的数据框,第一列是KEGG pathway ID,第二列为该pathway内对应基因的ID。

   而KEGGPATHID2NAME也是一个两列的数据框,第一列也是KEGG pathway ID,第二列则是该pathway的name。

  如此就可以获得人类全部的KEGG pathway ID和pathway name,以及每个pathway内所包含的基因。