使用R语言查询某物种所有通路及通路内的基因

发布时间 2023-09-13 16:58:50作者: --看日出--

使用R语言查询某物种所有通路及通路内的基因,这里使用Y书的clusterProfiler包。

这里以人类为例查询所有通路及通路内的基因:

library(R.utils)
R.utils::setOption("clusterProfiler.download.method","auto")
hsa_kegg <- clusterProfiler::download_KEGG("hsa")

 这里使用的是clusterProfiler包内的download_KEGG函数对人类(hsa)通路信息进行下载(注:这里的R.utils::setOption是为了设置下载方式,可以防止一些warnings)。

运行以上代码后会产生以下结果,hsa_kegg是一个列表,里面包含KEGGPATHID2EXTIDKEGGPATHID2NAME,其中每个的内容均为数据框格式。

 

 分别对其进行查看:

 其中KEGGPATHID2EXTID的内容为两列的数据框,第一列是KEGG pathway ID,第二列为该pathway内对应基因的ID。

 而KEGGPATHID2NAME也是一个两列的数据框,第一列也是KEGG pathway ID,第二列则是该pathway的name。

如此就可以获得人类全部的KEGG pathway ID和pathway name,以及每个pathway内所包含的基因。