HUMAnN与PCoA的一个简单综述

发布时间 2023-08-23 16:34:29作者: 王哲MGG_AI

摘要
宏基因组分析在现代生态学和农业科学中扮演着重要的角色,通过深入研究土壤微生物群落功能组成的变化,可以为农作物种植提供有益的指导和决策依据。HUMAnN和PCoA在宏基因组学的研究中相辅相成,为我们深入了解微生物群落提供了有力工具。HUMAnN功能组成分析帮助我们理解微生物群落的功能潜力和生态角色,为生态系统功能与稳定性研究提供重要信息。而PCoA则可以将复杂的宏基因
材料与方法
1.实验设计
本研究在吉林省农科院选择了三个不同地点作为试验地点,每个地点设立三个生物学重复,以增加统计学的可靠性。每个试验地点均划分为两个相等的面积,分别种植B73玉米材料和Mo17玉米材料。根据第四周、第六周、第八周和第十周的不同时间点,采集根际土壤样本进行宏基因组测序,以获得样本在不同时间点的功能组成信息。采用HUMAnN方法,探究B73玉米和Mo17玉米在不同地点和时间点根际土壤微生物群落的功能组成变化。
2.HUMAnN功能组成分析概述
HUMAnN(The HMP Unified Metabolic Analysis Network)是一种基于宏基因组数据的生物信息学工具,用于分析微生物群落的功能组成。它通过将宏基因组序列比对到已知的功能基因家族,如KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库,从而定量评估各个基因家族在样本中的丰度。HUMAnN的主要优势在于其高通量、高效率和可重复性,可以帮助研究者深入了解微生物群落在功能水平上的变化。

3.HUMAnN在实验中的应用与分析结果

通过HUMAnN功能组成分析,将宏基因组序列比对到功能基因家族数据库,获得不同时间点、不同地点和不同样本的功能组成信息。分析结果将揭示B73玉米和Mo17玉米材料在根际土壤微生物群落的功能特征差异,并探讨其与宿主基因型、土壤环境、不同发育时期的相互关系。

humann_genefamilies 文件包含了基因家族丰度信息。基因家族是指一组具有相似功能和序列相似性的基因。
humann_pathabundance 文件包含了通路丰度信息。通路是指一组相互作用的基因家族,它们共同完成一个特定的生物过程。
humann_pathcoverage 文件包含了通路覆盖率信息。通路覆盖率指的是在一个通路中,有多少基因家族被检测到。
humann_genefamilies_go:将基因家族映射到 Gene Ontology (GO) 数据库后的结果。GO 数据库提供了一个用于描述基因和基因产物功能的控制词汇表。
humann_genefamilies_ko:将基因家族映射到 KEGG Orthology (KO) 数据库后的结果。KO 数据库提供了一个用于描述基因和基因产物功能的控制词汇表。
humann_genefamilies_eggnog:将基因家族映射到 eggNOG 数据库后的结果。eggNOG 数据库提供了一个用于描述蛋白质家族和它们之间进化关系的控制词汇表。
humann_genefamilies_rxn:将基因家族映射到 MetaCyc 数据库中的反应 (rxn) 后的结果。MetaCyc 是一个生物化学反应和通路的数据库。
humann_genefamilies_pfam:将基因家族映射到 Pfam 数据库后的结果。Pfam 数据库提供了一个用于描述蛋白质家族和它们之间进化关系的控制词汇表。

humann_genefamilies_level4ec:将基因家族映射到 Enzyme Commission (EC) 数据库中第四级酶编号后的结果。EC 数据库提供了一个用于描述酶催化反应类型的控制词汇表。

这些数据库的注释结果可以帮助更好地理解您的宏基因组数据。通过将基因家族映射到不同的数据库,可以获得关于基因家族功能、进化关系和参与的生物化学反应等方面的信息。这些信息可以帮助更好地了解感兴趣的微生物群落及其成员的代谢潜能和生物学特征。

4. 结论
在本研究中,我们使用了 HUMAnN 来分析宏基因组数据。HUMAnN 是一个用于高效准确地分析宏基因组或宏转录组测序数据中微生物通路的存在/缺失和丰度的流程。这个过程被称为功能分析,旨在描述微生物群落及其成员的代谢潜能。
首先,我们使用 HUMAnN 的预处理步骤来准备输入数据。这包括将测序数据质量控制、去除宿主污染和去除低复杂度序列等步骤。然后,我们使用 HUMAnN 来对预处理后的数据进行分析。HUMAnN 首先使用 MetaPhlAn 来鉴定样本中的微生物种类,然后使用 ChocoPhlAn 和 UniRef 数据库来计算每个基因家族的丰度。最后,HUMAnN 使用 MinPath 算法来推断每个通路的存在/缺失和丰度。
HUMAnN 的输出文件包括 humann_genefamilies、humann_pathabundance 和 humann_pathcoverage 等文件。这些文件分别包含了每个样本中每个基因家族的丰度信息、每个通路的丰度信息和每个通路的覆盖率信息。此外,HUMAnN 还提供了将基因家族映射到其他数据库的功能,以获得其他数据库的注释结果。