生物信息学及其在乳酸菌进化和益生潜力研究中的作用

发布时间 2023-06-08 18:16:55作者: dyr11

小组成员:组长丁雅瑞

董若萌22020080007负责1.介绍

2.生物信息学在LAB适应和进化研究中的应用

3.泛核基因组分析

龚渊22020080012负责4.新陈代谢

5.LAB的适应与进化

6.特定生态位的适应和专业化

丁雅瑞22020080006负责7.生物信息学在潜在益生菌LAB初步筛选中的应用

8.筛选参与胃肠道环境中生存的基因

9.筛查可能对宿主提供直接健康益处的基因

高一22020080011负责10.质量和安全

11.适应性进化

12.生物信息学的优势、局限和挑战

生物信息学及其在乳酸菌进化和益生潜力研究中的作用

1.介绍

乳酸菌(LAB)是一组存在于多种环境中的有益菌群,包括人类胃肠道(GITs) 和其他动物、泌尿生殖道,以及乳制品和发酵食品[1]。LAB通常是革兰氏阳性、过氧化氢酶阴性、不产孢子的细菌,可以是同源性、兼性异源性或专性异源性。已知的乳酸菌属包括乳杆菌属、乳球菌属、Leuconostoc属、Pediococcus属和少数链球菌属[2]。乳酸菌“通常被认为是安全的”(GRAS),并被世界卫生组织定义为益生菌,是“活的微生物,当给予足够的量时,对宿主的健康有益”。

生物信息学最初用于生物化学领域,以确定Edman降解肽测序后的蛋白质结构,现已成为DNA分析的关键参与者。从原始测序读取的基本处理到更复杂的分析,如比较基因组学、宏基因组学、进化研究、结构和代谢建模,生物信息学工具在这个“组学”、“大数据”和现代生物学的时代得到了广泛的应用和发展[3]

2.生物信息学在LAB适应和进化研究中的应用

由于LAB能够入侵和栖息在高度多样化和复杂的环境中,因此对其普遍存在性进行了大量研究。由于它们在系统发育上的密切性,LAB占据多种生态位的能力表明它们在进化过程中具有相当大的遗传适应性。比较基因组学和系统基因组学一直是研究LAB适应和进化的主要方法[4]

3.泛核基因组分析

LAB比较基因组学的共同主题包括鉴定LAB物种的泛基因组、核心基因组、辅助基因和独特基因。

泛基因组是一个物种的整套基因;核心基因组是所有菌株中存在的一组基因,通常由管家基因或基本生存所需的基因组成;附属基因是指样本中两个或两个以上物种共有的基因;而独特或特定的基因,有时被称为可变基因组或可有可无的基因组,是那些只存在于特定菌株中的基因[5]

辅助基因和不可缺少的基因组有助于物种多样性,并提供赋予在特定生态位生存的选择优势的功能特征。比较基因组学已被用于深入了解单或多生态位LAB的基因组特征。

ERGO是最早用于LAB比较基因组学分析的工具之一。ERGO是一个基因组分析和发现套件,旨在为基因组的比较分析和复杂的代谢和细胞重建的整合提供必要的工具。然而,最近比较基因组学的工具已经可以免费获得,并且设计用于更快速和高通量处理更大的数据集。这些工具包括使用BLAST评分比率进行比较基因组分析的高效数据库框架(EDGAR),泛基因组分析管道(PGAP) 和Roary,这些工具已广泛用于最近的LAB泛基因组研究[6]

表1.LAB比较基因组学和系统基因组学常用的生物信息学工具和数据库

工具/数据库

网址

作者

BLAST

https://blast.ncbi.nlm.nih.gov/Blast.cgi

Altschul et al. (1990)

Artemis Comparison Tool (ACT)

https://github.com/sanger-pathogens/Artemis

Rutherford et al. (2000)

MAFFT

https://maft.cbrc.jp/alignment/software/

Katoh and Standley (2013)

EDGAR

http://edgar.computational.bio/

Blom et al. (2009)

KEGG

https://www.kegg.jp/

Ogata et al. (1999)

TIGRFAMs

https://www.jcvi.org/research/tigrfams

Haft et al. (2003)

TMHMM

https://services.healthtech.dtu.dk/service.php?

TMHMM-2.0

Krogh et al. (2001)

MEGA

https://www.megasoftware.net/

Hall (2013)

RA×ML

https://github.com/stamatak/standard-RAxML

Stamatakis (2014)

4.新陈代谢

确定LAB的代谢能力,对于理解它们的适应和进化至关重要[1]。目前已经有许多研究使用工具和数据库来鉴定与LAB中的代谢活动以及代谢途径构建相关的基因和蛋白质。如Uniprot、TIGRFAMs、SignalP等[7]

5.LAB的适应与进化

在乳酸菌的主要属中,乳酸菌属成员的基因组特征差异很大,其基因组大小从1.23 Mb至4.91 Mb,GC含量为31.93% ~ 52.07% 。由于乳酸菌占据了各种生态位,宿主和环境施加压力,逐渐修改基因组,以至一些环境成为专门的栖息地[8]。生物信息学工具,特别是那些用于比较基因组学的工具,可以识别利基特异性或专门基因,以及系统基因组学工具,有助于我们理解乳杆菌物种的生活方式适应。

6.特定生态位的适应和专业化

6.1食品

德氏乳杆菌亚种保加利亚(L. bulgaricus)是乳酸菌经历生态位特化的最好例子之一。van de Guchte等人报道了保加利亚乳杆菌菌株ATCC11842的完整基因组,揭示了该物种在特化驱动下经历了广泛的还原进化的证据。结果表明[2],保加利亚乳杆菌基因组的GC含量(~ 49.7%)显著高于相关物种的GC含量,如嗜酸乳杆菌和约氏乳杆菌,两者的GC含量均为~ 34%。这种偏差主要与GC3的GC差异有关。相关性分析表明,嗜酸乳杆菌和约氏乳杆菌的GC3值与细菌总GC含量的相关性非常吻合,保加利亚乳杆菌的GC3值(65%)与预期值(54%)相差很大。由于第三密码子的进化速度普遍快于第一和第二密码子,因此我们假设保加利亚乳菌的基因组可能处于向更高GC含量进化的活跃阶段,或者保加利亚乳菌的GC3与总GC含量的相关性可能被改变或破坏。大量的假基因表明基因组处于基因消除和减少的活跃状态,大量的rRNA和tRNA基因支持,其基因组大小约1.8 Mb,比目前观察到的最高值高出20-30% 。保加利亚乳杆菌编码转录调控因子的基因数量较少,完全缺乏大量氨基酸生物合成酶,这反映了保加利亚乳杆菌对稳定和营养丰富的牛奶环境的适应。

6.2 GIT(胃肠道)

罗伊氏乳杆菌被确定为胃肠道的优势物种之一。罗伊氏乳杆菌也经历了宿主特化,在脊椎动物肠道共生体的进化策略研究中,它通常被用作模式生物[3]。利用AFLP和MLSA数据对6种不同宿主物种(人类、小鼠、大鼠、猪、鸡和火鸡)分离的L.reuteri乳杆菌进行系统发育分析,揭示了不同的单系进化枝反映宿主起源。罗伊氏乳杆菌100-23(啮齿动物品系)和罗伊氏乳杆菌F25(人类品系)的比较基因组学揭示了它们的基因组中存在宿主特异性基因。一个被认为有助于罗伊氏乳杆菌在啮齿动物前胃存活的脲酶基因簇是100-23菌株所特有的[4],而菌株F275具有在100-23中不存在的pdu -cbi-cob-hem簇,其提供钴胺素(维生素B12)生物合成、甘油利用、丙二醇发酵和L.reuteri的产生,被认为有助于人类肠道的定植、生存和健康。比较基因组学被广泛应用于了解从不同宿主分离的罗伊氏乳杆菌菌株的研究中。

7.生物信息学在潜在益生菌LAB初步筛选中的应用

乳酸菌作为发酵剂和益生菌在食品工业应用中受到高度关注。许多将LAB作为益生菌销售的生产商已经使用基因组分析来表征菌株,因为除了利用可用的基因组挖掘工具和数据库进行快速菌株表征之外,基因组学还有助于菌株挖掘和特定特性的快速选择[9]。由于益生菌特征和相关健康特性是菌株特异性的,并且不能针对整个属进行推广,使用生物信息学的基因组表征在潜在益生菌LAB菌株的初始筛选中发挥了至关重要的作用。益生菌潜力的这种筛选包括鉴定可能有助于菌株在高度挑战性和动态GIT中的适应性和提高存活率、菌株可向宿主提供的实际益处以及LAB菌株的质量和安全性的基因[10]。在LAB菌株的益生菌潜力的初始筛选中起作用的常用生物信息学工具和数据库见表2。

 

 

表2 常用生物信息学工具和数据库

基因

工具

Bacteriocin

BAGEL/BAGEL4

CRISPR-Cas system

CRISPRFinder

Restriction modification system

CRISPRdb

AMR genes

REBASE

Virulence factors

ARDB

ResFinder

CARD

VFDB

Mobile genetic elements

 

Genomic island

IslandViewer

Plasmid

Plasmidspades

PLSBD

Phage

PHAST

PHASTER

Insertion sequence

ISFinder

 

8.筛选参与胃肠道环境中生存的基因

对益生菌LAB的大多数研究最初以以下关于在GIT中存活和定殖的标准评估LAB菌株的益生菌潜力:抵抗低pH和高胆盐浓度的能力;具有抗微生物活性或抑制病原体生长的能力;和粘附上皮细胞和定殖肠道的能力。

胆汁和低pH抗性基因:除了胃中非常低的pH和肠中释放的高浓度胆汁盐之外,潜在益生菌LAB菌株克服在GIT中转运期间的恶劣条件并存活的能力是选择益生菌LAB的首要考虑因素[11]。用于注释的生物信息学工具,如RAST、Prokka和NCBI-PGAP,在初步筛选可能参与胁迫抗性的基因中非常有用。

乳酸菌的抗菌性能:已知LAB通过产生抗微生物剂来抑制病原体的生长,所述抗微生物剂包括有机酸、过氧化氢和细菌素。细菌素是由细菌产生的核糖体合成的抗微生物肽[12],近年来,这些抗微生物肽由于其作为抗生素的替代物的潜在用途而吸引了大量关注。

粘附和定殖基因:为了对宿主发挥其有益作用,益生菌LAB必须能够粘附并持续存在于肠道中。用于注释和比对的比较基因组学工具,例如分别为RAST和BLAST,以及用于蛋白质预测的工具,例如SignalP、TMHMM、LipoP和Pfam。

9.筛查可能对宿主提供直接健康益处的基因

FAO/WHO将益生菌定义为“当施用时赋予宿主健康益处的活微生物”。益生菌LAB已显示为宿主提供许多记录的健康益处,包括产生维生素(特别是B族维生素)、免疫调节、针对病原体的拮抗活性、抗肿瘤和抗癌潜力、缓解肠易激综合征(IBS)、对抗肥胖症、血清胆固醇降低、抗高氨血症等。基因组分析也已用于鉴定与这些功能相关的基因。

10.质量和安全

潜在的益生菌LAB能够持续存在并定植GIT,为宿主提供益处,所以需要考虑其质量和安全性。许多研究使用基因组学来评估潜在和商业益生菌的质量和安全性。全基因组分析是一种很有前途的益生菌安全性评估技术[13]。其中CRISPR-Cas系统、限制性修饰(RM)系统可以减少噬菌体入侵和外源DNA整合的发生率;而毒力因子(VF)、抗菌素耐药性(AMR)基因和毒性代谢物则是潜在的益生菌LAB中缺失的特征;对于可移动遗传元件(MGEs),如基因组岛、转座子、插入序列、质粒和噬菌体,它们可以调动抗菌素耐药性和毒力基因,以及有毒代谢物[14]。这些指标在表征潜在益生菌LAB的研究中经常被应用。

11.适应性进化

如前所述,筛选潜在的益生菌LAB,以寻找能使其在转运到GIT时抵御宿主施加的恶劣条件和压力而存活的基因。最近的研究表明,在益生菌向GIT转移的过程中,它们也经历了适应性进化,其中发生了从头突变(例如SNPs的获取),这些突变调节了相关基因(即碳利用基因、耐酸基因)的表达,并使它们能够适应宿主内具有挑战性的环境。通过BLAST工具、MEGA-X、KEGG和CAZy数据库可以对移动元件进行鉴定、系统发育分析和功能注释,从而判断益生菌作为短暂的微生物,对常驻或原生GIT群落的生态系统的影响,包括组成、功能、突变频率、酶的表达等[15]

12.生物信息学的优势、局限和挑战

通过生物信息学能对基因组编码信息库便捷访问和概述,提供生物体潜在代谢能力的详细信息,为生物疗法的菌株改良开辟操作或生物工程的可能性。在本文的研究中,比较基因组学和系统基因组学的生物信息学工具和数据库已被广泛使用,并已被证明有助于理解LAB在特定和/或多样化环境中的适应和最终进化,高效筛选潜在的益生菌LAB菌株,鉴定出与GIT存活有关的特定基因以及对宿主有益的基因,也促进了对益生菌LAB更详尽的安全性评估。然而生物信息学也有局限性和挑战。大多数生物信息学的相关技术需要熟悉Linux环境和编程语言,同时需要足够的资金来提供支持高通量分析的存储和内存要求的计算机,并依赖于高质量的组装来提供全面和可靠的信息[16]

综上所述,本文介绍了近年来在LAB基因组分析中常用的生物信息学工具和数据库。然而,这里介绍的工具和数据库只是用于基因组分析的大量生物信息学工具和数据库的一个子集。对于未涉及的其他特征仍需要通过传统实验进行研究。

参考文献

[1] UniProt: the universal protein knowledgebase in 2021[J]. Nucleic acids research, 2021, 49(D1): D480-D489.

[2] Carriço J A, Rossi M, Moran-Gilad J, et al. A primer on microbial bioinformatics for nonbioinformaticians[J]. Clinical Microbiology and Infection, 2018, 24(4): 342-349.

[3] Choi E A, Chang H C. Cholesterol-lowering effects of a putative probiotic strain Lactobacillus plantarum EM isolated from kimchi[J]. LWT-food Science and Technology, 2015, 62(1): 210-217.

[4] Chondrou P, Karapetsas A, Kiousi D E, et al. Lactobacillus paracasei K5 displays adhesion, anti-proliferative activity and apoptotic effects in human colon cancer cells[J]. Beneficial microbes, 2018, 9(6): 975-983.

[5] Cantarel BI, Coutinho PM, Rancurel C, Bernard T, Lombard V, Henrissat B. The Carbohydrate-Active EnZymes database (CAZy): An expert resource for glycogenomics. Nucleic Acids Research. 37: 233-238 (2009)

[6] Douillard FP, Ribbera A, Järvinen HM, Kant R, Pietilä TE, Randazzo C, Paulin L, Laine PK, Caggia C, von Ossowski I, Reunanen J, Satokari R, Salminen S, Palva A, de Vosa WM. Comparative genomic and functional analysis of Lactobacillus casei and Lactobacillus rhamnosus strains marketed as probiotics. Applied and Environmental Microbiology. 79:1923-1933 (2013)

[7] Haft DH, Selengut JD, White O. The TIGRFAMs database of protein families. Nucleic Acids Research. 31:371-373 (2003)

[8] Fitch WM. Distinguishing homologous from analogous proteins. Systematic Zoology. 19:99-113 (1970)

[9] Abdelhamid A G , El-Masry S S , El-Dougdoug N K .Probiotic Lactobacillus and Bifidobacterium strains possess safety characteristics, antiviral activities and host adherence factors revealed by genome mining[J].EPMA Journal, 2019, 10(4):337-350.

[10] Douillard F P , Ribbera A , Jarvinen H M ,et al.Comparative Genomic and Functional Analysis of Lactobacillus casei and Lactobacillus rhamnosus Strains Marketed as Probiotics[J].Applied & Environmental Microbiology, 2013, 79(6):1923-1933.

[11] Yoo D A , Bagon B B , Valeriano V D V ,et al.Complete genome analysis of Lactobacillus fermentum SK152 from kimchi reveals genes associated with its antimicrobial activity[J].FEMS Microbiology Letters, 2017.

[12]Johnson E M , Jung Y G , Jin Y Y ,et al.Bacteriocins as food preservatives: Challenges and emerging horizons[J].Critical Reviews in Food Science & Nutrition, 2017:1.

 [13] 杜娜,杜艳,刘曦,尧静,马俊超,李玉海,李焕芹,林云.全基因组测序对碳青霉烯类耐药肺炎克雷伯菌T361耐药及毒力基因的分析[J].微生物学免疫学进展, 2023, 51(02):53-59.

[14] Wang Y, Liang Q, Lu B, Shen H, Liu S, Shi Y, Leptihn S, Li H, Wei J, Liu Chengzhi, Xiao H, Zheng X, Liu Chao, Chen H. Whole genome analysis of probiotic product isolates reveals the presence of genes related to antimicrobial resistance, virulence factors, and toxic metabolites, posing potential health risks. BMC Genomics, 2021, 22:1–12.

[15] Derrien M, van Hylckama Vlieg JET. Fate, activity, and impact of ingested bacteria within the human gut microbiota. Trends in Microbiology, 2015, 23:354–366.

[16] 黄文辉,刘志文.生物信息学面临的挑战:计算基础设施、建模和分析[J].广州医药, 2002, 33(4):1-2.