关于多项技术在分子领域的应用-526互联

王鑫炫：

该文章介绍了一种基于R/Shiny的交互式生物学Web应用程序的开发方法和该方法的基本原理和实现细节，并提供了几个示例应用程序来演示该方法的功能和效果。该文章认为该方法可以帮助生物学家和研究人员更好地理解和分析生物学数据，并提供更好的数据可视化和交互性。

生物学数据的分析和可视化是生物学研究中非常重要的一部分。随着生物学数据的不断增加和复杂性的增加，需要更好的工具和方法来帮助生物学家和研究人员更好地理解和分析这些数据。交互式Web应用程序是一种非常有用的工具，可以帮助生物学家和研究人员更好地理解和分析生物学数据，并提供更好的数据可视化和交互性。

该方法的核心是使用R语言和Shiny框架来开发Web应用程序。R语言是一种流行的统计分析语言，具有强大的数据处理和可视化功能。Shiny框架是一个基于R语言的Web应用程序开发框架，可以帮助开发人员快速构建交互式Web应用程序。使用这两个工具，开发人员可以轻松地将R代码转换为Web应用程序，并添加交互性和可视化功能。

在该方法中，开发人员首先需要编写R代码来处理和分析生物学数据。然后，使用Shiny框架将R代码转换为Web应用程序。Shiny框架提供了许多有用的功能和组件，例如输入框、滑块、下拉菜单、图表和表格等，可以帮助开发人员构建交互式Web应用程序。开发人员还可以使用HTML、CSS和JavaScript等Web技术来自定义Web应用程序的外观和行为。

该文提供了几个示例应用程序，以演示该方法的功能和效果。这些应用程序包括基因表达分析、基因网络分析、基因组浏览器和生物信息学工具箱等。这些应用程序都具有良好的交互性和可视化功能，可以帮助生物学家和研究人员更好地理解和分析生物学数据。

例如，基因表达分析应用程序可以帮助生物学家和研究人员分析基因表达数据，并生成交互式图表和表格，该应用程序可以帮助用户比较不同基因的表达水平，并探索基因表达与生物学过程之间的关系；基因网络分析应用程序可以帮助生物学家和研究人员分析基因网络数据，并生成交互式网络图，该应用程序还可以帮助用户探索基因之间的相互作用和调控关系；基因组浏览器应用程序可以帮助生物学家和研究人员浏览和分析基因组数据，并生成交互式基因组图，该应用程序可以帮助用户比较不同物种的基因组，并探索基因组结构和功能之间的关系。生物信息学工具箱应用程序可以帮助生物学家和研究人员使用各种生物信息学工具来分析和处理生物学数据，并生成交互式结果。

该方法的优点在于它可以帮助生物学家和研究人员更好地理解和分析生物学数据，并提供更好的数据可视化和交互性。此外，该方法还具有灵活性和可扩展性，可以根据需要添加新的功能和模块。最重要的是，该方法是基于开源工具和技术的，因此可以免费使用和共享。

简而言之，本文介绍了一种基于R/Shiny的交互式生物学Web应用程序的开发方法。该方法可以帮助生物学家和研究人员更好地理解和分析生物学数据，并提供更好的数据可视化和交互性。该方法具有灵活性和可扩展性，并且是基于开源工具和技术的，因此可以免费使用和共享。这种方法的成功开发将为生物学研究和应用提供有力的支持，有望在未来的生物学研究和应用中发挥重要作用。

参考文献

Lihua Jia and others, Development of interactive biological web applications with R/Shiny, Briefings in Bioinformatics, Volume 23, Issue 1, January 2022, bbab415, https://doi.org/10.1093/bib/bbab415

徐俊辰：

这篇文章使用R编程语言，研究了抑郁和压力两种疾病的特定基因。在发现某些共同基因后，创建了蛋白质-蛋白质相互作用网络（PPI）、拓扑特征、基因-miRNA相互作用、蛋白质-药物相互作用和TF-基因相互作用。建模包括为挖掘数据选择适当的数据集、方法、变量和格式化技术。在推荐一种药物用于治疗目的之前，必须了解受疾病影响的基因。目前的研究使用基因间作图来揭示检测到的疾病之间的生物学关系。代表了基因之间和相关基因之间的蛋白质之间的连接。PPI网络在生物信息学研究中起着至关重要的作用。PPI网络是使用Cytoscape创建的，它定义了两个或多个蛋白质之间的连接，并且这些相互作用由生物化学、疏水和静电因素促进。PPI网络提供了大量关于蛋白质功能的新信息。蛋白质-蛋白质相互作用网络（PPI）代表了基因之间和相关基因之间的蛋白质之间的相互联系。PPI网络在生物信息学研究中起着至关重要的作用。研究人员可以使用NetworkAnalyst 3.0对基因表达谱进行频繁和复杂的概念分析。

然后使用PPI网络研究APP、ESR 1、TP 53、CTNNB 1、SIRT 1、AR、ABL 1、HSPA 4、AKT 1和CREB 1的前10个共同基因。使用前十个枢纽基因，创建了这两种疾病之间不同类型的相互作用。PPI网络的拓扑性质进行了研究，以了解生物过程，他们发现了集群系数，介数，度，邻居的数量和其他变量之间的相关性。PPI网络、拓扑性质、PDI网络、基因miRNA相互作用、TF-基因相互作用和共表达都有助于所选两种疾病的药物发现。拓扑特性由PPI网络分析程序cytoscape创建，以识别彼此连接的疾病相关基因。使用cytoscape，从PPI网络中找到主要相互连接的前10个枢纽基因。这十大基因是真正负责这两种疾病。使用GeneMANIA建立基因的共表达和物理相互作用。PPI网络、拓扑性质、基因调控网络、蛋白质-药物相互作用和负责该方案的基因之间的物理相互作用确保了类似的治疗设计。这项研究可能有助于我们的了解PDI，但进一步的系统生物学和生物信息学的研究将是必要的。未来研究的目标是为已经确定的两种疾病开发一种仿制药。这项研究可能为药物开发提供有用的信息。

参考文献

Basar, M. A., Hosen, M. F., Kumar Paul, B., Hasan, M. R., Shamim, S. M., & Bhuyian, T. (2023). Identification of drug and protein-protein interaction network among stress and depression: A bioinformatics approach. Informatics in Medicine Unlocked, 37. https://doi.org/10.1016/j.imu.2023.101174.

徐凯：

PAR-CLIP是一种用于研究RNA结合蛋白与RNA相互作用的实验技术。它结合了化学交联和免疫沉淀等方法，可用于鉴定RNA分子与特定蛋白质之间的相互作用位点。PAR-CLIP数据通常由高通量测序生成，并需要开发适当的计算模型来解释和分析这些数据。"BayMAP" 提出了一种贝叶斯分层模型，旨在解决PAR-CLIP数据的分析问题。该模型考虑了PAR-CLIP数据的特点，如测序深度、测序错误和RNA结合位点的富集程度，并通过引入先验知识和模型参数进行推断。通过使用贝叶斯方法，研究人员可以获得更准确的RNA结合位点的鉴定和定量结果。光活化核糖苷增强交联和免疫沉淀（PAR-CLIP）是一种检测蛋白质与mRNA相互作用位点的生化方法。该方法在测序的cDNA中引入T-to-C取代，有助于检测mRNA上的结合位点。然而，T-to-C替换也可能由于其他原因（如不匹配或SNP）而发生。只有很少的统计程序可用于检测PAR-CLIP数据中的结合位点。这些方法中的大多数不考虑PAR-CLIP诱导的替代以外的其他类型的替换，因此，还将具有高T-to-C替换率的位置（例如SNP）报告为结合位点。此外，这些程序都不允许包括与microRNA结合位点生物学相关的额外信息，例如mRNA区域的类型。

他们开发了BayMAP，这是一个基于完全贝叶斯分层模型的过程，它考虑了其他替换来源。此外，该模型能够将其他信息纳入PAR-CLIP数据的分析中。这种结合不仅可以更好地检测结合位点，还可以更好地了解结合位点的数据和生物学。在模拟PAR-CLIP数据的应用中，BayMAP比现有方法更好地区分结合位点和噪声。此外，它还可以很好地估计附加信息的影响。我们在这里展示了BayMAP对真实数据集的可用性，即使存在嘈杂的数据。提出了BayMAP，这是一个三组分混合模型，用于检测PAR-CLIP数据中实验诱导的T-to-C取代位置，该模型在完全贝叶斯分层框架中设计，其中考虑了不匹配替代概率与SNP之间的依赖关系。据我们所知，BayMAP是第一种能够包含可能与结合位点的概率相关的替代位置的附加先验信息的方法。在仿真研究中，BayMAP对真实替代概率和回归参数的估计几乎没有偏差。此外，BayMAP在预测T-to-C取代是否在实验中引起的准确性方面优于wavClusteR和BMix。BayMAP的优势尤其在于区分噪声和结合位置，这在真实的PAR-CLIP数据中似乎更具挑战性和更重要。即使在数据集中没有潜在的额外变量，BayMAP的性能仍然比其他方法好。在实验Ago PAR-CLIP数据集的应用中，BayMAP检测到的实验诱导的T-to-C替换位置比wavClusteR和Bmix少，但与wavClusteR和Bmix相比，估计的假阳性率非常小(不同数据集的假阳性率在2.4%到8.9%之间)。此外，BayMAP确定的参数估计似乎是合理的。在BayMAP的所有应用中并没有发现3'UTR的影响。当数据有噪声时，由probit模型建模的附加信息显得尤为重要。此外，模拟研究表明，BayMAP能够识别出重要的其他变量，如果它们对实验诱导位置的检测有影响。我们进一步表明，BayMAP的应用导致与规范和保守的TargetScan位点有更高的重叠。除了考虑编码不同类型mRNA区域的二进制变量外，BayMAP还允许将其他可能影响实验诱导位置的先验概率的其他因素纳入模型。这些额外变量的例子是相对于mRNA丰度或位点附近的局部au丰富含量的PAR-CLIP reads的数量。在PAR-CLIP数据中，BayMAP区分了实验诱导的T-to-C取代位置和非实验诱导的T-to-C取代位置。利用BayMAP提供的结果，结合位点可以通过包含这些T-to-C取代位置的reads序列比对(Golumbeanu et al, 2015)或通过任意定义的周围核苷酸来获得。也可以使用峰值查找算法，例如使用小波变换(Sievers等，2012)或覆盖函数的排序差异(Comoglio等，2015)。对于BayMAP分析，使用后者。在BayMAP中，以及在wavClusteR和BMix中，替换位置被认为是相互独立的。这个假设并不成立，因为在一个结合位点上可能有不止一个T-to-C取代位置。可以将这些相邻依赖项直接包含到模型中，以帮助识别结合位点，而不是使用现有的算法来规范结合位点。BayMAP设置的完全贝叶斯环境不仅允许检测mRNA上的结合位点区域，而且还允许扩展模型并将BayMAP纳入直接目标预测的模型中。

参考文献

Huessler, E. M., Schafer, M., Schwender, H., & Landgraf, P. (2019). BayMAP: a Bayesian hierarchical model for the analysis of PAR-CLIP data. Bioinformatics, 35(12), 1992-2000. https://doi.org/10.1093/bioinformatics/bty904.

徐虎：

蛋白质是大型生物分子，在生物体内执行基本功能，包括运输分子、响应刺激、为细胞提供结构以及催化代谢反应。蛋白质包含通过肽键连接的一条或多条氨基酸残基长链。在自然环境中，蛋白质通常自发折叠成特定的三级结构，其中每个原子在分子的三维空间中占据独特的位置。驱动蛋白质折叠成其天然结构的主要因素是许多非共价残基间相互作用，包括疏水效应、氢键、范德华力和离子键。

蛋白质结构的准确预测在很大程度上依赖于对蛋白质折叠过程以及蛋白质序列与天然结构之间关系的深刻理解。

蛋白质的天然结构是蛋白质吸收最低自由能的状态，几乎所有残基都与当地的结构环境完美契合，想要实现蛋白质结构的预测，大多数现有方法通过有效利用序列-结构关系和同源蛋白携带的进化信息来实现结构预测。目前的方法可以分为基于模板的建模（TBM），前者需要模板蛋白，即具有解析结构的蛋白质，后者不依赖于任何模板（从头建模方法）。TBM方法可进一步分为同调建模和线程方法。

同源建模方法的基本原理是，在进化过程中，蛋白质结构比序列更保守，同源蛋白，尤其是紧密同源蛋白，通常具有相似的结构;因此，我们可以通过参考目标蛋白的同源结构来构建其结构。识别靶蛋白同源性的广泛使用的策略是“序列-序列”比对。如果两种蛋白质的序列比对显示出足够高的序列相似性，则它们将被视为同源蛋白。

线程方法：与寻求与目标蛋白具有显着高度相似性的模板的同源建模技术不同，线程方法旨在找到具有相同结构折叠的蛋白质。因此，线程方法的核心步骤是计算目标蛋白质序列与模板结构的兼容性，这依赖于“序列-结构”比对，而不是同源建模方法执行的“序列-序列”比对。

从头预测方法：大多数从头预测方法都基于第一原理，该原理指出，在自然环境中，蛋白质倾向于采用自由能最低的结构构象。因此，结构预测可以通过最小化能量函数或直接模拟折叠过程来完成。为从头方法设计精确的能量函数是一项具有挑战性的任务。大多数广泛使用的能量功能都是手工制作的，因此需要设计师的大量专业知识。例如，使用由140多个能量项组成的全原子能量函数来描述蛋白质结构的各个方面，并且大多数罗塞塔能量项都是基于知识的。除了手工制作的能量函数外，另一种方法是应用机器学习技术来设计能量项或找到能量项的最佳权重。

参考文献：

Bin Huang, L. K., Chao Wang, Fusong Ju, Qi Zhang, Jianwei Zhu,, & Tiansu Gong, H. Z., Chungong Yu, Wei-Mou Zheng, Dongbo Bu. (2022). Protein Structure Prediction: Challenges, Advances, and the Shift of Research Paradigms. https://doi.org/10.1016/j.gpb.2022.11.014.