ChatGPT在生物医学领域的应用

发布时间 2023-06-07 16:30:16作者: 22020080136杨欢

ChatGPT在生物医学领域的应用

组长:杨欢           组员:陈海月、徐琼、邾蓉烨

摘要:目前,人工智能在生物医学领域的应用已经取得了令人瞩目的进展,ChatGPT作为一种基于人工智能的聊天机器人模型,因其具有强大的自然语言处理和生成能力,在生物医学领域有着广泛的应用潜力。在本研究中探索了ChatGPT在生物医学领域的三个分支中的应用潜力,包括医疗设备、生物信息学、医学成像,并提出了一个迭代模型——OPTICAL模型,将该模型应用于不同生物信息学背景中来证明其可行性。通过对ChatGPT进行微调来指导其生成用于分析生物信息学数据的代码,从而帮助解析基因数据等,为生物医学领域提供了新的解决方案和机遇。

关键词:生物医学、ChatGPT、迭代模型

 

1 引言

        近年来,生物医学领域的新技术,特别是基因组学和蛋白质组学、机器人辅助手术、虚拟现实和增强现实等备受关注。生物医学研究和临床实践中产生的大量数据对于提高医疗质量、加速科学研究和推动个性化医疗至关重要。然而,这些数据的规模和复杂性使得其分析和解释变得愈发困难。在此背景下,人工智能技术为生物医学领域提供了新的解决方案和机遇,它可以为学生和研究人员提供交互式学习、辅导和数据分析支持,为他们在生物医学领域的学习中提供一个有益的工具。近日,由OpenAI公司开发的人工智能聊天机器人ChatGPT,因其强大的自然语言生成和理解能力而备受关注[1]。ChatGPT作为一种基于深度学习的聊天机器人模型,通过对大量文本数据的学习和理解,能够理解并回答用户的问题并生成自然流畅的语言表达,为学生、研究人员和临床医生提供了一个与机器智能交互的平台,在生物医学领域具有较大的应用潜力。

本文总结了ChatGPT在生物医学领域的应用情况,考虑到该领域范围广泛,因此在本研究中将问题限制在生物医学领域的以下分支,即医疗设备、生物信息学、医学成像领域,同时研究也提出了一个迭代模型,以处理生物信息学数据为例,对ChatGPT进行微调来指导其生成用于生物信息学数据分析任务的代码,通过将该模型应用于不同生物信息学背景来证明该模型的可行性。此外,本文还讨论了ChatGPT的局限性,并提出了进一步研究的方向,以更好地将ChatGPT应用于生物医学领域的教学实践中。

 

2 应用潜力

        作为一种非常先进的人工智能语言模型,ChatGPT具有应用于医疗设备、医学成像、生物信息学等各个方面的潜力(图1)。

 

图1  ChatGPT在生物医学领域中的潜在应用

2.1 ChatGPT在医疗设备中的潜在应用

        在医疗设备方面,Cheng 等[1]在文章中提到ChatGPT有可能通过协助设计、开发和优化医疗设备的各个方面来彻底改变医疗设备行业。ChatGPT可分析大量医学文献和专利,以确定新医疗器械的新兴趋势、技术和潜在机会,从而帮助医疗设备制造商产生新颖的想法和设计,也可以通过提供有关标准、文件要求和提交流程的指导,帮助他们驾驭复杂的法规环境。ChatGPT 也可以协助运行复杂的仿真,以评估医疗设备的安全性和可靠性。此外,ChatGPT通过处理大型数据集,可以深入了解潜在的故障模式、性能瓶颈和优化机会。同时也可以分析上市后数据,例如不良事件报告和客户反馈,以确定潜在的安全问题和需要改进的地方,从而不断改进医疗器械,保障患者安全。

2.2 ChatGPT在生物信息学中的潜在应用

        在生物信息学方面,ChatGPT能够处理和理解大量复杂的数据。通过利用其自然语言处理和机器学习能力,可应用于广泛的生物信息学任务,包括基因组学、蛋白质组学和其他相关领域。ChatGPT不仅可根据未知基因的序列和结构特征对其功能进行预测,通过分析大规模基因组数据中的模型和关系,确定未知基因的功能,也可通过从蛋白质的氨基酸序列中预测蛋白质的三维结构。同时ChatGPT也可用于创建交互式教育工具和资源,帮助复杂生物信息学概念的教学和学习,其自然语言处理能力还可以帮助开发更高效的生物数据库查询系统。此外,ChatGPT也可帮助研究人员研究影响基因表达的遗传和环境因素之间的复杂相互作用,通过分析大规模的表观遗传学数据,得到的模型可帮助识别各种疾病之间的关联[1]

2.3 ChatGPT 在医学成像中的潜在应用

        在医学成像方面,ChatGPT的存在便于图像分析与解读,可以通过使用其自然语言处理能力来理解图像中的特征和结构,从而分析和解释医学图像,有助于更准确、更快速地识别异常、疾病或损伤,从而减轻放射科医生和其他医疗专业人员的负担。此外,ChatGPT可用于开发更先进的算法,从通过医学成像技术获得的原始数据中重建高质量图像,这可以提高图像质量和分辨率,从而更好地观察和了解活生物体的内部结构和功能。也可通过利用ChatGPT的模式识别能力,更准确地识别和分割医学图像中的异常,如肿瘤或病变,这将有助于各种疾病的早期诊断和治疗计划。

        将ChatGPT纳入计算机辅助诊断系统可提高其准确性和效率,使其能够更好地支持医疗专业人员的决策过程,导致更准确的诊断和更有效的治疗计划。同时可用于根据患者的理解程度生成清晰、简明的医学成像结果报告,有助于改善患者沟通和对其护理的总体满意度[1]。Hu等[2]在简化放射学报告的数据集上对 ChatGPT 进行了微调,并与放射科医生进行调查以评估生成报告的可读性和准确性。调查结果表明,大多数放射科医生认为生成的报告准确且易于阅读,证实了ChatGPT可提高患者对放射学报告的理解的可行性。同样,Lyu[3]等通过收集2月上半月62次低剂量胸部 CT 肺癌筛查扫描和76次脑部MRI转移筛查扫描的放射学报告,以评估使用 ChatGPT将放射学报告翻译成通俗易懂的语言以改善医疗保健的有效性。研究结果显示, ChatGPT可以将放射学报告翻译成通俗易懂的语言,并且在使用详细提示得情况下可使翻译质量从55.2% 提高到77.2%,信息完全省略、部分翻译和误解的部分分别降低到 9.2%、13.6% 和 0%,表明使用详细提示可显着提高整体翻译质量,但这仍需要进一步研究以解决使用ChatGPT时需要详细提示的限制,同时也需注意在医疗保健环境中使用人工智能存在的相关潜在风险。

 

3 ChatGPT模型

        模型用于促进聊天机器人辅助科学数据分析,受教育中自适应学习的启发[4] ,Shue等[5]介绍了 OPTICAL(通过迭代指导和评估优化提示)模型,以利用 ChatGPT 协助生物信息学中的数据分析。OPTICAL模型通过迭代步骤促进聊天机器人辅助数据分析,以改善与聊天机器人的沟通,更好地调整数据分析预期,并提高学生的学习成果。此模型是一种基于ChatGPT的优化提示方法,旨在改进ChatGPT在教育和学习领域的应用效果。学生需提前了解科学问题、分析任务、计算方法和预期结果,之后将学习如何用简单明了的语言描述数据分析任务。然后学生将提示输入 ChatGPT 以生成并执行代码。如果运行代码后出现报错,学生会评估错误消息并确定最佳的解决方法,例如指示 ChatGPT 修改代码或手动调试代码,重复此过程,直至代码不再报错。在此过程中,通过优化输入提示,OPTICAL模型可引导ChatGPT生成更准确、相关和有用的回答,使ChatGPT的生成结果更加符合教育目标和需求,同时在不断修改的过程中也可逐渐提高学生的学习效果和理解能力[5-6]

3.1 模型应用案例分析

        作为一个先进的人工智能(AI)系统,聊天机器人的行为在很大程度上依赖于人工操作者提供的提示。为了充分利用这种潜力来辅助科学数据分析,用于指导聊天机器人的提示必须经过精心设计,以确保聊天机器人的响应有效。以下是Shue等[5]将OPTICAL模型应用于不同生物信息学背景的案例分析。

3.1.1 下一代测序分析中的短测序读数比对和可视化检查

        比对是深度测序数据分析中确定测序读段的基因组位置的基本步骤。在此案例研究中,主要对Encyclopedia of DNA Elements生成的染色质免疫沉淀测序数据集的质量进行可视化检查[7]。通过指示ChatGPT生成代码将短读数与人类参考基因组进行比对,然后将比对结果加载到Integrative Genomics Viewer中进行可视化评估[8]。最初的提示包括分析和生物信息学工具的详细信息。交互过程中进行了两次迭代,指导聊天机器人处理从运行代码中生成的错误消息。此研究通过分析最终的代码并反思整个交互过程确定了初始提示中遗漏的细节。3.1.2分子进化中DNA序列的系统发育推断

        为演示 ChatGPT 如何帮助学生进行系统发育分析,可要求聊天机器人生成 R 代码来为物种构建系统发育树。此案例研究从 TP53 肿瘤抑制基因的蛋白质编码序列的多重比对开始,最初的提示包括对构建无根树的主要步骤的描述。通过两轮迭代和人们对运行代码的错误消息的反馈,聊天机器人编写了可行的代码来生成合理的无根系统发育树。然后,指示聊天机器人使用指定的物种作为外群来定根。对于这个复杂的任务,聊天机器人未能找到有效的解决方案并开始编写不存在的功能。在这种情况下,经过多次失败的迭代后需要人工干预来更正代码。

3.1.3 适合计算机视觉的鲁棒圆圈

        在计算机视觉中,圆形是最简单的几何对象之一,用于训练计算机进行识别。但指导计算机进行圆形拟合是一个复杂的任务,需要高级的数学知识和熟练的计算机编程技巧。同时对学生而言,将一个复杂问题分解为更容易处理的子问题仍是一个挑战。与前面的案例研究相反,这个案例说明了一个场景,在这个场景中用一个提示描述所有的分析无法生成可操作的代码。研究表明ChatGPT可作为虚拟助教,教授学生分而治之的方法,通过思维链提示,学生可逐渐学习如何解决圆形拟合问题[5-6]。该案例的结果是一种复杂的圆形拟合算法,无法通过简单的迭代获得,但可以通过设计思维链提示来实现[9]

作为概念证明,研究证明了OPTICAL模型在下一代测序分析、分子进化和计算机视觉三个生物信息学案例研究中的有效性,显示了其简化迭代过程和增强学生批判性思维的巨大潜力。

3.2 实际考虑

        一个好的提示应该能够在不同的聊天会话中产生一致的结果,我们刚开始使用ChatGPT时可以使用自然语言与聊天机器人交流。当进入后期时,可在提示中包含代码以确保聊天机器人按照正确的轨道进行交互。有时候同样的提示在新的会话中可能会生成不同的代码,我们应该注意这些不确定性,并采取措施来控制其对学习的干扰。这些不确定性也为我们培养批判性思维和创造性思维提供了良好的机会。例如,通过将新生成的代码与参考代码进行比较,我们可以学习到改进生物信息学技能的其他解决方案。此外,由于提示中的模糊性可能引发不确定性,这也为通过迭代来进一步完善和改进提供了机会。

        此外,为使迭代过程更加顺畅,我们应该清楚定义聊天机器人对提示的响应方式,熟练掌握指定的编程语言,以最少的代码行数输出代码。聊天机器人辅助训练的一个重点是学习如何阅读和理解代码,但仅仅把聊天机器人当作代码生成工具可能会限制创造性思维的发展,因此,在每个会话结束时,重要的不仅是优化提示,还要仔细检查生成的代码[10]。在这个阶段,关注的重点是熟悉代码,并找出初始提示中可能缺失的细节。另外,在平时使用ChatGPT的过程中观察到ChatGPT有时会产生错误的函数、错误使用某些选项,甚至伪造软件包的作者名称,我们应该用批判性思维看待聊天机器人产生的结果,可采用运行代码来检测错误,或者查看相关编程手册进行交叉参考[5]

 

4 局限性

        目前,ChatGPT尚未广泛应用于生物医学领域。在医学成像方面,医学图像分析需要图像处理和临床领域的专业知识,而像 ChatGPT 这样的通用语言模型可能无法完全捕获这些知识,同时医学影像数据集通常高度不平衡,可能包含敏感的患者信息,需要仔细处理和预处理。此外,像 ChatGPT 这样的语言模型的性能高度依赖于训练数据的质量和数量,出于监管和伦理方面的考虑,在医学成像中获得这些数据可能具有挑战性[2]。ChatGPT在生物信息学领域的研究也存在一定的限制,如当人为干预较少时,即时优化迭代可能无法有效收敛以产生有效的解决方案。另外,对于可以将问题分解为类似原始问题的较小子问题的情况,迭代模型可能不适用,将OPTICAL模型扩展到创新的生物信息学研究仍有待进一步探索。

 

5 结论

        ChatGPT在各个领域中的兴起为生物医学领域提供了新的解决方案和机遇,在医疗设备方面,ChatGPT的存在可以使医疗设备在设计、开发和优化等各个方面产生彻底的变革;在医学成像领域,使用ChatGPT可以根据患者的理解程度生成清晰、简明的医学成像结果报告,改善与患者之间的沟通交流状况;在生物信息学领域,通过使用ChatGPT作为虚拟教学助手,可以向学生教授生物信息学技能和解决问题的方法。然而,ChatGPT在生物医学领域的应用也面临一些挑战,比如ChatGPT响应可能存在不准确或错误的情况等。因此,未来将会对ChatGPT进行进一步的研究和发展,以推动人工智能在生物医学领域的应用,确保其解决生物医学问题的有效性和可持续性。

 

参考文献

[1] Cheng K, Guo Q, He Y, et al. Exploring the potential of GPT-4 in biomedical engineering: the dawn of a new era[J]. Annals of biomedical engineering,2023 : 1-9.

[2] Hu M, Pan S, Li Y, et al. Advancing medical imaging with language models: a journey from n-grams to ChatGPT[J]. arXiv preprint arXiv:2304.04920, 2023.

[3] Lyu Q, Tan J, Zapadka M E, et al. Translating radiology reports into plain language using chatgpt and gpt-4 with prompt learning: Promising results, limitations, and potential[J]. arXiv preprint arXiv:2303.09038, 2023.

[4] Durlach P J, Lesgold A M, A adaptive technologies for training and education[M]. Cambridge University Press, 2012.

[5] Shue E, Liu L, Li B X, et al. Empowering beginners in bioinformatics with ChatGPT[J]. bioRxiv, 2023: 2023.03. 07.531414.

[6] Xu D. ChatGPT opens a new door for bioinformatics[J].Quantitative Biology,2023.

[7] Consortium, E P. An integrated encyclopedia of DNA elements in the human genome. Nature,2012, 489, 57-74

[8] Thorvaldsdóttir H, Robinson J T, Mesirov J P. Integrative Genomics Viewer (IGV): high-performance genomics data visualization and exploration[J]. Briefings in bioinformatics, 2013, 14(2): 178-192.

[9] Wei J, Wang X, Schuurmans D, et al. Chain of thought prompting elicits reasoning in large language models[J]. arXiv preprint arXiv:2201.11903, 2022.

[10] Lubiana T, Lopes R, Medeiros P, et al. Ten Quick Tips for Harnessing the Power of ChatGPT/GPT-4 in Computational Biology[J]. arXiv preprint arXiv:2303.16429, 2023.