news 2026/2/6 5:31:51

【文献分享】MedMPT一种用于多种临床呼吸系统疾病应用的视觉语言预训练转换器

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【文献分享】MedMPT一种用于多种临床呼吸系统疾病应用的视觉语言预训练转换器


文章目录

    • 介绍
    • 代码
    • 参考

介绍

通用人工智能模型在应用于临床实践中的多种模态和复杂临床任务时面临独特的挑战。在此,我们介绍了 MedMPT,这是一个面向临床、专为呼吸系统医疗保健设计的多功能预训练模型,基于 154,274 对胸部计算机断层扫描图像和放射学报告进行训练。MedMPT 采用自监督学习来获取医学见解,能够处理多模态临床数据,并支持与临床工作流程相契合的各种临床任务。我们在涉及常见医学模态(如计算机断层扫描图像、放射学报告、实验室检测和药物关系图)的广泛胸部相关病理状况上评估了 MedMPT 的性能。MedMPT 在医疗领域的多模态预训练模型中始终表现卓越,在各种临床任务中取得了显著进步。深入分析表明,MedMPT 能够有效利用医学数据的潜力,展现出数据和参数效率,并为决策提供可解释的见解。MedMPT 突显了多模态预训练模型在临床实践通用人工智能领域的潜力。

肺部疾病,包括影响胸部的多种病理状况,如慢性阻塞性肺疾病、下呼吸道感染和肺癌等,是全球范围内导致疾病和死亡的主要原因。及时诊断和管理对于提高医疗服务质量和患者预后至关重要。先前的研究表明,人工智能(AI)有可能推进肺部疾病的诊断和管理,例如通过基于胸部计算机断层扫描(CT)图像的肺癌筛查以及生成胸部 X 光片的放射学报告,从而提高医疗保健的有效性和效率。从临床角度来看,肺部疾病的诊断和管理存在诸多复杂性,这源于这些疾病的多样性以及所涉及的复杂医疗保健系统,需要综合考虑多种因素(如病史、体格检查、影像学和实验室检查),并需要多学科协作,包括呼吸科医生、放射科医生和肿瘤科医生。然而,目前能够全面分析多种模态、准确提供医疗见解以辅助决策,并在统一框架内广泛支持临床工作流程中各类任务的人工智能研究十分有限,这导致现有模型在实际应用中的可靠性差,临床转化面临诸多挑战。因此,克服这些局限性,开发一种与临床工作流程相契合的通用模型以改善肺部疾病患者的治疗效果并提高医疗系统的效率至关重要。
近期,诸如 ChatGPT4 和 SAM5 等大型预训练模型取得了显著进展,展现出令人瞩目的通用性和灵活性,突显了通用型人工智能模型的重要性。通过从海量数据中学习通用知识,这些预训练模型能够有效且高效地适应各种下游任务,无需为每个特定任务收集和标注大量数据。预训练人工智能模型的这些优势对医疗领域颇具吸引力,为缓解大量标注需求带来的挑战以及满足医疗保健领域对增强通用性的需求提供了解决方案。
然而,现实世界中临床工作流程的复杂程度超出了预期,因为所涉及的数据类型以及临床实践中的任务种类要丰富得多,这使得现有的预训练人工智能模型在医学领域的潜力尚未得到充分挖掘。大多数现有的医学预训练模型都是对通用领域预训练模型的改编,这些模型经过了医学数据的微调。这些模型主要关注涉及图像数据9、10、11或文本数据8、12、14的任务。相比之下,医学数据本身涵盖了多种模态15,例如 CT 图像、医学文本、电子记录、实验室检测、基因组学和药物相互作用关系。在临床实践中,专家们会综合各种模态的信息,全面评估患者的临床状况并执行复杂的临床任务。因此,整合多种异构模态对于全面、深入的医疗分析至关重要。现有医学模型与现实世界临床工作流程之间的另一个差距在于它们所支持的下游任务类型。现有的预训练模型主要关注临床工作流程中孤立部分的任务,例如通用病变分割 9,10、多种疾病诊断 11 或回答通用医疗问题 8。然而,在现实世界的临床工作流程中,所涉及的任务要多样得多、连续且连贯,涵盖从患者入院到出院的各个阶段。例如,在疑似肺癌患者的临床工作流程中,临床医生通常会安排 CT 成像和生化检查,放射科医生会解读 CT 图像并提供报告。这使得临床医生能够根据检查结果全面评估患者的病情,并给出初步诊断和医疗建议,可能包括开药或建议进一步的检查,如穿刺活检或手术 16。因此,我们认为,目前的大多数工作主要集中在数据和技术驱动的验证任务上,未能涵盖整个临床工作流程,也未能满足真正的临床需求。现有医学预训练模型在支持的模态和任务方面存在局限性,这凸显了开发更有效、实用且与临床紧密结合的人工智能模型的必要性,这些模型能够分析多种医学数据模态,并支持广泛的临床任务。

代码

https://github.com/maliangdi/MedMPT

参考

  • A vision–language pretrained transformer for versatile clinical respiratory disease applications
  • https://github.com/maliangdi/MedMPT
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/30 12:09:00

法律大模型实战指南:LLM智能体如何破解法律AI三大难题

本文全面综述法律领域LLM智能体技术,分析其如何通过规划、记忆和工具调用能力解决独立模型面临的幻觉、信息滞后及可验证性不足等挑战。文章系统梳理技术转型路径,构建法律智能体应用分类体系,探讨专门评估方法,并识别开放性挑战&…

作者头像 李华
网站建设 2026/2/5 7:09:28

基于GPU加速的大数据OLAP查询优化实践

基于GPU加速的大数据OLAP查询优化实践:从原理到落地的全流程指南 一、引言:当OLAP遇到“速度瓶颈”——你经历过吗? 1.1 一个真实的痛点:大促后的“查询焦虑症” 去年双11大促结束后,我在电商公司的分析师朋友小张遇到…

作者头像 李华
网站建设 2026/2/5 18:28:12

一文搞懂大模型剪枝

一、什么是大模型剪枝? 通俗来讲,大模型剪枝就是识别并移除模型中“没用”或“用处极小”的部分,这些被移除的部分就是模型的“冗余成分”。 我们可以把大模型想象成一个精密的工厂,里面有无数条生产线(对应模型的层、…

作者头像 李华
网站建设 2026/1/30 9:35:31

深度测评研究生必用8款一键生成论文工具

深度测评研究生必用8款一键生成论文工具 2026年研究生论文写作工具测评:精准匹配学术需求的高效助手 在当前学术研究日益精细化、智能化的背景下,研究生群体对论文写作工具的需求也愈发多元化。从选题构思到文献综述,从内容生成到格式排版&am…

作者头像 李华