news 2026/5/27 0:54:55

Mapis:首个基于知识图谱与大模型的多囊卵巢综合征国际指南多智能体框架,重塑PCOS循证诊断

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Mapis:首个基于知识图谱与大模型的多囊卵巢综合征国际指南多智能体框架,重塑PCOS循证诊断

文章摘要

本文提出了Mapis,首个专为多囊卵巢综合征(PCOS)诊断设计的、基于知识图谱的多智能体框架。该框架将2023年国际指南转化为结构化协作流程,通过专职智能体模拟临床诊断,并构建PCOS知识图谱确保决策的循证性。实验证明,其准确性显著超越传统机器学习、单智能体及现有医疗多智能体系统 。

阅读原文或https://t.zsxq.com/OloOV获取原文pdf和自制中文ppt

正文
一、 引言:多囊卵巢综合征(PCOS)的诊断困境与技术需求

多囊卵巢综合征(Polycystic Ovary Syndrome, PCOS)是一个严峻的公共卫生问题,影响着全球约10%的育龄女性,因此开发有效的诊断工具至关重要 。PCOS的临床表现具有高度异质性,涵盖内分泌、生殖、心脏代谢、皮肤和心理等多个方面 。其症状谱系广泛,包括焦虑抑郁等心理问题,多毛、痤疮等皮肤体征,月经不规律、不孕等生殖功能障碍,以及胰岛素抵抗、2型糖尿病等代谢合并症 。尽管影响广泛,但仍有相当比例的患者未得到明确诊断 .

目前,临床诊断主要遵循“鹿特丹标准”,要求在严格排除其他病因的前提下,满足以下三项核心特征中的至少两项:

  1. 临床或生化高雄激素血症(hyperandrogenism)

  2. 月经周期不规律

  3. 卵巢多囊样形态(polycystic ovarian morphology, PCOM)

然而,尽管有明确的诊断标准,PCOS的诊断和管理在临床实践中依旧错综复杂。诊断标准的具体操作困难、显著的临床异质性、超重、种族差异以及个体在不同生命周期的变化都增加了诊断的复杂性 。这些因素导致了诊断、临床表现和治疗路径的巨大差异,进而引发诊断延迟、不良的诊断体验以及全球女性患者对医疗服务的普遍不满 。因此,当前临床实践中存在的高认知负荷和内在异质性凸显了对先进诊断工具的迫切需求,以协助临床医生提供精确、一致且遵循指南的医疗服务 .

二、 现有技术的局限性:为何我们需要新范式?

在PCOS的智能检测领域,以往的研究主要集中在深度学习和机器学习方法上 . 然而,这些方法存在固有的局限性:

  • 数据依赖性

    :它们依赖大规模、高质量的标注数据进行训练,这在医疗领域往往难以获取 .

  • 可解释性缺失

    :模型通常是“黑箱”,主要关注统计模式而非临床因果推理,其决策过程不透明,难以满足医疗实践对循证决策的严格要求 .

  • 处理非结构化数据的挑战

    :在没有大量手动特征工程的情况下,这些模型难以处理非结构化的临床叙述文本 .

近年来,大语言模型(LLMs)和一些多智能体框架在更广泛的医疗领域展现了其在通用诊断任务中强大的协作推理能力 . 但对于PCOS这一特定疾病,它们的潜力仍未被充分挖掘。现有的医疗多智能体系统大多是为通用医疗任务设计的,缺乏针对PCOS的深度领域整合和特异性知识 . 对于像PCOS这样依赖指南驱动诊断的疾病,精确遵循如鹿特丹共识等标准至关重要,而通用系统在这方面表现不足 .

此外,在临床任务中部署LLMs面临着“模型幻觉”的重大挑战——即模型可能生成不符合事实的虚假信息。由于目前缺乏一个PCOS专属的知识图谱来将生成式推理锚定在权威事实上,这一风险被进一步放大 .

三、 Mapis框架横空出世:首个基于指南的PCOS诊断多智能体系统

为了应对上述挑战,来自深圳技术大学、深圳大学、深圳市人民医院等机构的研究者们提出了一个名为**Mapis(Multi-Agent PCOS Intelligent Detection System)**的创新框架 . 这是首个明确为基于指南的PCOS诊断而设计、并由知识图谱提供支持的多智能体框架 .

Mapis的核心思想是严格依据《2023年国际多囊卵巢综合征评估与管理循证指南》,通过多智能体协作来明确模拟临床诊断的工作流程 . 它将复杂的诊断任务解耦,分配给不同的专职智能体 . 这种设计不仅解决了诊断过程的复杂性,也有效应对了医疗数据稀缺的挑战 .

四、 核心架构:多智能体协作与知识图谱的深度融合

Mapis框架集成了五个协同工作的模块,整合为两个核心流程:知识构建诊断执行.

图1:该图展示了Mapis的整体架构。左侧是“知识构建”流程,显示了如何从国际指南、专家共识等输入中,通过语义分块、实体提取、关系提取等步骤(均由LLM辅助)构建一个分层的PCOS知识图谱。右侧是“诊断执行”流程,从电子健康记录(EHR)输入开始,经过预处理,进入一个由协调员智能体主导的三步评估和排除模块,最终生成报告。知识图谱贯穿于诊断执行过程中,为智能体提供事实依据 .

1. 诊断流程(Diagnostic Execution)
Mapis的诊断流程通过专职智能体协作,精确复现了临床指南的步骤:

  • 数据预处理模块(Data Preprocessing)

    :将原始的电子健康记录(EHRs)转换为结构化格式,便于后续处理 .

  • 三步评估模块(Three-Step Assessment)

    :这是架构的核心,由一个**协调员智能体(Coordinator Agent)**负责总指挥 .

    • 第一步和第二步

      :协调员智能体调度**妇科内分泌智能体(Gynecological Endocrine Agent)**来验证月经周期不规律和高雄激素血症两大标准 .

    • 第三步

      :协调员智能体调度**放射科智能体(Radiology Agent)**来评估卵巢多囊样形态(PCOM) .

  • 排除模块(Exclusion Module)

    :在完成上述纳入标准的评估后,一个**排除智能体(Exclusion Agent)**会严格执行强制性的排除阶段,以排除可能导致相似症状的其他疾病(如甲状腺功能异常、高催乳素血症等),这是确保诊断准确性的关键一步 .

  • 报告生成模块(Report Generation)

    :最后,该模块综合所有智能体的发现,生成一份透明、详尽的临床报告。这一过程实现了可靠的、零样本(zero-shot)的诊断推理,不依赖于大规模的训练数据 .

2. 知识基础(Knowledge Construction)
为了确保决策的可靠性和循证性,Mapis构建了首个PCOS领域的专属知识图谱 .

  • 知识来源

    :该知识图谱综合了权威的临床指南,如2023年国际指南 .

  • 构建过程

    :通过大语言模型(LLM)辅助进行语义分块、实体提取和关系提取,将非结构化的指南文本转化为结构化的知识库 .

  • 核心作用

    :这个结构化的知识库作为一个确定性的外部记忆,为智能体的推理提供支持。它通过将智能体的响应锚定在精确、有据可查的医学事实上,有效缓解了模型的幻觉问题,确保了诊断的准确性和可验证性 .

五、 卓越的实验性能与验证

为了验证Mapis框架的有效性,研究团队在公开基准数据集和专门的私有临床数据集上进行了广泛的评估,并与九个不同类型的基线方法进行了对比 .

实验结果表明,Mapis的性能显著优于所有竞争方法。特别是在处理真实世界临床数据集时,其优势尤为突出:

  • 相较于传统的机器学习模型,Mapis在**准确率(Accuracy)**上提升了13.56%.

  • 相较于基于单个大语言模型的智能体,准确率提升了6.55%.

  • 相较于以往的通用医疗多智能体系统,准确率提升了7.05%.

这些数据有力地证明了Mapis所采用的基于指南的临床推理框架的有效性和优越性 .

六、 核心贡献与未来展望

该研究的主要贡献可以概括为三点:

  1. 首创性

    :提出了第一个专为PCOS诊断设计的、基于指南的多智能体框架,有效解决了诊断复杂性和数据稀缺的双重挑战 .

  2. 知识赋能

    :构建了首个PCOS领域的知识图谱,作为确定性的外部记忆,通过将智能体决策锚定于循证医学事实,显著降低了模型幻觉的风险 .

  3. 性能卓越

    :在公开和私有数据集上的大量实验证明,Mapis显著优于各类基线模型,验证了其框架的有效性 .

更重要的是,Mapis提供了一个可扩展、可迁移的范式。通过构建针对特定疾病诊断流程的专职多智能体系统,该框架有望被推广到其他依赖临床指南进行诊断的疾病(如高血压、糖尿病等),从而推动实现更有效和标准化的智能诊断 . 对于寻求在精准医疗和AI诊断领域进行前沿布局的科研院所和投资机构而言,Mapis所展示的技术路径和应用潜力无疑具有重要的参考价值。


标签

#MultiAgentSystems #PCOS #多智能体 #知识图谱 #大语言模型 #医疗AI

欢迎加入「知识图谱增强大模型产学研」知识星球,获取最新产学研相关"知识图谱+大模型"相关论文、政府企业落地案例、避坑指南、电子书、文章等,行业重点是医疗护理、医药大健康、工业能源制造领域,也会跟踪AI4S科学研究相关内容,以及Palantir、OpenAI、微软、Writer、Glean、OpenEvidence等相关公司进展。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/20 13:48:43

lora-scripts在边缘设备上的轻量化部署可行性分析

LoRA-Scripts 在边缘设备上的轻量化部署可行性分析 在当前 AI 模型日益“重型化”的趋势下,像 Stable Diffusion、LLaMA 这类大模型虽然能力强大,但其庞大的参数量和极高的算力需求,使得它们难以直接运行于消费级 GPU 或嵌入式设备。这不仅限…

作者头像 李华
网站建设 2026/5/26 7:27:26

PyTorch CUDA适配问题排查:确保lora-scripts正常运行的基础条件

PyTorch CUDA适配问题排查:确保lora-scripts正常运行的基础条件 在部署 LoRA 微调脚本时,你是否遇到过这样的场景?明明拥有 RTX 3090 或 4090 这类高性能显卡,训练启动后却发现 GPU 利用率为 0%,日志中赫然写着 Using …

作者头像 李华
网站建设 2026/5/12 5:53:59

计算机毕业设计springboot足球队管理系统 SpringBoot驱动的足球俱乐部综合运营平台 基于SpringBoot的业余球队数字化管理平台

计算机毕业设计springboot足球队管理系统7208eu53(配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。当草根球队也开始追求职业级效率,一套能把“人、货、赛、训”全部搬…

作者头像 李华
网站建设 2026/5/25 19:13:59

C++26标准重大更新(std::execution on函数深度解析)

第一章:C26 std::execution on 函数概述C26 引入了 std::execution::on 作为执行策略的扩展机制,旨在将执行上下文与算法解耦,使并发和并行操作更加灵活。该函数允许开发者在调用标准库算法时,显式指定执行器(executor…

作者头像 李华
网站建设 2026/5/25 12:51:23

C++26 prioritized任务调度:3个你必须掌握的实时系统编程技巧

第一章:C26 prioritized任务调度的核心演进C26 引入了对并发执行模型的深度增强,其中最引人注目的特性之一是 **prioritized任务调度**(Prioritized Task Scheduling)机制。该机制允许开发者为异步任务显式指定优先级,…

作者头像 李华
网站建设 2026/5/16 1:24:06

Session和Cookie有什么区别

Session和Cookie是 Web 开发中管理用户状态的核心技术,二者配合实现 “保持用户登录、记录操作信息” 等功能,但本质是两种不同的机制,核心区别可以从「存储位置、安全性、生命周期」等维度拆解:一、最核心区别:存储位…

作者头像 李华