MedGemma 1.5提示工程：医疗领域Prompt设计指南-开发者社区

MedGemma 1.5提示工程：医疗领域Prompt设计指南

最近，谷歌开源的医疗多模态大模型MedGemma 1.5吸引了不少开发者的目光。这个40亿参数的模型，不仅能看懂CT、MRI这些复杂的医学影像，还能理解病历、化验单等文本信息，甚至能听懂医生的专业口述。

但很多朋友在实际使用时发现，直接问“这张CT有什么问题？”或者“分析一下这个化验单”，得到的结果往往不尽如人意。要么回答太笼统，要么干脆跑偏了。这其实不是模型能力不行，而是我们提问的方式不对。

医疗领域的AI应用，对精确度的要求极高。一个模糊的提问，很可能导致一个不准确的回答。今天，我就结合自己这段时间的摸索，跟大家聊聊怎么给MedGemma 1.5设计高效的提示词，让它真正成为你的得力助手。

1. 理解MedGemma 1.5的“语言习惯”

在开始设计提示词之前，我们得先了解这个模型的“脾气”。MedGemma 1.5虽然强大，但它本质上还是个需要明确指令的AI。

1.1 模型的能力边界

从官方资料和实际测试来看，MedGemma 1.5主要擅长以下几个方面：

医学影像分析：包括CT、MRI、X光、病理切片等，能识别异常、定位病灶、对比历史影像。
医学文本理解：能处理病历记录、化验报告、病理描述等非结构化文本。
多模态推理：可以结合图像和文字信息进行综合判断，比如“根据这张CT和患者的病史，最可能的诊断是什么？”
结构化信息提取：能从大段的文字中提取关键数据，比如化验单里的数值、单位、检测项目。

但它也有明显的局限：

不是临床诊断工具：官方明确说明，它不能直接用于临床诊断或治疗建议。
需要具体上下文：问得越模糊，回答越可能不准确。
对专业术语敏感：用对专业词汇，它能理解得更准确。

1.2 基础Prompt结构

一个好的医疗Prompt通常包含几个关键部分：

[角色定义] + [任务描述] + [输入信息] + [输出要求] + [约束条件]

举个例子，一个糟糕的提问是：“看看这个片子。”而一个好的提问应该是：“你是一位经验丰富的放射科医生。请分析这张胸部CT平扫图像，重点描述肺野、纵隔、胸膜有无异常发现。如果发现结节，请描述其位置、大小、密度特征。请用专业的放射科报告格式回答。”

看出区别了吗？后者给了模型明确的角色、具体的任务、关注的部位、输出的格式要求。这样的Prompt，模型才知道你到底想要什么。

2. 不同医疗场景的Prompt设计技巧

医疗场景千差万别，不同的任务需要不同的提问策略。下面我分几个常见场景，给大家一些具体的例子。

2.1 医学影像分析场景

这是MedGemma 1.5的强项，但也是最容易用不好的地方。

通用模板：

你是一位专业的[放射科/病理科/超声科]医生。 请分析这张[影像类型]图像。 请重点关注以下方面：[具体部位或特征列表]。 如果发现异常，请描述：[异常特征要求]。 请按照[报告格式]的格式给出分析结果。

实际案例：胸部X光分析

# 这是一个实际可用的Prompt示例 prompt = """ 你是一位资深放射科医生。 请分析这张后前位胸部X光片（PA view）。 请按顺序评估以下结构： 1. 胸廓对称性与骨骼 2. 肺野透亮度、纹理、有无实变或结节 3. 肺门大小、形态 4. 纵隔轮廓、心影大小 5. 膈肌位置、形态 6. 胸膜腔有无积液、气胸 如果发现异常，请： - 明确描述异常的位置（如：右上肺野、左心缘旁） - 描述异常的特征（大小、密度、边界、形态） - 给出可能的鉴别诊断（不超过3个） 请用标准的放射科报告格式回答，包括：检查技术、影像表现、印象/建议。 """

关键技巧：

指定视图：明确是“后前位（PA）”还是“前后位（AP）”，这对判断心脏大小很重要。
结构化观察：按解剖顺序列出要观察的部位，避免遗漏。
异常描述标准化：要求模型用“位置+特征”的方式描述异常。
输出格式化：要求特定的报告格式，方便后续处理。

2.2 病历文本分析与问答

MedGemma 1.5在医学文本理解上也有不错的表现，特别是新版在EHR问答上准确率提升了22%。

通用模板：

你是一位临床医生，正在查阅患者的电子病历。 以下是患者的[病史/检查结果/治疗记录]：[粘贴文本]。 请根据以上信息：[具体任务]。 请重点考虑：[相关临床要点]。 请用[输出格式]回答。

实际案例：化验单解读

prompt = """ 你是一位内科医生。 以下是患者张三的血液化验结果： 【血常规】 白细胞计数：12.5×10⁹/L（参考值：3.5-9.5） 中性粒细胞百分比：85%（参考值：40-75） 淋巴细胞百分比：10%（参考值：20-50） 血红蛋白：110 g/L（参考值：115-150） 血小板计数：280×10⁹/L（参考值：125-350） 【生化】 C反应蛋白：45 mg/L（参考值：0-8） 降钙素原：0.5 ng/mL（参考值：<0.5） 请分析： 1. 有哪些异常指标？异常的程度如何？ 2. 这些异常组合可能提示什么临床情况？ 3. 建议下一步进行哪些检查或关注哪些方面？ 请用简洁的临床分析语言回答，避免过度解读。 """

关键技巧：

提供完整上下文：尽量给出相关的所有信息，而不是孤立的一个指标。
要求量化描述：让模型说明“轻度升高”、“显著升高”等程度。
引导临床思维：要求模型从异常指标推导到临床可能性。
设置安全边界：明确“避免过度解读”，防止模型给出超出其能力的诊断建议。

2.3 多模态综合推理

这是MedGemma 1.5最强大的能力之一——同时理解图像和文本，做出综合判断。

通用模板：

你是一位[专科]医生。 患者情况：[简要病史、症状、体征]。 相关影像：[影像描述或上传影像]。 实验室检查：[关键检查结果]。 请综合以上所有信息： 1. 影像的主要发现是什么？ 2. 这些发现如何与患者的临床表现相关联？ 3. 最可能的诊断是什么？还需要排除哪些情况？ 4. 建议的下一步处理方案是什么？ 请分点回答，区分哪些是基于影像的客观发现，哪些是综合推理。

实际案例：腹痛患者的CT评估

prompt = """ 你是一位急诊科医生。 患者李四，45岁男性，因“突发右上腹疼痛8小时”就诊。 疼痛为持续性绞痛，向右肩背部放射，伴恶心、呕吐。 查体：Murphy征阳性，体温38.2℃。 实验室检查：白细胞15×10⁹/L，中性粒细胞88%，血淀粉酶正常。 以下是患者的腹部CT平扫图像（已上传）。 请综合评估： 1. CT图像上胆囊、胆总管、肝脏、胰腺有何异常表现？ 2. 这些影像发现是否支持急性胆囊炎的诊断？ 3. 还需要考虑哪些鉴别诊断？（如：胆总管结石、胰腺炎等） 4. 基于当前信息，建议的紧急处理措施是什么？ 请明确区分：影像客观描述、临床推理分析、处理建议。 """

关键技巧：

信息整合：明确要求模型“综合”所有可用信息。
区分事实与推理：让模型说明哪些是影像上的客观发现，哪些是基于临床的推理。
考虑鉴别诊断：要求列出其他可能性，避免过早下结论。
关联处理建议：让推理自然地导向下一步该做什么。

3. 高级Prompt工程技巧

掌握了基础场景后，我们来看看一些能进一步提升效果的高级技巧。

3.1 思维链（Chain-of-Thought）提示

对于复杂的临床推理，让模型“展示思考过程”往往能得到更可靠的结果。

示例：

你是一位呼吸科医生，正在分析一位咳嗽、发热患者的胸部CT。 请按以下步骤思考： 第一步：系统观察CT图像，描述肺野、间质、胸膜、纵隔的异常表现。 第二步：将这些影像发现与患者的临床症状（咳嗽、发热）相关联。 第三步：基于影像和临床，列出可能的诊断，按可能性排序。 第四步：说明每个诊断的支持点和反对点。 第五步：建议最有价值的下一步检查以明确诊断。 请按照这个思考过程，逐步给出你的分析。

这种方法的好处是：

提高透明度：你能看到模型的推理路径，而不是只有一个结论。
更容易纠错：如果某一步推理有问题，你能及时发现。
更符合临床思维：医生在实际工作中也是按步骤思考的。

3.2 少样本学习（Few-Shot）提示

对于一些标准化报告或特定格式的输出，给模型几个例子能显著提升效果。

示例：病理报告生成

你是一位病理科医生，需要根据组织病理学图像生成标准化报告。 请参考以下报告格式： 【例子1】 标本类型：肺穿刺活检 镜下描述：镜下见肿瘤细胞呈巢状、腺管状排列，细胞异型性明显，核分裂象易见。肿瘤侵犯胸膜。间质纤维组织增生，伴淋巴细胞浸润。 免疫组化：TTF-1(+), Napsin A(+), CK7(+), P40(-), P63(-), Ki-67(约40%+) 病理诊断：肺腺癌 备注：建议完善基因检测 【例子2】 标本类型：胃镜活检 镜下描述：黏膜层见中等大小淋巴细胞弥漫浸润，细胞核不规则，可见核分裂。腺体减少，部分破坏。 免疫组化：CD20(+), CD3(-), CD5(-), CD10(-), BCL-2(+), BCL-6(+), MUM1(+), Ki-67(约70%+) 病理诊断：弥漫大B细胞淋巴瘤 备注：建议完善分期检查 现在请分析新的病理图像（已上传），按照上述格式生成报告。

关键点：

例子要典型：选择有代表性的、格式规范的例子。
例子数量适中：2-3个通常就够了，太多反而可能干扰。
明确对应关系：让模型知道该学习例子的哪些方面。

3.3 约束性提示

医疗场景中，我们经常需要限制模型的输出范围，确保安全性和相关性。

示例：

你是一位辅助医生工作的AI助手。 请根据提供的病历资料回答问题。 重要约束： 1. 只基于提供的信息回答，不添加外部知识 2. 不给出明确的诊断结论，只描述客观发现和可能性 3. 不使用“确诊”、“必须”、“一定”等绝对性词语 4. 所有建议必须标注“建议咨询主治医生确认” 5. 如果信息不足，明确说明需要补充什么信息 患者信息：[...] 问题：[...]

这种约束特别重要，因为：

控制风险：避免模型给出可能有害的医疗建议。
明确界限：让模型知道什么是它可以做的，什么是不能做的。
提高实用性：输出更符合实际工作流程。

4. 实际应用中的常见问题与解决

在实际使用MedGemma 1.5的过程中，我遇到了一些典型问题，这里分享给大家。

4.1 问题：模型回答太笼统

症状：问“CT有什么问题？”，回答“肺部可见异常密度影”，但没有具体描述。

解决方案：

具体化观察要求：明确列出要观察的解剖结构。
要求量化描述：如“描述结节的大小（精确到毫米）、密度（磨玻璃/实性/混合）、边界（清晰/模糊）”。
提供描述框架：如“请按照位置、大小、形态、密度、边界的顺序描述”。

4.2 问题：模型过度解读

症状：根据一点非特异性发现，就给出具体的疾病诊断。

解决方案：

明确角色限制：如“你是一位放射科医生，只描述影像发现，不做最终诊断”。
要求列出可能性：如“请列出3个最可能的鉴别诊断，并说明支持点”。
添加安全声明：如“以下分析仅供参考，最终诊断需结合临床”。

4.3 问题：忽略关键临床信息

症状：只看影像，不考虑患者的年龄、症状、病史。

解决方案：

强制综合评估：在Prompt中明确要求“结合患者年龄和症状分析”。
提供临床背景：即使模型可能不会主动用，也要提供完整的临床信息。
设置思考步骤：用思维链提示，其中一步专门是“关联临床信息”。

4.4 问题：输出格式混乱

症状：有时是段落，有时是列表，不利于后续处理。

解决方案：

严格指定格式：如“请用Markdown表格形式呈现”。
提供格式示例：直接给一个输出样式的例子。
分部分要求：如“第一部分用描述性文字，第二部分用要点列表”。

5. 结合MedASR的语音输入优化

MedGemma 1.5还有个搭档——MedASR语音识别模型。它的医疗术语识别错误率比通用模型低很多。结合使用时，Prompt设计也要相应调整。

5.1 语音转文本后的Prompt处理

医生口述的内容通常比较口语化，直接喂给MedGemma可能效果不好。

优化策略：

你是一位医疗文书助手。 以下是医生口述的病程记录（已通过MedASR转换）： [口述文本] 请完成以下任务： 1. 将口语化表达转为规范的医疗文书语言 2. 补充可能的缺失信息（用[]标注） 3. 结构化组织内容（主诉、现病史、查体、辅助检查、初步诊断） 4. 纠正明显的术语错误 请输出整理后的文书草稿。

5.2 语音直接触发分析

更流畅的流程是：医生口述→MedASR转文本→自动生成分析Prompt→MedGemma分析。

示例流程：

# 模拟一个完整流程 doctor_speech = "患者右下腹压痛反跳痛明显，体温38.5，白细胞一万八，考虑阑尾炎可能" # MedASR转换后 transcribed_text = "患者右下腹压痛、反跳痛明显，体温38.5℃，白细胞18×10⁹/L，考虑阑尾炎可能" # 自动构建的Prompt prompt = f""" 急诊外科场景。 医生口述摘要：{transcribed_text} 请协助： 1. 根据描述，最可能的诊断是什么？还需要排除哪些急腹症？ 2. 建议的紧急检查有哪些？（如：腹部超声、CT） 3. 如果需要手术，术前需要完善哪些准备？ 4. 给出一个急诊病历的草稿模板，包含已提供的信息和需要补充的部分。 注意：患者具体信息需进一步核实。 """

这种集成让医生的工作流更自然——边说边获得AI的辅助。

6. 实践建议与安全考量

在医疗领域使用AI，效果重要，安全更重要。最后给大家一些实践建议。

6.1 始终记住：辅助而非替代

无论MedGemma 1.5表现多好，它始终是一个辅助工具：

验证所有输出：重要的医疗决策必须由人类医生复核。
保持人类主导：AI提供信息和分析，人类做最终判断。
明确责任边界：清楚什么是AI能做的，什么是必须人类做的。

6.2 建立自己的Prompt库

医疗工作有很多重复性任务，建立分类Prompt库能大大提高效率：

建议分类：

影像报告类：各部位CT、MRI、X光的标准报告Prompt
病历整理类：门诊病历、入院记录、手术记录的整理Prompt
检验分析类：血常规、生化、凝血等常见检验的分析Prompt
鉴别诊断类：常见症状的鉴别诊断思维Prompt
患者教育类：疾病解释、用药指导的通俗化Prompt

6.3 持续迭代优化

Prompt工程不是一次性的：

记录效果：哪些Prompt效果好，哪些不好，为什么？
收集反馈：实际使用者（医生）的反馈最宝贵。
定期更新：随着对模型理解的深入，不断优化Prompt。
场景化调整：不同科室、不同医院可能有不同的习惯，需要调整。

6.4 隐私与合规

医疗数据敏感，使用时务必注意：

数据脱敏：去除所有个人标识信息。
本地化部署：MedGemma 1.5支持本地部署，适合对数据安全要求高的场景。
合规使用：遵守相关的医疗数据使用规定。
知情同意：如果用于实际工作，确保符合伦理要求。

整体用下来，MedGemma 1.5在医疗领域的表现确实让人印象深刻，但它的效果很大程度上取决于我们怎么“问”。好的Prompt就像和一位专家同事沟通——问题问得清楚具体，得到的回答才有价值。

医疗AI还在快速发展，Prompt工程是我们用好这些工具的关键技能。希望今天的分享能帮你更快上手MedGemma 1.5。在实际工作中，建议从小场景开始尝试，慢慢积累经验。记住，最重要的不是追求最复杂的Prompt，而是找到最适合你工作流程的方式。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

MedGemma 1.5提示工程：医疗领域Prompt设计指南