news 2026/5/28 21:32:25

中医药AI突破:神农大模型训练数据与微调代码全开源

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
中医药AI突破:神农大模型训练数据与微调代码全开源

你还在为中医药大模型缺乏高质量训练数据而烦恼吗?还在为私有化部署中医AI助手成本高昂而却步吗?本文将全面解析华东师范大学开源的神农中医药大模型(ShenNong-TCM-LLM),带你零门槛掌握中医药AI模型的训练方法,从数据构建到本地部署全程开源可复现。

【免费下载链接】Awesome-Chinese-LLM整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。项目地址: https://gitcode.com/GitHub_Trending/aw/Awesome-Chinese-LLM

读完本文你将获得:

  • 2.6万条中医药专属指令数据集的获取与处理方法
  • 基于Chinese-Alpaca-Plus-7B底座的LoRA微调全流程
  • 消费级GPU实现中医辨证模型部署的优化技巧
  • 3个中医药AI应用场景的实战案例(含代码片段)

项目背景:中医药AI的开源突破

中医药作为中华传统文化的重要组成部分,其辨证施治的复杂性和知识的隐晦性一直是AI落地的难点。2023年6月,华东师范大学在Awesome-Chinese-LLM项目中正式开源神农中医药大模型,填补了中文医疗领域垂直模型的空白。该模型基于70亿参数的中文优化底座,通过11万条中医药指令数据微调,实现了从中药性味归经查询到方剂配伍推荐的全流程智能化。

图1:神农大模型在中文大模型生态中的技术定位,展示了基于不同底座的中文LLM分类体系

核心资源:从数据集到微调代码

1. 神农中医药指令数据集

神农团队构建的ShenNong_TCM_Dataset是目前最完整的中医药开源数据集之一,包含三大模块:

数据类型样本量核心内容应用场景
中药知识8,236性味归经、功效主治、现代研究中药咨询机器人
方剂配伍5,641君臣佐使、加减化裁、临床应用智能处方系统
辨证论治7,123四诊合参、证型判断、治则治法辅助诊断平台

该数据集特色在于采用实体中心的自指令方法(entity-centric self-instruct),基于中医药知识图谱自动生成高质量问答对。例如针对"黄芪"的指令设计:

{ "instruction": "请详细说明黄芪的性味归经及临床应用注意事项", "input": "", "output": "黄芪性味甘温,归脾、肺经。具有补气升阳、固表止汗、利水消肿...阴虚阳亢者忌用。" }

2. 微调实现方案

神农模型采用参数高效微调技术(LoRA),在消费级GPU上即可完成训练。核心配置如下:

  • 底座模型:Chinese-Alpaca-Plus-7B(已完成中文优化的LLaMA变体)
  • 微调参数:rank=16,lora_alpha=32,dropout=0.05
  • 训练环境:4×NVIDIA 3090 GPU(24GB显存)
  • 训练时长:10 epochs,约28小时

关键微调代码片段:

# 模型加载与配置 model = AutoModelForCausalLM.from_pretrained( "ziqingyang/chinese-alpaca-plus-7b", load_in_4bit=True, device_map="auto", quantization_config=BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_use_double_quant=True, bnb_4bit_quant_type="nf4", bnb_4bit_compute_dtype=torch.float16 ) ) # LoRA适配器设置 lora_config = LoraConfig( r=16, lora_alpha=32, target_modules=["q_proj", "v_proj"], lora_dropout=0.05, bias="none", task_type="CAUSAL_LM" )

本地部署:三步实现中医AI助手

环境准备

在Ubuntu 20.04系统下,推荐配置:

  • Python 3.8+
  • CUDA 11.7+
  • 至少10GB显存(量化版模型)

基础依赖安装:

pip install torch transformers peft accelerate bitsandbytes

模型获取与加载

通过Git获取完整项目:

git clone https://gitcode.com/GitHub_Trending/aw/Awesome-Chinese-LLM cd Awesome-Chinese-LLM

加载量化模型(4-bit精度):

from transformers import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained("./ShenNong-TCM-LLM") model = AutoModelForCausalLM.from_pretrained( "./ShenNong-TCM-LLM", load_in_4bit=True, device_map="auto" )

实战应用示例

场景1:中药查询
prompt = """以下是中医药咨询系统,请回答用户关于中药的问题。 用户问:当归与白芍在补血方面有何异同? 回答:""" inputs = tokenizer(prompt, return_tensors="pt").to("cuda") outputs = model.generate( **inputs, max_new_tokens=200, temperature=0.7, do_sample=True ) print(tokenizer.decode(outputs[0], skip_special_tokens=True))
场景2:方剂推荐
prompt = """根据患者症状推荐合适的方剂: 症状:面色苍白,头晕心悸,月经量少,舌淡苔白,脉细弱。 推荐方剂:""" # 模型输出将包含八珍汤的组成、用法及加减建议

行业价值与未来展望

神农大模型的开源释放了三大价值:

  1. 知识传承:将分散的中医药典籍转化为结构化AI知识
  2. 临床辅助:基层医疗机构可低成本部署中医AI助手
  3. 科研加速:为中药现代化研究提供数据挖掘工具

项目后续计划推出13B参数增强版,并融合VisualGLM-6B实现舌诊图像分析功能。正如医疗领域模型发展报告所指出,垂直领域小模型正成为AI普惠化的关键路径。

行动指南

  1. 点赞收藏本文,关注Awesome-Chinese-LLM项目更新
  2. 访问神农模型仓库获取完整资源
  3. 加入中医药AI开发者交流群(仓库README中有二维码)
  4. 下期预告:《基于神农模型的智能药房系统搭建》

提示:实际部署时建议配合医疗微调框架中的最佳实践,在数据集构建阶段引入专业中医师审核,确保模型输出的安全性与准确性。

【免费下载链接】Awesome-Chinese-LLM整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。项目地址: https://gitcode.com/GitHub_Trending/aw/Awesome-Chinese-LLM

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/28 1:11:58

Springboot优卖电商系统s7zmj(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。

系统程序文件列表 项目功能:用户,商品分类,商品信息 开题报告内容 一、选题背景与意义 (一)选题背景 随着互联网技术的飞速发展和消费者购物习惯的深刻变革,电子商务已成为推动全球经济增长的重要力量。然而,在激烈…

作者头像 李华
网站建设 2026/5/27 6:50:17

精通FreeRTOS与WolfSSL v5.6.4集成:嵌入式安全通信深度实战

精通FreeRTOS与WolfSSL v5.6.4集成:嵌入式安全通信深度实战 【免费下载链接】FreeRTOS Classic FreeRTOS distribution. Started as Git clone of FreeRTOS SourceForge SVN repo. Submodules the kernel. 项目地址: https://gitcode.com/GitHub_Trending/fr/Free…

作者头像 李华
网站建设 2026/5/26 21:46:43

在 SAP 里,“自动过账模板”并不是指“凭证模板”(那属于 FB70/FB50 的手动预制),而是指“系统根据业务事件,自动决定借贷科目、金额、税码、成本要素”的一套后台规则

在 SAP 里,“自动过账模板”并不是指“凭证模板”(那属于 FB70/FB50 的手动预制),而是指“系统根据业务事件,自动决定借贷科目、金额、税码、成本要素”的一套后台规则。 对平行分类账场景,我们只要在“自动…

作者头像 李华
网站建设 2026/5/22 2:30:47

Android应用离线架构深度解析:5大核心模块实现高可用数据同步

Android应用离线架构深度解析:5大核心模块实现高可用数据同步 【免费下载链接】PocketHub PocketHub Android App 项目地址: https://gitcode.com/gh_mirrors/po/PocketHub 在移动应用开发中,网络连接的不稳定性已成为影响用户体验的关键瓶颈。用…

作者头像 李华
网站建设 2026/5/24 11:31:30

8.4 阻抗重塑技术:有源阻尼、补偿器设计与控制器参数优化

8.4 阻抗重塑技术:有源阻尼、补偿器设计与控制器参数优化 在精准识别出系统负阻尼频段与潜在振荡源后,解决问题的核心在于对变流器的输出阻抗特性进行主动修改,即阻抗重塑。其目标是,在特定关注频段(尤其是原负阻尼频段)内,使变流器与电网的阻抗关系满足稳定性判据,并…

作者头像 李华
网站建设 2026/5/27 20:47:48

3分钟零代码部署:构建企业级实时数据监控告警系统

3分钟零代码部署:构建企业级实时数据监控告警系统 【免费下载链接】gperftools Main gperftools repository 项目地址: https://gitcode.com/gh_mirrors/gp/gperftools 你是否正在为海量业务数据无法实时监控而焦虑?是否因系统异常发现太晚导致业…

作者头像 李华