基于 Dify 实现 RAG、Agent “大模型应用落地”是目前企业落地 AI 场景最简单也是必须的路径,我分两篇文章,从“原理->Dify 部署->模型私有化部署->Agent 搭建案例” 完整演示一下实操过程,本文为第二篇。
3.1 应用(App):对话工作流机器人
这里会通过Dify构建一个简单的对话工作流机器人
选择对话工作流
编写提示词:这里设计一个有特色的,便于显著看出实现效果。
你是一个小猫机器人助手,你会解答用户的问题,然后在每一句话结束的时候喵喵叫一下
点击预览,开始测试
测试成功后发布更新
3.2 智能体(Agent):北京旅行助手
🎯****概述
智能助手(Agent Assistant),利用大语言模型的推理能力,能够自主对复杂的人类任务进行目标规划、任务拆解、工具调用、过程迭代,并在没有人类干预的情况下完成任务。
- 准备工作
本例中 Dify 将会调用外部 duckduckgo API,需确保 dify 所在服务器可以⽆障碍访问国际互联网
- 应用搭建
在本节我们将实现⼀个旅游规划助理的 agent 应用,它可以根据用户输入的旅行目的地、旅行天数、预算等信息输出结构化的旅行计划。
3.2.1 创建一个空白的Agent应用
3.2.2 添加提示词
提示词太长,方便看我截图了,需要完整文本提示词的,可以“本公众号对话框加回复消息“旅行顾问提示词”免费领取”
这里的提示词
3.2.3 在功能中添加对话开场白和内容审查等功能
{{name}}先生、女士,我是您的个性化旅行助理,你是否已经准备好开始一段充满冒险和放松的旅程了?让我们一起打造您难忘的旅行体验吧!请告诉我您的旅行目的、预算和行程天数,比如:您能帮我计划一次家庭旅行吗?我们计划去北京10天,预算一万人民币您能帮我计划一次情侣蜜月旅行吗?我们计划去北京5天,预算七千人民币内容审查设置
提问被拦截演示
3.2.4 完整测试
3.3 知识库(RAG)
3.3.1 源数据格式
通过使用Dify,可以方便快捷地构建私有知识库。可以将知识库放在工作流中,协同多种工具一起使用。而且Dify提供的知识库功能有着简洁的可视化界面,可以很方便地进行管理,适用于个人和团队。
目前Dify支持多种源数据格式,包括:
- 长文本内容:TXT、Markdown、DOCX、HTML、JSON、 PDF
- 结构化数据:CSV、Excel
注:私有知识库要达到良好的效果,必须与embedding模型和reranker模型相结合,请在xinterface中启用相关模型并引入Dify。
3.3.2 构建私有知识库
- 步骤1:首先创建一个新的知识库
- 步骤2:上传知识库文件
这里准备的是一部刑法的txt格式文本,用自然段的形式划分了每一条法则
- 步骤3:分段设置
大语言模型存在有限的上下文窗口,通常需要将整段文本进行分段处理后,将与用户问题关联度最高的几个段落召回,即分段 top-K 召回模式。此外,在用户问题与文本分段进行语义匹配时,合适的分段大小将有助于匹配关联性最高的文本内容,减少信息噪音。
分段标识符:
如果是\n则是以换行为一个分段;如果是\n\n则是以一个段落为一个分段。点击预览块查看目前块划分的情况。
分段重叠长度:
一般是分段最大长度的10%-20%。
知识库文档里如果有url、邮箱,还可以把这些过滤掉。
- 步骤4:选择索引方式
这里自动选择高质量。高质量的准确性更高,但是token消耗也会增加。我们这里使用的是部署到本地的模型,所以没有影响。
还有Q&A方式。如果文档是问答方式,那选择这种方式是最契合的。
- 步骤5:检索设置
在这里可以选择Embedding模型和Rerank模型,也可以设置Top K,也就是选出最相似的前n条。选择Score阈值,即筛选文本的相似度阈值。
🎯****拓展
关于**全文检索、向量检索HNSW、混合检索** 可以看我另一篇文章:🌈 实体对齐-全文检索-HNSW**混合检索:**既包括向量检索(涉及rerank检索的大模型),也包含全文检索。
设置完成后,保存并处理即可。
📎刑法.txt
3.3.3 测试
接下来我们进行测试使用。在工作室中创建一个聊天助手
将提示词写为:
你是一个法律小助手,请只根据知识库中的信息,简要回答用户提问的案件触犯了哪些法律知识库选择刚才添加的刑法.txt,然后可以开始提问。
可以观察到,聊天助手会自动引用知识库中的内容进行回答。
3.4 工作流(Workflow):钉钉智能助手
我们可以通过Dify的工作流结合多种工具与节点。它们会进行协作进而实现工作流的功能。
我们这里构建一个使用了钉钉群机器人的消息反馈工作流。将用户的文字问题进行分类和拆解分析后通过钉钉群机器人发送到群中。【企业微信 webhook 同理】
如下是其工作流的配置。
3.4.1 开始
工作流从此处开始。我们在输入字段中添加自己指定的输入内容
3.4.2 问题分类器
这里调用了两级问题分类器。问题分类器会调用LLM,从问题列表中选择最与用户的提问符合的一条,然后进入该条
3.4.3 总结助手
是问题分类器的下游,在系统提示词中传递进两级分类的名称,以及初始问题,要求进行总结(需要输入变量的时候只需要输入一个 / 即可开始联想寻找)
3.4.4 钉钉群消息工具
首先在Dify的工具中添加这个钉钉群机器人工具
我们要使用PC端的钉钉进行群机器人的创建。首先你需要在一个你是管理员的组织内创建一个群,然后才能在这个群里创建机器人
保存这个加签秘钥,之后会用到
保存下来这个Webhook,后面也会用到
完成了创建。
之后在钉钉机器人工具中的ACCESS TOKEN中填入刚才复制的Webhook中的access_token的值,在加签秘钥中填入刚才保存的加签秘钥。
注意:ACCES TOKEN 一定要填写Webhook中的access_token的值
https 😕/oapi.dingtalk.com/robot/send?access_token={你的 token}
3.4.5 测试
点击运行,输入初始反馈信息,开始运行
运行成功
那么,如何系统的去学习大模型LLM?
作为一名深耕行业的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。
所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。
由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
👉大模型学习指南+路线汇总👈
我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
👉①.基础篇👈
基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
👉②.进阶篇👈
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
👉③.实战篇👈
实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
👉④.福利篇👈
最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!