news 2026/4/28 0:54:16

小白也能学会!Dify搭建知识库智能体,轻松解决公司信息查找难题!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
小白也能学会!Dify搭建知识库智能体,轻松解决公司信息查找难题!

01 先聊聊痛点

你有没有遇到过这些情况:

新员工入职,翻了两天文档找不到报销流程,最后还得问老员工;销售见客户前想问个产品参数,在群里@了半天技术,没人回。

问题的本质不是没有文档,而是文档太多、太散、不好找。

传统的关键词搜索,你得猜对词才能找到;比如你想查「年假怎么休」,文档里写的是「带薪年休假实施办法」,关键词对不上,就搜不到。

知识库智能体解决的就是这个问题:你不用猜词,用自然语言问,它就能理解你的意思,从文档里找到答案。

02 知识库是怎么工作的

简单说一下原理,不复杂。

传统搜索是「关键词匹配」,你搜「年假」,它找带「年假」两个字的文档;文档里写的是「带薪年休假」,对不起,搜不到。

知识库用的是「语义搜索」,它把你的问题转换成一串数学向量,去文档库里找意思相近的内容;所以「年假怎么休」和「带薪年休假实施办法」虽然在字面上不一样,但在语义上是匹配的。

这个过程叫 RAG(检索增强生成),三个步骤:

第一步,索引:上传文档后,Dify 会自动把文档切分成小段,然后转成向量存起来。

第二步,检索:你提问的时候,系统把你的问题也转成向量,去库里找最相关的几个片段。

第三步,生成:把找出来的片段加上你的问题,一起发给大模型,让它组织答案。

大模型并不「知道」你的文档内容,它只是根据检索出来的片段来回答;这样既保证答案有依据,又能利用大模型的表达能力。

03 动手搭建

好了,理论说完了,咱们开始动手~

3.1 准备工作

上篇文章我们搭过dify了,这里直接拿来用

浏览器访问http://你的虚拟机IP,用管理员账号登录

大模型我用的是DeepSeek,用国内的通义千问也行,dashscope.aliyun.com,也送免费额度;OpenAI效果最好但需要海外支付~

配置入口在「设置」→「模型供应商」,选择模型后填 API Key 👇

第一次玩推荐DeepSeek,注册就送额度,不用绑卡

3.2 准备知识库内容

为了演示,我准备了一份《公司员工休假管理制度》文档,可以直接复制下面的内容保存成一个txt、md或word文件用来测试。

# 公司员工休假管理制度## 第一章 总则第一条 为规范公司休假管理,保障员工合法权益,根据国家相关法律法规,结合公司实际情况,制定本制度。第二条 本制度适用于公司全体正式员工。## 第二章 年休假第三条 员工累计工作已满1年不满10年的,年休假5天;已满10年不满20年的,年休假10天;已满20年的,年休假15天。第四条 国家法定休假日、休息日不计入年休假假期。第五条 年休假在1个自然年度内可以集中安排,也可以分段安排,一般不跨年度安排。确有必要跨年度安排的,可以跨1个年度安排。第六条 员工有下列情形之一的,不享受当年的年休假:(一)累计工作满1年不满10年,请病假累计2个月以上的;(二)累计工作满10年不满20年,请病假累计3个月以上的;(三)累计工作满20年以上,请病假累计4个月以上的。## 第三章 病假第七条 员工请病假需提供医院出具的病假证明。第八条 病假期间工资按以下标准发放:(一)工龄不满2年,按本人工资的60%计发;(二)工龄满2年不满4年,按本人工资的70%计发;(三)工龄满4年不满6年,按本人工资的80%计发;(四)工龄满6年不满8年,按本人工资的90%计发;(五)工龄满8年及以上,按本人工资的100%计发。第九条 医疗期最长不超过24个月。## 第四章 事假第十条 员工请事假须提前3个工作日申请,经批准后方可休假。第十一条 事假期间不计发工资。## 第五章 婚假第十二条 员工结婚可享受婚假3天。晚婚员工(男满25周岁,女满23周岁)增加婚假7天。第十三条 婚假须在领取结婚证后6个月内一次性休完。## 第六章 产假第十四条 女职工生育享受产假98天,其中产前可以休假15天。第十五条 难产的,增加产假15天;生育多胞胎的,每多生育1个婴儿,增加产假15天。第十六条 女职工怀孕未满4个月流产的,享受15天产假;怀孕满4个月流产的,享受42天产假。## 第七章 请假流程第十七条 所有请假均需通过OA系统提交申请,按以下权限审批:(一)请假1天以内,由部门主管审批;(二)请假1-3天,由部门总监审批;(三)请假3天以上,由分管副总审批。第十八条 请假申请须在休假开始前完成审批。紧急情况可先口头请示,事后3个工作日内补办手续。## 第八章 附则第十九条 本制度自2024年1月1日起执行。第二十条 本制度由人力资源部负责解释。

也可以用自己公司的文档,原理是一样的

3.3 创建知识库

点击「知识库」➔「创建知识库」

然后上传刚才准备好的文档

点击「下一步」

这里有几个设置比较关键:

  1. 分段最大长度,我习惯设 500,太长了检索不准,太短了语义不连贯,500 算是个比较平衡的值。
  2. 分段重叠长度设 50,这个是为了防止关键信息正好被切在两段的边界上,留一点重叠能兜住。
  3. 索引方式建议选「高质量」,效果比「经济」模式好不少。

不过这里有个坑,我用 DeepSeek,选「高质量」的时候提示不兼容👇

如果不想换模型,选「经济」模式也能用,只是检索精度会差一些,这里我就先选「经济」模式了~

点「保存并处理」,系统开始处理文档

处理完成后,点击「前往文档」

进来之后能看到文档被切成了一个个片段,Dify还提供了数据标注功能,可以手动调整片段内容和关联问题,不过咱们第一次玩,先保持默认看看效果

3.4 创建聊天助手

知识库准备好了,接下来搭一个前台来回答问题

点顶部菜单的「工作室」,选「聊天助手」,然后点「创建空白应用」

名称写「HR助手」

进去之后是编排页面。

中间是工作区,右边可以调试。

先写一段系统提示词,告诉AI它的角色和行为规范👇

你是一个专业的HR助手,负责回答员工关于休假制度的问题。回答要准确、简洁,并且注明信息来源。如果问题超出知识库范围,请告知用户联系人力资源部。

然后在「知识库」这里点「添加」,选刚才创建的「公司员工休假管理制度」文档

04 测试效果

下面来试几个问题:

① 先问个简单的

我工作3年了,年假有几天?

② 再来个带条件的

我工作12年了,今年请了4个月病假,还能休年假吗?

③ 最后试个知识库里没有的

公司附近有什么好吃的?

以上就是 Dify 搭建知识库智能体的入门流程,全程不到半小时,你的第一个智能体就上线了。

关于 Dify 还能怎么玩,后面咱们慢慢聊。


说真的,这两年看着身边一个个搞Java、C++、前端、数据、架构的开始卷大模型,挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis,稳稳当当过日子。

结果GPT、DeepSeek火了之后,整条线上的人都开始有点慌了,大家都在想:“我是不是要学大模型,不然这饭碗还能保多久?”

我先给出最直接的答案:一定要把现有的技术和大模型结合起来,而不是抛弃你们现有技术!掌握AI能力的Java工程师比纯Java岗要吃香的多。

即使现在裁员、降薪、团队解散的比比皆是……但后续的趋势一定是AI应用落地!大模型方向才是实现职业升级、提升薪资待遇的绝佳机遇!

这绝非空谈。数据说话

2025年的最后一个月,脉脉高聘发布了《2025年度人才迁徙报告》,披露了2025年前10个月的招聘市场现状。

AI领域的人才需求呈现出极为迫切的“井喷”态势

2025年前10个月,新发AI岗位量同比增长543%,9月单月同比增幅超11倍。同时,在薪资方面,AI领域也显著领先。其中,月薪排名前20的高薪岗位平均月薪均超过6万元,而这些席位大部分被AI研发岗占据。

与此相对应,市场为AI人才支付了显著的溢价:算法工程师中,专攻AIGC方向的岗位平均薪资较普通算法工程师高出近18%;产品经理岗位中,AI方向的产品经理薪资也领先约20%。

当你意识到“技术+AI”是个人突围的最佳路径时,整个就业市场的数据也印证了同一个事实:AI大模型正成为高薪机会的最大源头。

最后

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包【允许白嫖】:

  • ✅从入门到精通的全套视频教程
  • ✅AI大模型学习路线图(0基础到项目实战仅需90天)
  • ✅大模型书籍与技术文档PDF
  • ✅各大厂大模型面试题目详解
  • ✅640套AI大模型报告合集
  • ✅大模型入门实战训练

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

①从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(0基础到项目实战仅需90天)

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤640套AI大模型报告合集

⑥大模型入门实战训练

👉获取方式:
有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/28 0:53:19

API管理系统源码 API计费系统 最新小齐二开版

概述 在API经济蓬勃发展的当下,无论是个人开发者还是企业团队,都需要一套功能完善、易于管理的API接口平台来整合资源、实现商业化变现。为此,幽络源源码网特别整理并分享这款最新小齐二开版API管理系统源码。这是一款基于PHP开发的专业级AP…

作者头像 李华
网站建设 2026/4/28 0:53:17

如何在电脑上畅玩Switch游戏:Ryujinx模拟器终极指南

如何在电脑上畅玩Switch游戏:Ryujinx模拟器终极指南 【免费下载链接】Ryujinx 用 C# 编写的实验性 Nintendo Switch 模拟器 项目地址: https://gitcode.com/GitHub_Trending/ry/Ryujinx 想象一下,在你的电脑上就能体验《塞尔达传说:王…

作者头像 李华
网站建设 2026/4/28 0:52:16

Git Worktree管理器:AI编码时代的多任务并行开发利器

1. 项目概述:一个为AI编码时代量身定制的Git工作树管理器如果你和我一样,日常开发中频繁使用像Claude Code、Cursor这类AI编码助手,或者需要同时处理多个功能分支,那你一定遇到过这个痛点:如何在同一个代码仓库上&…

作者头像 李华
网站建设 2026/4/28 0:46:38

权限审计报告≠截图堆砌!MCP 2026官方未公开的11项结构化字段规范(含审计证据链哈希存证模板)

更多请点击: https://intelliparadigm.com 第一章:权限审计报告的本质认知与MCP 2026合规性定位 权限审计报告并非简单的访问日志汇总,而是组织身份治理体系的“数字心电图”——实时反映权限分配、使用偏差与策略漂移的动态健康指标。在MCP…

作者头像 李华