news 2026/5/3 5:25:38

大模型应用开发:从RAG到Agent的智能问答系统优化之路,解决场景区分不清的难题

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型应用开发:从RAG到Agent的智能问答系统优化之路,解决场景区分不清的难题

文章讲述了智能问答系统从纯RAG技术到结合Agent技术的优化过程。针对三个子场景中结构化和非结构化数据混合查询的问题,作者最初按场景建立三个知识库,但遇到召回率低、场景判断不准的困境。后改为从数据类型维度建立两个知识库(结构化和非结构化),并实现条件查询和相似度查询两种工具。通过让模型根据查询需求选择合适工具,并结合type字段判断场景,成功解决了多场景混合数据查询难题,技术实现更简单且效果显著提升。


大模型应用开发流程正确,但结果不一定正确。

由于大模型技术的复杂性,再加上不同业务场景的特殊需求,导致大模型应用的开发难度很大;但大模型应用开发最难的不是做出来而是要做好。

这次还以作者手里的智能问答项目来说,记录一下智能问答系统的踩坑记录,从怎么都达不到想要的效果,到能够很好的满足业务场景。

从作者这些年的开发经验来看,很多时候开发技术栈是有限的,遇到问题更多的是思路问题而不是纯粹的技术问题。

智能问答系统的优化方案

在介绍解决方案之前先来再简单介绍一下项目背景。

作者手里的这个项目是一个智能问答场景,但根据业务类型又区分为三个不同的子场景,并分别对应三种不同的知识问答。业务需求上要求这三个子场景使用同一个入口,并最好能不需要人工区分场景(如三个子菜单或下拉框),能够让系统根据问题智能判断不同的场景并选择不同的文档。

业务架构如下所示:

但这里有几个问题,场景1和场景2除了知识文档不同,其它的都很相似,文档类型也都是word,pdf这种非结构化数据;但场景3比较特殊,它的主要功能是查数据,而且文档类型是结构化+非结构化数据。

说到场景3可能有些人不是很理解这有什么特殊的地方,下面我们就来解释一下场景3的特殊点。

先说查数据,在之前的文章中有提到过查数据这个问题;在RAG增强检索中,检索和增强是分开的,并且没有限制检索的方式是相似度语义检索还是基于传统的数据库结构化检索。

但在基于自然语言的对话中,如果使用相似度语义检索很简单,直接把问题和知识转换成向量,然后进行相似度匹配就行了;但如果要使用传统的条件筛选,这就需要使用智能体(agent)技术了。

所以这个就是基于语义检索的缺陷问题,无法实现条件匹配;而智能体可以让模型理解用户的问题,然后生成查询条件调用接口或生成SQL进行条件检索。

第二个问题是,场景3的知识文档是结构化数据+非结构化数据;结构化数据需要使用条件筛选,非结构化数据需要使用语义匹配,这样才能达到最好的效果;虽然理论上把结构化数据转换成markdown或html格式,也可以实现相似度检索,但这种方式在实操检验中效果并不好。

所以说,怎么用技术解决这个问题?技术架构应该怎么做?

刚开始由于业务需求不明确,也没现在这么复杂,并且对业务和技术了解不深;所以作者选择的是使用纯RAG技术解决来实现这个功能,并且基础的技术架构是根据三个子场景,创建三个不同的知识库,也就是三张表(数据量不大,也就几万条)。

技术架构如下所示,是通过把非结构化数据转换成markdown这种半结构化数据保存到向量库中;而结构化数据,采用markdown+元数据的方式进行保存。

但是,经过实测发现这种效果很差,用户那边一直反馈效果不理想,甚至会胡编乱造;而从技术的角度来看就是,文档召回率和准确率都不足,虽然使用了很多种召回优化的手段,但都没有达到想要的效果,特别是三个场景区分不清楚。

这时作者区分三个子场景的实现原理是,根据用户问题先去三个知识库中分别检索相关数据,然后再重排序之后,找到其中相关性最高的,这个文档在哪个知识库,就是那个子场景。但由于文档召回率和准确率不足,导致场景判断也出现偏差。

所以,这时想的是既然纯RAG或者说相似度检索解决不了问题,那么我们就用智能体去解决。

但说起来简单,但等到真正把技术和业务结合的时候才发现,好像远远没有那么简单。

首先的问题就是,设计几个智能体,从哪个维度设计智能体?

如果给每个场景都单独设计一个智能体,那在不主动区分场景的情况下,我怎么知道调用那个智能体呢?

如果从场景的维度的维度设计智能体,那怎么解决相似度查询和条件查询的问题,工具上怎么设计,怎么实现,怎么匹配?

这个问题大家可以先思考一下,然后再看下面的解决方案。

所以,现在新的解决方案是什么样的呢?

解决方案

首先,作者刚开始就陷入了一个思维误区,那就是知识库为什么要根据三个场景建立三个知识库,不能从其它维度建立知识库吗?

既然三个场景无法区分,并且知识文档分为结构化和非结构化文档,并且只有第三种场景才有结构化文档;那么我们就可以从结构化和非结构化的角度来建立知识库。

因此,作者就创建了两个知识库,一个知识库用来保存第三种场景的结构化数据;这样就可以完全使用条件查询或者组合条件(标量)查询和相似度查询;而另外一个知识库专门用来保存非结构化文档,并且使用type字段来区分三种不同的场景。

这样业务逻辑就简单多了,而且实现智能体时也简单多了;只需要实现两个工具即可,一个是条件查询工具,另一个是相似度查询工具;简单来说就是两个知识库各实现一个查询工具即可。

然后在工具介绍中告诉模型,需要查数据的使用条件查询工具,需要匹配概念,语义的使用相似度查询工具。

这样在调用相似度查询工具时,再根据工具的返回结果中的type字段来判断到底属于哪个子场景。

如下图所示:

这样就完美解决了结构化文档和非结构化文档的混合查询问题,以及不同场景的判断问题。最重要的是其在技术实现上也变得简单了好多。

而且,经过实际测试,其效果远比之前的纯相似度检索效果要好上许多。

AI时代,未来的就业机会在哪里?

答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具,到自然语言处理、计算机视觉、多模态等核心领域,技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。

掌握大模型技能,就是把握高薪未来。

那么,普通人如何抓住大模型风口?

AI技术的普及对个人能力提出了新的要求,在AI时代,持续学习和适应新技术变得尤为重要。无论是企业还是个人,都需要不断更新知识体系,提升与AI协作的能力,以适应不断变化的工作环境。

因此,这里给大家整理了一份《2025最新大模型全套学习资源》,包括2025最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题等,带你从零基础入门到精通,快速掌握大模型技术!

由于篇幅有限,有需要的小伙伴可以扫码获取!

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

4. 大模型项目实战

学以致用,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

5. 大模型行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

为什么大家都在学AI大模型?

随着AI技术的发展,企业对人才的需求从“单一技术”转向 “AI+行业”双背景。企业对人才的需求从“单一技术”转向 “AI+行业”双背景。金融+AI、制造+AI、医疗+AI等跨界岗位薪资涨幅达30%-50%。

同时很多人面临优化裁员,近期科技巨头英特尔裁员2万人,传统岗位不断缩减,因此转行AI势在必行!

这些资料有用吗?

这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


大模型全套学习资料已整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费】

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 12:25:40

前端开发:提示词驱动的全链路

2025 前端开发大变局&#xff1a;从“手写代码”到“提示词驱动”的全链路革命 引言&#xff1a;前端开发的新常态 在 2025 年&#xff0c;如果你还在逐行敲入 <div> 和 handleOnClick&#xff0c;那么你可能正在掉队。前端领域已经进入了**“提示词即开发” (Prompt-a…

作者头像 李华
网站建设 2026/5/2 13:36:05

影刀RPA实战:3步搞定希音客户行为数据提取,效率飙升[特殊字符]

影刀RPA实战&#xff1a;3步搞定希音客户行为数据提取&#xff0c;效率飙升&#x1f680;每天手动整理希音数据浪费3小时&#xff1f;别让低效重复工作偷走你的创作时间&#xff01;今天分享如何用影刀RPA打造智能数据提取机器人&#xff0c;原需半天的任务现在3分钟自动完成—…

作者头像 李华
网站建设 2026/5/1 15:14:41

CTF中Web题目的常见题型及解题姿势,零基础入门到精通,收藏这篇就够了

一、基础知识类题目 考察基本的查看网页源代码、HTTP请求、修改页面元素等。 这些题很简单&#xff0c;比较难的比赛应该不会单独出&#xff0c;就算有应该也是Web的签到题。 实际做题的时候基本都是和其他更复杂的知识结合起来出现。 姿势&#xff1a;恶补基础知识就行 查…

作者头像 李华
网站建设 2026/5/1 7:39:12

测试驱动开发(TDD)的实践与思考

在敏捷开发与DevOps浪潮席卷软件工程的今天&#xff0c;测试驱动开发&#xff08;Test-Driven Development&#xff09;作为一项经典而充满争议的实践&#xff0c;始终占据着质量保障体系的核心位置。对于专业测试人员而言&#xff0c;TDD不仅是开发方法的变革&#xff0c;更是…

作者头像 李华
网站建设 2026/5/1 1:41:31

PySpark实战 - 2.2 利用Spark SQL计算总分与平均分

文章目录1. 实战概述2. 实战步骤3. 实战总结1. 实战概述 本次实战基于 Spark SQL 对 HDFS 上的学生成绩文本文件进行分析&#xff0c;通过 split 函数拆分姓名与各科成绩&#xff0c;利用嵌套查询和聚合计算&#xff0c;实现每位学生的总分与保留一位小数的平均分统计&#xf…

作者头像 李华
网站建设 2026/5/1 10:27:49

未来之窗昭和仙君(五十六)页面_预览模式——东方仙盟筑基期

未来之窗昭和仙君 - 一、功能概述此页面_预览模式功能用于将页面中的特定输入框转换为只读状态&#xff0c;呈现出预览模式。该功能支持对多种输入框类型进行处理&#xff0c;默认处理文本框、日期框和数字框&#xff0c;也可以自定义输入框类型。在处理时&#xff0c;会将输入…

作者头像 李华