news 2026/4/4 10:47:07

大模型RAG实战:关键词召回+语义召回,如何平衡速度与准确率两难问题?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型RAG实战:关键词召回+语义召回,如何平衡速度与准确率两难问题?

文章探讨RAG系统中的召回策略,指出面临效率与准确率两大挑战。提出混合检索解决方案:先用关键词检索快速过滤数据解决效率问题,再通过语义检索提升准确性解决准确率问题。这种策略在文本数据场景下能实现速度与准确率的平衡,而多模态数据则需要特殊处理方法。


关键词召回和语义召回分别解决了两个问题,前者解决了速度问题,后者解决了准确率问题。

在RAG中检索召回一直是一个难题,一是效率问题,二是准确率问题;特别是在大批量数据中,怎么快速且准确地召回数据,一直是一个值得讨论的课题;因此,我们今天就讨论一下,关键词召回和语义检索召回。

召回策略的研究

从RAG的技术流程来说,召回属于一个单独的步骤,对模型来说只需要拿到召回的数据即可,模型本身不关心数据的来源以及数据怎么来,所以针对召回问题,可以使用现有的所有检索方案,包括但不仅限于SQL,语义检索,关键词检索等,其实本质来说召回就是在做一个搜索引擎。

在大模型爆火之前,检索方式大都是基于字符匹配和关键词检索的方式,最典型的就是SQL查询和ES分词检索,这也是普通开发者接触最多的东西。

那这些技术和RAG有什么关系呢?

前面说了,RAG的检索召回是一个独立的环节,任何有助于检索召回的技术都可以应用于这一阶段。但是,我们知道RAG大部分是应用于自然语言对话场景,因此很多没接触过或者对RAG没有深入研究的人,都会认为RAG只能用语义召回。

从理论上来说,语义召回更符合RAG的规范,但其中有一个很严重的问题是,语义召回由于要进行大量的向量运算,因此对算力的要求比较高,其次速度比较慢;在面对大数据量大场景时,只使用语义召回明显不是一个好的选择。

所以,为了解决这个问题,我们就需要使用多种召回策略,在速度和准确度之间达到一个平衡。

首先,目前来看最快的召回方式应该是使用SQL等字符匹配的方式,而且其不但速度快,而且准确率最高。但在RAG场景中,SQL查询能解决部分问题,但在某些场景中无法满足,如对文档内容进行检索。

所以,我们就要考虑另外两种方式,关键词检索和语义检索。

在大数据量RAG场景中,为了提升召回速度,我们可以混合检索的方式;首先,使用关键词检索,如jieba分词,通过关键词的方式在大量数据中进行快速过滤,关键词检索的优点有二,其一是速度快,由于不需要进行向量运算,其查询速度要比语义检索快得多;其二就是成本低,基于关键词检索的方式,不需要算力的支持,其本质上还是基于字符匹配的方式进行检索。当然,有些人为了提升关键词检索的准确率,也会使用相似度算法,来对召回的数据进行语义计算,从而提升准确度。

其次,在关键字检索的基础之上,我们再使用语义检索的方式,也就是相似度计算来提升召回数据的准确性;也就是说关键词检索解决了效率问题,语义检索解决了准确度问题。

通过混合这两种召回方式,就能在效率和准确率之间达到一个平衡;当然关键词召回的方式只适用于文本数据,如果涉及到多模态数据,除非使用的是内容提取为文本,然后通过文本进行召回的方式,否则就只能用多模态融合技术,也就是多模态embedding,解决多模态数据召回问题。

AI大模型从0到精通全套学习大礼包

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

只要你是真心想学AI大模型,我这份资料就可以无偿共享给你学习。大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!

如果你也想通过学大模型技术去帮助就业和转行,可以扫描下方链接👇👇
大模型重磅福利:入门进阶全套104G学习资源包免费分享!

01.从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

02.AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线


03.学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的


04.大模型面试题目详解

05.这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!


如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/26 23:29:26

基于单片机 PID 算法的温度控制调节器控制设计

一、系统整体设计方案 本系统以 STM32F103C8T6 单片机为控制核心,融合 PID(比例 - 积分 - 微分)算法实现高精度温度控制,适用于工业加热设备、恒温水箱、实验室反应釜等场景,可实现目标温度设定(0-100℃&a…

作者头像 李华
网站建设 2026/4/1 23:52:18

基于Simulink的电机轴承润滑优化仿真

目录 手把手教你学Simulink 一、引言:为什么“电机温升不高,但轴承却干磨烧毁”?——润滑失效是可靠性黑洞! 二、轴承润滑失效机理:从油脂到卡死的退化链 润滑脂功能三要素: 失效路径: 关键指标: 三、应用场景:电动汽车驱动电机的长寿命轴承设计 系统需求 四…

作者头像 李华
网站建设 2026/4/1 13:24:00

基于51单片机的超声水位检测系统设计

摘 要 水位测量普遍应用于防洪、水库、天气预报等测量行业中。声波液位测量器是一款势头猛增的新兴技术,它做 为一款无触碰的测距仪器适应于各种复杂环境,因此,在繁杂的测距设备中脱颖而出。近年来,随微型计算机、微 型芯片、继电…

作者头像 李华
网站建设 2026/3/28 17:43:33

地信不同就业方向,该怎么规划职业路线?

下面我们接着之前的内容继续介绍,GIS各岗位不同的职业发展路线和方向。GIS的岗位类型较多,受篇幅限制,我们本篇文章只介绍三个类型的岗位,分别是:GIS数据处理、GIS项目管理和GIS研发。GIS数据处理GIS数据处理工程师-&g…

作者头像 李华