news 2026/4/23 20:28:27

【收藏】RAG问答质量提升策略:小块召回,大块生成的原理与实现

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【收藏】RAG问答质量提升策略:小块召回,大块生成的原理与实现

"小块召回,大块生成"是RAG技术的一种优化策略,通过将文档进行总结或关键字提取后进行向量化(小块召回),提升相似度计算质量和召回率;在生成阶段使用原始文档(大块生成),保证上下文连贯性和生成质量。这种策略既解决了召回问题,又确保了生成质量,是提升RAG系统性能的有效方法。


小块召回,大块生成的策略的作用是提升文档的召回率,并保证文档上下文的连贯性。

在RAG技术的真实实践过程中,我们经常会遇到的一个问题就是——模型回答的质量不好;当然导致回答质量不好的原因有很多,而我们今天就来讨论一种RAG问答的优化策略——小块召回,大块生成。

从本质上来说其实就是解决了两个问题,小块解决召回问题,大块解决生成问题。

小块召回,大块生成

可能很多人都不明白什么叫做小块召回,大块生成?

小块召回,大块生成的原理很简单;用更小的文档块做召回,解决召回率和准确率问题;用更大的块做生成,解决上下文连贯性问题,提升生成质量。

当然这样说可能很多人都不太理解,其实这个是与具体的技术细节有关。

首先我们要明白一个问题,向量数据库存储数据的原理和传统数据库并没有本质上的区别;都是用一个一个的字段来存储数据,只不过向量数据库有一个比较特殊的点是支持向量计算,而不是基于传统的字符匹配。

其次,可能有人会认为,相似度查询是把文档向量化之后,通过相似度计算的方式检索出相关数据,然后再问答时再把这段数据转换成文本文档。

但在RAG的流程中,在把文档切片之后,虽然会把切片后的文档进行向量化,但同时会保存原文档;我们只是用向量化的数据做相似度计算,而不是用来做生成。

举例来说,向量字段就类似于传统数据库中的ID或某个字段,然后还会有一个原始文档的字段;当根据相似度计算检索到某条记录之后,会把原始文档里的内容传给模型做生成。

所以,向量数据库也是一条记录一条记录的保存数据,而向量是其中的一个字段类型,专门用来做向量检索使用。

而什么是小块检索,大块生成呢?

在文档切片之后,特别是在低质量的切片之后,很多人为了简单方便会直接把切片后的数据进行向量化,这种文档可能存在大量的无关内容或噪音。

比如说word/pdf等类型的文档会存在页眉,页脚,分割符等等;但这些内容对我们来说是没有意义的,只会降低文档的质量。

所以,我们可以选择一种方式,就是对这段文档进行总结或关键字提取;之后再进行向量化,这样就可以大大降低文档的噪音,提升相似度计算的质量;同时,我们继续保存文档原始内容,当召回之后我们并不是把总结之后的文档丢给模型,而是把原始文档丢给模型,这样既能提升文档召回率,也不会影响到参考文档质量。

而以上这个过程就叫做小块召回,大块生成;用更小更准确的文档块做数据召回,用更大更全的文档做增强生成;这样既能保证文档的召回效果,又能保证上下文的连贯性。

总之,RAG系统的优化过程是一个非常复杂且繁琐的过程,我们需要在各个环节对系统做优化和测试,才能真正达到生产级别的需要。

AI时代,未来的就业机会在哪里?

答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具,到自然语言处理、计算机视觉、多模态等核心领域,技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。

掌握大模型技能,就是把握高薪未来。

那么,普通人如何抓住大模型风口?

AI技术的普及对个人能力提出了新的要求,在AI时代,持续学习和适应新技术变得尤为重要。无论是企业还是个人,都需要不断更新知识体系,提升与AI协作的能力,以适应不断变化的工作环境。

因此,这里给大家整理了一份《2025最新大模型全套学习资源》,包括2025最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题等,带你从零基础入门到精通,快速掌握大模型技术!

由于篇幅有限,有需要的小伙伴可以扫码获取!

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

4. 大模型项目实战

学以致用,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

5. 大模型行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

为什么大家都在学AI大模型?

随着AI技术的发展,企业对人才的需求从“单一技术”转向 “AI+行业”双背景。企业对人才的需求从“单一技术”转向 “AI+行业”双背景。金融+AI、制造+AI、医疗+AI等跨界岗位薪资涨幅达30%-50%。

同时很多人面临优化裁员,近期科技巨头英特尔裁员2万人,传统岗位不断缩减,因此转行AI势在必行!

这些资料有用吗?

这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


大模型全套学习资料已整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费】

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 2:23:50

Wan2.2-T2V-A14B如何实现光影变化的时间一致性?

Wan2.2-T2V-A14B如何实现光影变化的时间一致性? 在影视级视觉内容越来越依赖AI生成的今天,一个看似微小却极其致命的问题正困扰着几乎所有文本到视频(Text-to-Video, T2V)系统——光影跳变。你有没有看过这样的生成视频&#xff1…

作者头像 李华
网站建设 2026/4/23 15:15:42

解锁Wan2.2-T2V-A14B隐藏功能:高级提示词工程技巧分享

解锁Wan2.2-T2V-A14B隐藏功能:高级提示词工程技巧分享 你有没有遇到过这种情况?明明输入了一段精心构思的描述,结果生成的视频却像“抽搐的幻灯片”——人物动作僵硬、场景突变、细节糊成一团🌀。别急,问题可能不在模型…

作者头像 李华
网站建设 2026/4/18 13:48:46

Arbess从基础到实践(8) - 集成GitLab实现Node.js项目自动化部署

Arbess 是一款开源免费的 CI/CD 工具,工具支持免费私有化部署,一键安装零配置,页面设计简洁易用。本文将详细介绍如何安装Arbess、GitLab,创建流水线实现 node.js 项目自动化部署。 1、GitLab 安装与配置 本章节将介绍如何使用C…

作者头像 李华
网站建设 2026/4/22 22:50:36

IDM激活脚本完整教程:轻松解决试用期管理难题

IDM激活脚本是一个开源工具,专门用于管理和重置Internet Download Manager的试用期。无论你是IDM的新用户还是长期使用者,这个工具都能为你提供便捷的试用期管理解决方案。 【免费下载链接】IDM-Activation-Script IDM Activation & Trail Reset Scr…

作者头像 李华
网站建设 2026/4/22 9:34:14

5分钟快速上手:Llama2-7B模型部署终极指南

5分钟快速上手:Llama2-7B模型部署终极指南 【免费下载链接】llama Inference code for LLaMA models 项目地址: https://gitcode.com/gh_mirrors/ll/llama 你是否对Llama2-7B大语言模型的强大能力充满好奇,却在部署过程中频频碰壁?别担…

作者头像 李华