RAG知识库准确率提升手册（保姆级教程），从入门到精通就看这篇！-开发者社区

在RAG系统中，提升知识库文档的召回准确率，对于提高整个系统的用户体验至关重要。

今天，我就从文档切割粒度、检索后排序、混合检索、RAG-Fusion 这几个方面，详细介绍如何提升知识库文档的召回准确率，希望对你有所帮助。

文档切割粒度

在RAG系统中，文档切割是将大文档分割成更小的文本块，以便更高效地进行向量表示和检索。而切割粒度的大小直接影响检索的效率和召回率。

文档如果切割粒度太细，可能导致上下文信息丢失，使得检索到的文本块无法准确反映原文的含义，从而降低召回率。

但如果切割粒度太粗，虽然保留了上下文信息，但可能使得检索范围过大，增加噪声，同样影响召回率。

因此，选择适中的切割粒度很重要。但具体如何切割，也没有标准答案，需要具体情况具体分析。

例如，对于技术文档或法律文件，可以按段落或章节进行切割；对于新闻报道或博客文章，可以按句子或段落进行切割。

目前，行业内还有一种做法，就是重叠式切割，主要也是为了使上下文更完整，感兴趣可以详细了解下。

检索后排序

通常情况下，初始检索结果可能包含大量与查询相关，但实际相关性不高的文档，通过重排序技术，可以将相关性更高的文档排在前面，提高召回准确率。

比如，可以基于统计打分的重排序，通过汇总多个来源的候选结果列表，使用多路召回的加权得分或倒数排名融合算法，来为所有结果重新算分。这种方法计算简单，成本低效率高，广泛用于对延迟较敏感的场景。

另外，可以基于深度学习的重排序，利用 BAAI/bge-reranker-v2-m3 这类的模型，更好地分析问题和文档之间的相关性。这种方法检索准确度更高，但成本也更高，适合对检索精度要求高的场景。

混合检索

单一的检索方式可能无法全面捕捉用户查询的意图，混合检索通过结合多种检索方式，可以显著提高召回率。

关键词匹配召回简单直接，能快速找到包含特定关键词的文档；向量匹配召回能更好地处理语义层面的匹配，提高召回的全面性。而将两者结合，可以兼顾召回的速度和准确性。

另外，全文检索能够捕捉文档中的完整信息，但计算成本较高；向量检索计算效率高，但可能丢失上下文信息。通过结合两种检索方式，也可以充分利用各自的优势，提高召回率。

RAG-Fusion

RAG-Fusion可能大家了解的不多，它是一种将多查询召回与结果融合策略结合使用的优化方法，通过多次查询和结果融合，提高召回率和准确性。

首先，使用多个不同的查询来获取更全面的内容，这些查询可以是基于原始查询的变体、同义词、近义词或语义相关的词汇生成，当然，我们可以利用 LLM 给我们生成即可，也就是把用户原始的问题，再用不同的几句话表达出来，分别做查询。

根据各次查询结果的重要性进行加权排序，确保最终展示给用户的结果是高度相关且全面的。

课代表总结

提升RAG系统中知识库文档的召回准确率需要从多个方面入手。通过合理的文档切割粒度、检索后排序、混合检索和RAG-Fusion等策略，可以显著提高召回率，为用户提供更准确、更有价值的回答。在实际应用中，还是得根据具体场景和需求，选择适合的策略进行优化哈。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

Tomcat理论

RAG知识库准确率提升手册（保姆级教程），从入门到精通就看这篇！

文档切割粒度

检索后排序

混合检索

RAG-Fusion

课代表总结

如何学习大模型 AI ？

第一阶段（10天）：初阶应用

第二阶段（30天）：高阶应用

第三阶段（30天）：模型训练

第四阶段（20天）：商业闭环

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

为什么顶级AI团队都在用Open-AutoGLM做任务排队？真相令人震惊

毕业论文写到想放弃？百考通AI平台，3分钟生成专业初稿，助你顺利毕业！

为什么你的AutoGLM流程总出错？：深入剖析自定义确认函数的3大致命误区

Linly-Talker可用于制造业设备操作指导视频生成

【Open-AutoGLM合规开发核心要点】：掌握商业项目落地的法律与技术双红线

文档切割粒度

检索后排序

混合检索

RAG-Fusion

课代表总结

如何学习大模型 AI ？

第一阶段（10天）：初阶应用

第二阶段（30天）：高阶应用

第三阶段（30天）：模型训练

第四阶段（20天）：商业闭环

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

Tomcat理论

为什么顶级AI团队都在用Open-AutoGLM做任务排队？真相令人震惊

毕业论文写到想放弃？百考通AI平台，3分钟生成专业初稿，助你顺利毕业！

为什么你的AutoGLM流程总出错？：深入剖析自定义确认函数的3大致命误区

Linly-Talker可用于制造业设备操作指导视频生成

【Open-AutoGLM合规开发核心要点】：掌握商业项目落地的法律与技术双红线

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】