news 2026/5/11 0:08:25

作为后端开发你不得不知的 AI 知识——RAG

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
作为后端开发你不得不知的 AI 知识——RAG

作为后端开发你不得不知的 AI 知识——RAG

前言

我们知道,大模型的知识都是固化的,它不认识你公司的最新产品,而 RAG 就是为模型提供知识库的一种有效方法。

基于RAG(Retrieval Augmented Generation,检索增强生成)构建知识库,是大模型兴起之后最快被采纳接收的架构范式之一。当前,RAG 系统已经被广泛地应用在客服问答、个性化推荐、智能对话助手等场景中。RAG 技术能够弥补大模型因知识截止而无法获取最新信息的问题,并有效降低其产生幻觉的风险,而且 RAG 技术相比于大模型后训练或微调方式,以更加成本低的方式与企业的专有数据对接,以实现大模型快速技术验证和商业化尝试。

RAG 知识库的应用架构

基于 RAG 构建知识库的应用架构如下。可以简单划分为离线索引建构在线检索和生成过程

  • 离线向量过程通过把用户上传的文档进行文档智能解析、切片,再进行向量化存储到向量数据库。
  • 在线过程则把用户的请求问题向量化之后与向量库中的切片向量进行相似度比对,慈悲个人召回最接近用户问题的相关切片。

如今构建上图这样的 RAG 系统已经变得非常简单,开源社区和商业产品都提供了非常简便的构建方式。在满足复杂的业务需求的过程中,通常一个简单的 RAG 系统无法满足业务需求,会遭遇准确率和召回率的挑战、信息冗余噪声导致的模型幻觉、知识库庞杂难以管理等问题。当前 RAG 系统的构建也逐步向模块化、Agentic RAG 的高级架构演进。

从离线过程来看,文档解析技术除了经典的 OCR 和电子解析技术,也在利用大模型进行更准确的文档解析,比如对于图片类的文档,通过 VLM 视觉 理解大模型,能够对这类文档进行更全面的文档理解。

从在线检索过程来看,检索前、检索中、检索后过程里,都发展出很多的技术手段来加强和管理整体 RAG 的效果。

如:

  • 检索前可以增加 Query 改写、知识库路由等模块
  • 检索过程可以采用混合检索策略
  • 检索后可以增加充排序、拒识模块等。

从构建包含 RAG 的 AI 应用来看,Agentic RAG 成为新的趋势之一,用户将知识库检索作为大模型的工具之一,由大模型来决定是否以及何时进行检索以获取必要的知识库信息。另外,多模态 RAG 技术也是当前蓬勃发展的领域,随着多模态理解大模型能力的增强,多模态 Embedding 向量模型也取得了重大的发展。基于多模态向量模型的 RAG 系统在商品搜推、视频创作等各类场景已经获得了规模化的落地。

RAG 知识库的应用场景

知识库落地有广泛的应用场景,包括客服服务、个性化推荐、AI 陪伴、内容创作等。其中客服服务 RAG 是最广泛落地的应用之一,从业务特征来看,通常需要大量的业务背景知识,并且这些知识是不断更新的,例如常见问题解答(FAQ)、产品规格、故障排除指南以及公司政策等。

在这些场景里,知识库是严格知识的来源、可信任,作为降低大模型幻觉的重要手段。甚至在更加严肃的场景里,许多用户将大模型只作为知识库的整理工具,要求大模型回答需要严格遵循知识库里的知识,不能随意发挥,以避免严重的客诉问题。

不过当前 RAG 的应用也已经超越简单的回答。基于 RAG 的系统,叠加大模型分析客户对话数据等能力,能够帮助企业优化服务策略和挖掘销售线索等。RAG 的价值正在从解决幻觉这一技术问题,向赋能业务的更高层面演进。多模态 RAG 的兴起,将 RAG 的应用边界从纯粹的知识问答推向了更广阔的领域:

  1. 零售电商场景:用户 可以通过上传图片来检索商品,从而实现商品图搜和个性化推荐。
  2. 媒体娱乐领域:多模态 RAG 也帮助从海量音频视频内容中检索出特定的片段,从而服务于音视频内容分发以及新型的 AI 视频创作场景。

RAG 知识库的未来发展

大模型发展至今,RAG 作为最成熟的 AI 应用架构之一,尽管基础 RAG 的实现已趋于成熟,但仍有人认为其技术含量不高。然而,我们观察到,构建一个真正满足复杂业务需求的高级 RAG 系统仍然充满挑战,并且该领域正在不断演进。比如在当前 Advanced RAG 架构里,仍然有许多技术问题待解决。多模态 RAG 相关的技术,也在快速地发展当中,其应用场景和想象力空间更大。

无论未来 LLM 架构如何演变,只要它们仍然依赖外部知识来增强其能力,向量检索作为一种高效、语义化的上下文获取机制,仍然将发挥重要的价值。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 15:59:28

DeepSeek实战:从入门到精通手搓AI智能客服,收藏这一篇就够了!

智能客服想必大家并不陌生吧,一个可以007且全年无休的任劳任怨的牛马! 你也不曾想过自己有一天也能手搓、调教一个AI智能客服! 对于非技术人员,想要搭建一个AI智能客服,想都不敢想;那你们接着往下文看&am…

作者头像 李华
网站建设 2026/5/9 16:01:35

java+vue基于springboot的宠物生活馆网站的设计与实现

目录摘要内容开发技术源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!摘要内容 该系统基于SpringBoot和Vue.js框架,设计并实现了一个宠物生活馆网站,旨在为宠物主人提供一站式服务,包括宠物用品购买、…

作者头像 李华
网站建设 2026/5/9 16:00:18

AI编程工具使用心得:从部署到实操,同行实测干货

在AI编程工具同质化愈发突出的当下,很多开发者都会纠结于选择合适的研发辅助工具,我这段时间实操使用的MonkeyCodeAI,或许能给大家提供一些参考。它凭借开源可扩展、安全可控的核心特性,成为我个人开发和团队协作中常用的研发帮手…

作者头像 李华
网站建设 2026/5/9 16:00:12

大模型岗位全解析:从入门到精通,6大方向12个热门岗位详解,助你找到理想工作!_大模型方向有哪些具体岗位?

本文全面介绍大模型领域各类岗位,包括研发、算法、数据、产品管理等方向及垂直领域特色岗位,详细解析职责要求和技能,提供职业路径指引。同时提供分阶段学习大模型AI的系统方法,从初阶应用到模型训练,帮助读者掌握技术…

作者头像 李华
网站建设 2026/5/9 16:00:18

狡兔三窟式C++函数封装!更安全的定义与调用新玩法

狡兔三窟式C函数封装!更安全的定义与调用新玩法 文章目录狡兔三窟式C函数封装!更安全的定义与调用新玩法一、先说说传统写法的“小痛点”二、核心设计思路:双层包装接口桥接1. 第一层包装:_add_()函数——藏起核心逻辑2. 第二层包…

作者头像 李华