news 2026/6/7 3:24:19

解释一下RAG中的Rerank

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
解释一下RAG中的Rerank

Rerank其实一个是对初步检索返回的候选文档列表再次进行排序的过程。

如果把RAG的检索过程类比成公司的招聘过程,则有如下对应关系:

1.初步检索(Retrieval)
这一步就类似于HR筛选简历,找工作的人往往很多,HR每天都可能收到上万份甚至几万份简历。

假设有1万份简历,1个HR每天工作8小时,那么1小时之内就得看完1250份,平均到1分钟以内就得看完20多份,这几乎是不可能的。

所以,不可能每份简历HR都会细看。

那她会怎么看呢,主要就是看关键词,比如Java、 大模型等等,看到简历上有这些匹配的关键词字眼 ,就筛选出来。

这样做就会导致看似简历已经匹配上关键词了,但是候选人的能力可能还不太符合要求,只能选出前100个看似还行的候选人。

我们把这个场景对应到RAG的检索过程里面就是,向量检索,它虽然算得快,但是对语义的理解还差点意思。

2.重排序(Rerank)

这个过程就类似于企业招聘过程的业务面试,也就是主管把这100人的简历打印出来仔细阅读,如果觉得候选人的过往经历和工作经验很符合要求,就会约下一步的一对一业务面试。

这个过程花费的时间比较长,消耗的精力也更多,但是筛选出来的候选人也更符合要求。

这也就是RAG检索过程的Rerank,可以精准地判断初步检索返回的文档是不是真正能够回答用户的问题,最后再喂给大模型去生成一个答案。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/4 18:23:36

Java是怎么实现跨平台的?

跨平台指的是在不同的硬件或者操作系统上,Java代码在不需要针对不同的平台做对应的修改的前提下,都可以正常运行。 要实现这样一种一次编写到处运行的特性,主要靠的是JVM,即Java虚拟机。 和其他编程语言在编译后直接生成特定于某一…

作者头像 李华
网站建设 2026/6/2 8:01:55

集体好奇心如何引爆乘数效应

集体好奇心如何引爆乘数效应关键词:集体好奇心、乘数效应、群体智慧、创新驱动、社交互动、知识共享、协同合作摘要:本文聚焦于集体好奇心如何引爆乘数效应这一核心问题。通过深入剖析集体好奇心的概念、形成机制,阐述其与乘数效应的内在联系…

作者头像 李华
网站建设 2026/5/28 17:49:06

幽冥大陆(八十七 ) 水果识别在线检测模型netron —东方仙盟练气期

ncnn:东方仙盟式的轻轻量高效深度学习推理框架 在深度学习的江湖中,ncnn 犹如一个隐世的东方仙盟,以其独特的 "内功心法" 和 "神兵利器",在终端设备的深度学习推理领域占据一席之地。作为腾讯开源的高性能神…

作者头像 李华
网站建设 2026/5/29 0:15:13

学霸同款2025 AI论文网站TOP8:继续教育必备测评

学霸同款2025 AI论文网站TOP8:继续教育必备测评 2025年学术AI写作工具测评:为何值得一看 随着人工智能技术的不断进步,越来越多的学术工作者开始依赖AI工具提升论文写作效率。然而,面对市场上琳琅满目的平台,如何选择…

作者头像 李华
网站建设 2026/6/2 8:01:55

AI应用架构师带你掌握AI系统灾备方案设计技巧

AI应用架构师带你掌握AI系统灾备方案设计技巧 引言:从一次「推荐系统宕机」看AI灾备的代价 2023年双11期间,某头部电商的实时推荐系统因单可用区(AZ)电力故障宕机45分钟。这场故障直接导致: 首页推荐转化率下降22%&…

作者头像 李华
网站建设 2026/6/3 19:30:46

《CPU的指令集架构:定义计算之基的格式、寻址与范式》

本篇技术博文摘要 🌟 本章“指令系统”阐述了计算机硬件与软件间的核心接口,定义了CPU可执行的基本命令集合。首先,从指令格式入手,解析操作码与地址码的组成,并介绍扩展操作码技术。核心部分详细讲解了指令寻址与多种…

作者头像 李华