news 2025/12/30 9:37:57

RAG的一点思考

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RAG的一点思考

RAG有一个很典型的模块叫文本切块,然后检索。切块部分可以按window窗口切,检索部分也可以多路径检索,兼具稀疏检索,稠密检索和数据流检索。

这个流程和token化,然后embedding很像,所以我今天就陷入了迷茫?

因为一个RAG框架效果不好,你怎么定位是检索问题还是切块问题呢?

同学回答,其实两个很像,但是不一样,RAG切块可以大块的按照一段一页那种切,token化是按照最小语义切分,一个词或者一个字。所以定位问题时既要考虑检索,也要考虑生成。检索就要尝试可视化分块部分。

最近在学agent,hugging face的教程很不错。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/24 16:05:53

最近一个thinkphp项目首页总是跳转到一个国外垃圾网址,怎么处理?

最近一个thinkphp项目首页总是跳转到一个国外垃圾网址,怎么处理? THINKPHP 项目首页跳转到外网垃圾页面,核心原因是项目文件被篡改、存在恶意代码,或服务器环境被入侵(如挂马、DNS 劫持、hosts 篡改等)。以…

作者头像 李华
网站建设 2025/12/29 4:44:04

为什么你的Prompt总失效?Open-AutoGLM改prompt的8大避坑指南

第一章:为什么你的Prompt总失效?在与大语言模型交互时,许多用户发现精心设计的提示(Prompt)却无法得到预期结果。这通常并非模型能力不足,而是Prompt本身存在结构性缺陷。理解这些常见问题,是提…

作者头像 李华
网站建设 2025/12/24 16:00:33

Open-AutoGLM点咖啡到底有多智能?:三大场景验证其真实能力

第一章:Open-AutoGLM点咖啡到底有多智能?:三大场景验证其真实能力Open-AutoGLM作为新一代开源多模态语言模型,在实际应用场景中展现出惊人的理解与决策能力。通过在点咖啡这一日常任务中的深度测试,其智能化水平在三个…

作者头像 李华
网站建设 2025/12/24 15:59:22

Python+Vue的慢性病患者跟踪治疗信息管理系统 Pycharm django flask

这里写目录标题项目介绍项目展示详细视频演示感兴趣的可以先收藏起来,还有大家在毕设选题(免费咨询指导选题),项目以及论文编写等相关问题都可以给我留言咨询,希望帮助更多的人技术栈文章下方名片联系我即可~解决的思路…

作者头像 李华
网站建设 2025/12/24 15:56:54

【大模型平民化革命】:waic Open-AutoGLM如何让中小企业玩转AI?

第一章:大模型平民化革命的背景与意义人工智能技术在过去十年中迅猛发展,其中大模型(Large Models)作为核心技术之一,正在重塑软件开发、内容生成、科学研究等多个领域。然而,长期以来,训练和部…

作者头像 李华