news 2026/4/30 6:54:23

大模型---FAISS/Chroma

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型---FAISS/Chroma

目录

1.FAISS

2.Chroma


Embedding 负责把文本变成向量;FAISS/Chroma 负责把这些向量建成可查询的本地索引(把向量和对应的文档/ID/元数据存到本地机器上,并建立最近邻搜索结构)。关于embedding,之前的博客有详细讲:

大模型---embedding

RAG的流程:文本切块-->生成 embedding-->建索引-->查询文本也做 embedding-->最近邻检索-->返回相关块。FAISS/Chroma就是负责建立索引。

为什么要先embedding在检索:

如果只用关键词检索,用户说法和文档说法不一致时,系统很容易漏召回。Embedding 检索的核心优势就是:即使字面不一样,只要意思接近,也能被找出来。Chroma 文档明确说,它会把 embedding 建索引,然后高效搜索相似内容;FAISS 文档则把“给定查询向量,寻找最相似向量”定义为它的核心工作。FAISS 偏底层,重点是“高效向量索引和相似搜索”;Chroma 更像“面向应用的本地向量数据库/数据层”,在向量索引之上又加了 collection、documents、metadata、filter、client 等更完整的接口。

1.FAISS

Faiss 中的数据结构就是一个 index,它有add方法把向量加进去,然后对查询向量做

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/30 6:47:22

字魂携手省级传承人魏伊平、何立宁,推出非遗定制字体

在数字化浪潮席卷全球的今天,如何让沉淀千年的非物质文化遗产与当代生活产生连接?作为国内知名的专业创意字体机构,字魂对此进行了更加年轻化、时代化的回答。近日,字魂正式上线了与旬邑彩贴剪纸省级代表性传承人魏伊平、宁夏贺兰…

作者头像 李华
网站建设 2026/4/30 6:44:30

等角度采样谐波减速器故障诊断【附代码】

✨ 本团队擅长数据搜集与处理、建模仿真、程序设计、仿真代码、EI、SCI写作与指导,毕业论文、期刊论文经验交流。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流,查看文章底部二维码(1)脉冲触发等角度重采样与零相位滤波预处理&#xff…

作者头像 李华
网站建设 2026/4/30 6:43:24

概率论有一点没明白

晚上 自己搞了: 观看技术直播 AI 大模型应用开发 Python持续学习 AI 相关知识…苍穹外卖 敲了 1 h. 用到了 redis .刷了两道不定长滑动窗口 ( 其实还是"入" ,“更新”, “出”, 必须熟练运用) 结语 人生的意义很简单 : 就是每天都开开心心 , 快快乐乐的 ~ !! 偶…

作者头像 李华
网站建设 2026/4/30 6:41:34

Golang goroutine泄漏怎么排查_Golang协程泄漏排查教程【实战】

协程泄漏需排除初始化波动和后台干扰,通过 runtime.NumGoroutine() 快速初筛,重点监控请求后不回落、压测后不恢复、长期单调上升三种情形;配合三处日志、pprof debug2 查阻塞栈,关注 chan receive/select/semacquire/IO wait 状态…

作者头像 李华