news 2026/6/10 18:21:11

Chroma:给 AI 应用做向量存储和检索

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Chroma:给 AI 应用做向量存储和检索

文章目录

  • Chroma:给 AI 应用做向量存储和检索
    • 1、 核心功能
    • 2、 设计思路
    • 3、 安装使用
    • 4、 适合哪些人用

Chroma:给 AI 应用做向量存储和检索

Chroma 在 GitHub 上已经拿到 28,198 Star。

这是一个开源的向量数据库,定位为 AI 应用的数据基础设施。支持 Python 和 JavaScript,提供内存模式用于快速原型,也支持持久化存储和服务端部署。

1、 核心功能

向量数据库的作用是把文本、图片这类数据转成高维向量,然后基于相似度做检索。语义搜索、RAG 这类场景都依赖这个能力。

Chroma 的核心 API 只有 4 个函数:创建集合、添加文档、查询相似结果、按 ID 获取。没有复杂的配置,安装后直接 import 就能用。

importchromadb client=chromadb.Client()collection=client.create_collection("all-my-documents")collection.add(documents=["This is document1","This is document2"],metadatas=[{"source":"notion"},{"source":"google-docs"}],ids=["doc1","doc2"],)results=collection.query(query_texts=["This is a query document"],n_results=2,)

Embedding 生成、tokenization、索引构建,这些 Chroma 内部自动处理。你也可以传自己的向量,跳过内置的 embedding 流程。

2、 设计思路

Chroma 的目标是让向量检索的门槛足够低。内存模式适合本地开发和测试,加一行配置就能切到持久化模式。需要服务化部署时,用chroma run启动服务端,客户端通过网络访问。

Python 和 JavaScript 的 API 设计保持一致,团队里不同技术栈的人用起来不会有割裂感。

如果不需要自己维护基础设施,Chroma Cloud 提供托管服务,支持向量搜索、混合搜索和全文搜索。

3、 安装使用

Python 用户:

pipinstallchromadb

JavaScript 用户:

npminstallchromadb

启动服务端:

chroma run--path/chroma_db_path

查询时支持 metadata 过滤和文档内容过滤,接口设计得很直接,没有复杂的查询语法要记。

4、 适合哪些人用

  • 做 RAG 应用、需要给 LLM 检索上下文的开发者
  • 做语义搜索、推荐系统的工程师
  • 需要快速验证向量检索方案的产品团队

Chroma 采用 Apache 2.0 协议开源,社区在 Discord 上活跃,每周一发布新版本。

需要快速验证向量检索方案的产品团队

Chroma 采用 Apache 2.0 协议开源,社区在 Discord 上活跃,每周一发布新版本。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 18:16:14

Windows系统difxapi.dll文件丢失找不到问题解决

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

作者头像 李华
网站建设 2026/6/10 18:10:57

【架构深评】打破多品牌壁垒:如何基于 GB28181 与 RTSP 栈,构建高解耦的 AI 视频流媒体管理平台?(附源码交付)

引言:利旧与创新的博弈,安防集成商的“破局之战” 在传统安防向 AI 智能化升级的进程中,项目落地往往面临着两大冰冷的高墙:前端设备碎片化与流媒体开发周期长。 海康、大华、宇视以及众多白牌厂家的利旧摄像头协议各异&#xff…

作者头像 李华
网站建设 2026/6/10 18:10:49

docker无法连接到ollama服务的问题排查和解决方案

一、环境背景 服务端(Ollama):运行于 Windows 宿主机上。属于非系统级服务,可通过桌面快捷方式(羊驼图标)或命令行(ollama serve)手动启动。 客户端(Docker)&…

作者头像 李华
网站建设 2026/6/10 18:06:56

亲测有效!技术强的认证机构选择经验分享

认证机构行业痛点分析当前,认证机构领域的企业面临诸多挑战。首先,入行门槛偏低导致市场鱼龙混杂,超六成中小机构无合规备案,依靠低价抢单、代编资料抢占市场,引发恶性竞争,行业利润不断被压缩。其次&#…

作者头像 李华
网站建设 2026/6/10 18:01:42

核心拆解:基金名字里的“四大密码”

名字里的关键词到底代表啥意思?热门基金举例行业/主题专门买某个特定行业的股票,一荣俱荣,一损俱损。招商中证白酒(全仓买茅台五粮液等酒企)易方达国防军工(专买军工企业)指数名称被动跟踪某个指…

作者头像 李华