news 2026/6/24 3:44:45

Milvus 2.6.1 CAGRA:GPU建索引+CPU查,成本腰斩性能不减

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Milvus 2.6.1 CAGRA:GPU建索引+CPU查,成本腰斩性能不减

Milvus上的CAGRA有什么不同?

尽管GPU在图索引构建阶段优势显著,但在实际生产环境中,GPU资源通常比CPU更昂贵且稀缺。若索引构建与查询均依赖GPU,会导致一系列问题:

资源利用率低(查询请求零散,GPU大量时间空闲)

 

部署成本高(需为每个查询服务配置GPU,增加不必要的硬件成本)

扩展性受限(GPU数量限制服务实例数)

灵活性不足(无法按需切换 GPU 和 CPU )

针对这些痛点,开源向量数据库Milvus在2.6.1版本中,通过adapt_for_cpu参数,为GPU索引CAGRA推出灵活部署选项,实现GPU构建高质量图索引+CPU查询(一般用 HNSW )的混合模式,在保证索引质量的同时大幅降低部署成本。对于数据更新频率低(无需频繁重新构建索引)、查询规模大(需大量查询服务实例)、成本敏感(希望降低GPU资源投入)的场景,这是一种非常实用的解决方案。

(1)adapt_for_cpu解读

Milvus通过adapt_for_cpu

 

参数控制CAGRA索引的序列化与反序列化行为,实现构建与查询设备的灵活切换。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/22 19:43:38

水闸安全自动化监测系统主要应用场景

水闸安全自动化监测系统是集现代传感技术、数据通信技术、计算机技术和信息处理技术于一体的综合性安全监测平台。该系统通过在水闸关键部位布设各类传感器,实现对水闸运行状态参数的实时、连续、自动采集,并通过数据传输网络将监测数据发送至中心数据库…

作者头像 李华
网站建设 2026/6/17 17:27:53

transformer模型详解进阶篇:Qwen3-32B注意力机制剖析

Qwen3-32B注意力机制深度解析:从长上下文到高效推理的工程实践 在大模型落地进入深水区的今天,一个核心问题愈发凸显:如何在有限算力下实现接近顶级闭源模型的语言理解与生成能力?尤其当企业面对真实业务场景——比如分析整本法律…

作者头像 李华
网站建设 2026/6/23 12:06:25

powershell 入门及简单应用

poweshell介绍 官方介绍:https://docs.microsoft.com/zh-cn/powershell/scripting/overview?viewpowershell-5.1 Windows PowerShell 是一种命令行外壳程序和脚本环境,使命令行用户和脚本编写者可以利用 .NET Framework的强大功能。 .NET Framework …

作者头像 李华
网站建设 2026/6/23 21:19:57

如何在本地GPU运行Qwen3-8B?超详细docker安装教程

如何在本地GPU运行Qwen3-8B?超详细Docker安装教程在生成式AI迅猛发展的今天,越来越多开发者希望将大语言模型(LLM)部署到本地环境——不仅为了数据隐私与安全,更是为了摆脱对云端API的依赖,实现低延迟、可定…

作者头像 李华
网站建设 2026/6/22 15:17:40

基于虚拟同步发电机控制的并网逆变器simulink建模与仿真

目录 1.算法仿真效果 2.MATLAB源码 3.算法概述 1.算法仿真效果 matlab2022b仿真结果如下: 2.MATLAB源码 %**************************************************************************************** %订阅用户可以获得任意一份完整代码,私信博主,留言文章链接和邮箱地…

作者头像 李华
网站建设 2026/6/23 17:17:55

基于自适应柯西分布的人工蜂群算法函数寻优算法matlab仿真

目录 1.算法仿真效果 2.MATLAB源码 3.算法概述 1.算法仿真效果 matlab2022a仿真结果如下: 2.MATLAB源码 %**************************************************************************************** %订阅用户可以获得任意一份完整代码,私信博主,留言文章链接和邮箱地…

作者头像 李华