news 2026/3/19 1:16:10

Red Hat为英伟达Vera Rubin AI平台定制RHEL操作系统

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Red Hat为英伟达Vera Rubin AI平台定制RHEL操作系统

基于与芯片公司的持续合作伙伴关系,Red Hat承诺为英伟达新发布的Vera Rubin平台提供"第0天"支持,该平台将于今年晚些时候发布。

这家企业开源软件公司旨在缩小英伟达硬件平台发布与其自有支持软件堆栈正式发布之间的时间差,为Rubin平台设计了其旗舰操作系统Red Hat Enterprise Linux(RHEL)的定制版本。

英伟达的Vera Rubin平台旨在降低AI推理成本。该平台基于新的CPU、GPU和数字处理单元(DPU)构建,所有组件都与其他组件紧密集成。

据Red Hat发言人透露,该平台和Red Hat的软件都预计在2026年下半年推出。

当Rubin平台发布时,Red Hat存储库将提供经过验证的英伟达GPU OpenRM驱动程序和CUDA工具包。

Red Hat的软件还能够在英伟达新发布的机密计算安全架构框架内运行AI生命周期,该架构提供工作负载保护的加密证明。

除了RHEL,Red Hat还将为Rubin发布适用于Kubernetes的Red Hat OpenShift平台,Red Hat AI平台将扩展对分布式推理的支持,在Red Hat AI推理服务器、Red Hat Enterprise Linux AI和Red Hat OpenShift AI上支持英伟达的开源模型。

英伟达首席执行官黄仁勋在2025年消费电子展(CES)的主题演讲中介绍了Vera Rubin。该平台以美国天文学家薇拉·弗洛伦斯·库珀·鲁宾命名,她发现了占据宇宙大部分空间的暗物质。

这个平台承担着另一项艰难使命:降低运行大规模AI推理工作负载不断飙升的计算成本和电力使用成本。

通过工程化设计使组件更紧密地协同工作,Vera Rubin可以将训练模型的推理Token成本降低10倍,同时比传统用于此类任务的英伟达Blackwell平台少使用4倍的GPU。

该平台的以太网光子交换系统还承诺提供5倍的功耗效率改进。

Vera是该平台88核CPU的名称,Rubin是GPU的名称,提供50 PFLOPs的数学计算能力(是Blackwell的5倍)。英伟达BlueField-4 DPU还提供进一步的计算加速。这些处理单元都与NVLink 6交换机、英伟达ConnectX-9 SuperNIC和英伟达Spectrum-6以太网交换机紧密结合——所有这些都采用英伟达芯片制造。

随着公司加大AI投入,他们发现通过GPU最高效完成的推理工作成本越来越高。

本周,亚马逊云服务(AWS)将其GPU成本上调了15%。

推理成本确实一直是英伟达高管关注的问题。该公司还与Groq签署了200亿美元的推理和编译器技术许可协议。

在主题演讲中,英伟达的黄仁勋谈到了最近AI系统中推理使用的急剧增加。不仅模型本身变得更大,推理量本身也急剧增长。推理不再用于产生单一的"一次性"答案,而是一个"思考过程",通常涉及多个模型和额外的后训练。

因此需要更多推理计算。

"现在有强化学习,本质上是计算机尝试不同迭代学习如何执行任务,"黄仁勋说。"预训练、后训练、测试时扩展的计算量因此爆炸性增长。"

Anthropic联合创始人兼首席执行官Dario Amodei在声明中指出:"英伟达Rubin平台的效率提升代表了那种能够实现更长记忆、更好推理和更可靠输出的基础设施进步。"

除了Red Hat(隶属于IBM),其他承诺支持Rubin平台的公司还包括:AWS、Anthropic、思科、CoreWeave、戴尔、谷歌、HPE、Lambda、联想、Meta、微软、Mistral AI、OpenAI、甲骨文云基础设施(OCI)等众多公司。

Q&A

Q1:Vera Rubin平台是什么?有什么特别之处?

A:Vera Rubin是英伟达新发布的AI平台,专门用于降低AI推理成本。该平台基于新的CPU、GPU和数字处理单元构建,通过紧密集成的组件设计,可以将训练模型的推理Token成本降低10倍,同时比传统Blackwell平台少使用4倍GPU。

Q2:Red Hat为Vera Rubin平台提供什么支持?

A:Red Hat承诺为Vera Rubin平台提供"第0天"支持,包括定制版本的RHEL操作系统、经过验证的英伟达GPU OpenRM驱动程序和CUDA工具包。还将发布适用于Kubernetes的Red Hat OpenShift平台,并扩展Red Hat AI平台对分布式推理的支持。

Q3:Vera Rubin平台什么时候能够使用?

A:根据Red Hat发言人透露,Vera Rubin平台和Red Hat的配套软件都预计在2026年下半年正式推出。目前已有AWS、谷歌、微软、OpenAI等众多公司承诺支持该平台。


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/15 15:11:13

大模型中Rag的介绍

检索增强生成(Retrieval-Augmented Generation,简称 RAG)是大模型(LLM)领域中一种结合外部知识检索与语言生成的关键技术,旨在解决大语言模型的三大核心缺陷: 知识滞后性(训练数据截…

作者头像 李华
网站建设 2026/3/16 0:59:02

学霸同款2026 TOP8 AI论文网站:专科生毕业论文神器测评

学霸同款2026 TOP8 AI论文网站:专科生毕业论文神器测评 推荐1:「千笔AI」—— 一站式学术支持“专家”,学术写作全场景王者(推荐指数:★★★★★) 在众多AI论文工具中,「千笔AI」无疑是一款极具…

作者头像 李华
网站建设 2026/3/15 20:59:35

MediaPipe Hands部署技巧:跨平台兼容性解决方案

MediaPipe Hands部署技巧:跨平台兼容性解决方案 1. 引言:AI 手势识别与追踪的工程挑战 随着人机交互技术的演进,手势识别正逐步成为智能设备、虚拟现实、远程控制等场景中的核心感知能力。Google 开源的 MediaPipe Hands 模型凭借其轻量级架…

作者头像 李华
网站建设 2026/3/18 5:08:36

手势识别入门必看:MediaPipe Hands环境

手势识别入门必看:MediaPipe Hands环境 1. 引言:AI 手势识别与追踪 随着人机交互技术的不断演进,手势识别正逐步成为智能设备、虚拟现实、增强现实乃至智能家居中的核心感知能力。传统的触控和语音交互虽已成熟,但在某些场景下&…

作者头像 李华
网站建设 2026/3/15 19:10:07

Nodejs和vue框架的医疗设备维护平台_医院设备维修系统-- 项目源码

文章目录Node.js与Vue医疗设备维护平台项目摘要--nodejs技术栈--结论源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!Node.js与Vue医疗设备维护平台项目摘要 该医疗设备维护平台基于Node.js后端与Vue.js前端构建,专为医院设…

作者头像 李华
网站建设 2026/3/15 19:10:04

【无人机三维路径规划】基于鳄鱼伏击算法CAOA多无人机协同集群避障路径规划(目标函数:最低成本:路径、高度、威胁、转角)附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。 🍎 往期回顾关注个人主页:Matlab科研工作室 👇 关注我领取海量matlab电子书和数学建模资料 &#x1…

作者头像 李华