news 2026/5/9 0:18:25

AI 正在“吃光内存”,NVIDIA与SK海力士把目光投向了 NAND

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI 正在“吃光内存”,NVIDIA与SK海力士把目光投向了 NAND

继大规模蚕食DRAM市场后,英伟达与SK海力士计划推出性能提升近10倍的"AI SSD",引发NAND供应警报。随着AI产业重心从训练转向推理,技术栈需全面升级以构建低延迟、高吞吐环境,行业正聚焦通过NAND芯片打造推理优化的AI存储方案,SK海力士预计在2027年前推出相关解决方案。

AI SSD可以扩展到1亿IOPS,这比传统的企业SSD要大得多。当研究这种解决方案的需求时,很明显,当前的AI工作负载结构需要连续访问大量模型参数,这是HBM或通用DRAM产品无法满足的。AI SSD最终将允许伪内存层,针对AI工作负载进行优化,显著提升模型加载、参数访问以及数据调度效率,为大模型推理带来数量级上的性能改善。

随着传统AI工作负载向推理侧迁移,这一趋势的动因之一在于英伟达已决定在Rubin CPX GPU中集成通用GDDR7内存处理预填充阶段。据有关媒体报道,类似技术路径或将延伸至NAND领域,一系列举措可能彻底重塑NAND产业格局。

近年来,AI 训练和推理对 DRAM 尤其是 HBM 的需求急剧上升,头部厂商的大规模采购几乎锁定了未来一段时间的高端内存产能,供需紧张已经成为行业共识。在这样的背景下,仅依赖 DRAM/HBM 来承载越来越大的模型参数和中间数据,成本和可获得性都在变得越来越不友好。

AI SSD 的出现,本质上是一种向“内存层级外延”要空间的尝试。通过让高性能 NAND 承担部分原本由内存负责的数据访问工作,尤其是在推理场景中对容量和吞吐更敏感、对极致时延要求相对可控的环节,AI SSD 有机会在不显著推高成本的前提下,缓解内存压力,提升整体系统效率。这也意味着,NAND 在 AI 系统中的角色,正在从“冷数据存储”向“主动参与计算的数据层”演进。

从产业链角度看,这并非孤立动作。一方面,DRAM 与 HBM 供给趋紧、价格上行已是公开事实;另一方面,AI 服务器整体配置正在变得越来越“存储密集”,无论是本地推理、企业私有化部署,还是多模型并行运行,对高速、大容量存储的依赖都在明显提升。NVIDIA 与 SK hynix 在这一时间点推动 AI SSD,既是技术演进的结果,也是供应链现实倒逼下的一种必然选择。

对于 AI 服务器供应商和用户而言,这类变化意味着,未来的算力系统不再只是“GPU + 内存”的简单叠加,而是需要从更系统的角度重新审视 计算、内存与存储之间的分工与协同方式。谁能更早理解这种变化,并在架构设计和选型阶段提前做出调整,往往就能在成本、可扩展性和交付确定性上占据主动。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 3:13:51

ThingsBoard智能消息路由:3大策略提升物联网数据处理效率

ThingsBoard智能消息路由:3大策略提升物联网数据处理效率 【免费下载链接】thingsboard Open-source IoT Platform - Device management, data collection, processing and visualization. 项目地址: https://gitcode.com/GitHub_Trending/th/thingsboard 在…

作者头像 李华
网站建设 2026/5/8 19:43:24

WTAPI框架:重新定义微信个人号二次开发的全能解决方案

微信个人号作为国内超13亿用户的核心社交入口(截至2023年Q2),已成为企业私域运营与用户服务的核心阵地。然而,微信原生功能在自动化运营、数据管理及多账号协同等场景中存在显著局限:自动化能力缺失:无法实…

作者头像 李华
网站建设 2026/5/6 0:56:50

Homepage媒体服务集成终极指南:快速配置多平台监控面板

Homepage媒体服务集成终极指南:快速配置多平台监控面板 【免费下载链接】homepage 一个高度可定制的主页(或起始页/应用程序仪表板),集成了Docker和服务API。 项目地址: https://gitcode.com/GitHub_Trending/ho/homepage …

作者头像 李华
网站建设 2026/5/9 11:55:03

如何快速排查Rod自动化脚本中的常见问题

如何快速排查Rod自动化脚本中的常见问题 【免费下载链接】rod A Devtools driver for web automation and scraping 项目地址: https://gitcode.com/gh_mirrors/ro/rod 当你在使用Rod进行浏览器自动化和Web爬虫开发时,是否经常遇到脚本卡死、页面加载异常或元…

作者头像 李华
网站建设 2026/5/3 22:34:52

ONNX预训练模型极速获取攻略:8大方案解决你的下载困扰

ONNX预训练模型极速获取攻略:8大方案解决你的下载困扰 【免费下载链接】models A collection of pre-trained, state-of-the-art models in the ONNX format 项目地址: https://gitcode.com/gh_mirrors/model/models 还在为ONNX模型下载速度慢而烦恼吗&…

作者头像 李华
网站建设 2026/5/9 5:40:08

5个关键技巧:如何用早停策略提升时序模型训练效率?

5个关键技巧:如何用早停策略提升时序模型训练效率? 【免费下载链接】Time-Series-Library A Library for Advanced Deep Time Series Models. 项目地址: https://gitcode.com/GitHub_Trending/ti/Time-Series-Library 还在为时序模型训练时间过长…

作者头像 李华