news 2026/5/2 21:57:09

海外 AI 硬件初创 9 强盘点:给中国企业的突围启示

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
海外 AI 硬件初创 9 强盘点:给中国企业的突围启示

近期在「X-TECHCON科技区角」看到一篇关于海外 AI 硬件初创公司的盘点文章,了解到一批海外初创企业正以差异化技术路线与精准场景定位快速突围。据英伟达预测,AI 基础设施领域 10 年内市场规模将达 4 万亿美元,这些企业的产品布局、技术创新与商业化路径,不仅为全球 AI 硬件产业注入新活力,更为正处于技术攻坚与生态构建关键期的中国 AI 硬件企业,提供了可对标借鉴的方向与产品参考样本。

一、核心赛道聚焦:海外初创企业的差异化突围方向

海外初创企业未盲目跟风通用 GPU 赛道,而是围绕 AI 硬件产业的 “痛点场景” 与 “技术空白” 布局,形成三大核心赛道,:

  1. 边缘计算与专用 AI 芯片:针对边缘设备 “低功耗、低成本” 需求,以及数据中心推理场景 “高能效比” 需求,突破传统 GPU 的功耗瓶颈,如 Axelera AI 的边缘芯片、FuriosaAI 的推理芯片;
  2. 网络与连接解决方案:解决 AI 数据中心 “高带宽、低延迟、无拥塞” 痛点,涵盖光互连技术(Celestial AI)、高速横向扩展网络(Cornelis Networks)、800G DPU(Xsight Labs);
  3. 系统级与架构创新:从 “单一芯片” 向 “机柜级解决方案”“开源架构” 延伸,如 D-Matrix 的解耦式机柜系统、Tenstorrent 的 RISC-V 授权与 Chiplet 规范,降低客户落地门槛。

二、企业盘点

1. Axelera AI(荷兰)—— 边缘计算 AI 芯片的 “功耗 - 性能” 平衡典范

  • 聚焦边缘场景,新款 “Europa” 芯片在 45 瓦功耗下实现 629 TOPS 运算性能,较前代(4-8 瓦 / 214 TOPS)性能提升近 3 倍,完美适配工业物联网、智能终端等边缘设备 “算力够用即可,功耗优先” 的需求;
  • 启动全球合作伙伴加速网络,首批纳入联想、戴尔等设备制造商与 Astute Group 等分销商,快速打通 “芯片 - 终端设备” 落地链路;
  • 中国企业参考点:边缘计算芯片无需追求 “极致算力参数”,应优先平衡 “功耗 - 性能 - 成本” 三角关系,同时通过绑定设备厂商生态缩短商业化周期,尤其适配国内 “东数西算” 中边缘节点的算力需求。

2. Celestial AI(美国)—— 光互连技术破解数据中心带宽瓶颈

  • 以自研 Photonic Fabric 光互连技术,替代传统电信号传输,解决大规模 AI 集群的带宽不足与延迟过高问题,重塑数据中心总拥有成本(TCO)标准;
  • 完成 2.55 亿美元 C1 轮融资(总额达 5.2 亿美元),投资方含富达、贝莱德、三星等,资金专项用于量产供应链资质认证,确保技术从实验室走向商用;
  • 中国企业参考点:可对标布局 “光电子 + AI 硬件” 融合技术,尤其在国内超算中心、智算集群建设中,光互连是突破传统 IB 网络成本与带宽瓶颈的关键方向,同时需联合资本加速供应链成熟。

3. Cornelis Networks(美国)—— 横向扩展网络的 “无损耗” 实践

  • 源于英特尔 Omni-Path 架构,800-Gbps CN5000 系列支持 Ethernet RoCEv2 与 Ultra Ethernet,每秒处理 160 万条消息,性能优于 InfiniBand 与传统以太网同类产品;
  • 400-Gbps 产品集成至联想 ThinkSystem 服务器,加入美国能源部 “创世纪计划”(AI 推动科学研究),实现 “技术 - 行业场景” 深度绑定;
  • 中国企业参考点:在国内智算中心建设中,可借鉴其 “网络与服务器厂商深度适配” 模式,同时关注 “无损耗、低拥塞” 技术对 AI 训练效率的提升,尤其适配国产服务器与芯片的互联需求。

4. D-Matrix(美国)—— 存算一体与机柜级方案的 “解耦” 思路

  • 基于数字存算技术,推出业界首款标准化架构解耦式机柜级方案 “SquadRack”,搭载自研 Corsair 芯片与博通 PCIe 交换机,专为超低延迟批量推理设计;
  • 完成 2.75 亿美元融资(投后估值 20 亿美元,微软 M12 参投),推进全球化部署,解决大模型推理场景 “算力密度低、部署灵活度差” 问题;
  • 中国企业参考点:国内企业可对标 “存算一体 + 模块化机柜” 设计,尤其在大模型推理商业化落地中,解耦式架构能降低客户对特定硬件的依赖,适配不同规模企业的算力需求。

5. FuriosaAI(韩国)—— 推理芯片的 “每瓦性能” 竞争力

  • RNGD 芯片在大语言模型推理场景下,每瓦性能较英伟达 A100 提升 2.25 倍;NXT RNGD 服务器单机柜算力达英伟达 H100 SXM 系统的 3.5 倍,功耗仅 3 千瓦;
  • 拒绝 Meta 8 亿美元收购要约,坚持自主发展,引入 LG 人工智能部门作为客户,验证产品在大企业场景的可用性;
  • 中国企业参考点:在国产 AI 芯片 “算力追赶” 的同时,可优先聚焦 “每瓦性能” 这一核心指标 —— 尤其国内数据中心电费成本占比高,高能效比芯片能显著降低客户长期 TCO,增强市场竞争力。

6. NextSilicon(以色列)—— 芯片 “兼容性” 与 RISC-V 架构的突破

  • “Maverick-2” AI 芯片性能达主流旗舰 GPU 的 10 倍,功耗降低 60%,且无需修改软件代码即可适配现有模型;自研 Arbel RISC-V 内核,性能超越英特尔 Lion Cove、AMD Zen 5 架构;
  • 计划第四季度量产,聚焦算法复杂度高的 AI 负载场景,主打 “高性能 + 低适配成本”;
  • 中国企业参考点:国产 RISC-V 芯片可对标其 “兼容现有软件生态” 的设计思路,减少开发者代码重构成本;同时,在 AI 芯片研发中,“无需改代码” 的兼容性是吸引客户迁移的关键门槛。

7. Rebellions(韩国)—— 机柜级芯片的 “高利用率” 设计

  • REBEL-Quad 芯片在 Llama 3.3 70B 模型测试中,吞吐量超英伟达 H200 1.6 倍,功耗降低 50%,解决大规模算力集群 “利用率低、能耗高” 问题;
  • 完成 2.5 亿美元 C 轮融资(Arm、三星参投),聘请前 SambaNova、甲骨文高管拓展全球业务,强化 “技术 - 市场” 对接能力;
  • 中国企业参考点:在国产大模型训练集群建设中,可借鉴其 “机柜级算力整合” 思路,通过硬件优化提升算力利用率 —— 当前国内异构集群利用率普遍仅 30%-40%(据新浪新闻数据),高利用率设计能直接降低客户算力投入成本。

8. Tenstorrent(加拿大)——“开源 + 授权” 的生态化商业模式

  • 创新 “销售处理器 + 开源软件 + 技术授权 + 合作开发” 模式,推出 Blackhole PCIe 加速卡、Ascalon RISC-V CPU 技术,披露 Open Chiplet Atlas 规范,降低第三方企业的芯片设计门槛;
  • 洽谈 8 亿美元新融资(估值或达 32 亿美元),与韩国 Moreh 合作推出 AI 数据中心解决方案,强化 “技术 - 生态伙伴” 协同;
  • 中国企业参考点:国产芯片企业可借鉴其 “开源生态” 思路 —— 当前国内存在 “工具链碎片化、跨平台开发成本高” 问题(如寒武纪与昇腾框架不兼容),通过开源软件与授权模式,可加速国产芯片的生态适配。

9. Xsight Labs(以色列)——800G DPU 的 “全可编程” 与场景覆盖

  • E1 系列 800G DPU 支持控制平面与数据通路全可编程,集成网络、安全、存储、计算功能,适配边缘服务器与数据中心场景,功耗较同类产品降低 30%;
  • 与 EdgeCore、Hammerspace 等合作,推出 PCIe 形态 800G 数据处理器、AI 存储解决方案,实现 “芯片 - 行业场景” 快速落地;
  • 中国企业参考点:国内 DPU 研发可对标 “全可编程 + 多场景适配” 设计,尤其在 “东数西算” 边缘节点与 AI 存储需求中,DPU 作为 “算力调度核心”,能提升边缘设备的一体化处理能力。

三、对中国企业的核心启示:从 “技术对标” 到 “生态落地” 的可借鉴方向

  1. 技术路线:避开正面竞争,锚定 “细分痛点”:海外企业的核心突围逻辑是 “不与英伟达拼通用 GPU 算力,而是解决其覆盖不到的痛点”—— 如边缘低功耗、数据中心网络延迟、推理能效比。这对中国企业的启示在于:可聚焦国内 “边缘算力缺口”“智算中心网络瓶颈”“国产大模型推理成本高” 等场景,优先突破 “小而美” 的专用技术,而非盲目追求 “算力参数对标”。
  2. 产品设计:从 “单一芯片” 到 “系统级解决方案”:从 D-Matrix 的机柜级系统、Tenstorrent 的 Chiplet 规范可见,“芯片 + 软件 + 部署方案” 的一体化设计更易获得客户认可。国内企业可借鉴这一思路,尤其针对金融、制造等行业客户,提供 “芯片 + 适配软件 + 行业定制部署” 的全流程方案,降低客户的技术迁移成本。
  3. 生态建设:绑定产业资本与合作伙伴,加速量产落地:海外企业普遍通过引入三星、AMD、联想等产业资本,快速打通 “供应链 - 客户” 链路(如 Axelera AI 的合作伙伴网络、Cornelis 与联想的集成)。国内企业可加强与服务器厂商(如浪潮、曙光)、行业客户(如金融机构、车企)的深度合作,同时借助 “东数西算” 政策红利,推动国产硬件在智算中心的规模化应用。
  4. 架构创新:关注 RISC-V、光互连、Chiplet 等前沿方向:NextSilicon 的 RISC-V 内核、Celestial AI 的光互连、Xsight 的 DPU 可编程架构,均指向 “打破传统 x86+GPU 垄断” 的技术趋势。国内企业可加大对这些前沿架构的投入,尤其 RISC-V 作为国产芯片 “自主可控” 的重要方向,可借鉴 Tenstorrent 的 “技术授权” 模式,加速生态适配;光互连技术则可对标 Celestial AI,解决国产智算集群的带宽瓶颈。

原文链接:https://www.x-techcon.com/article/84173.html

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 7:18:22

上海样册设计指南,如何让企业样册脱颖而出

上海样册设计指南:如何让企业样册脱颖而出小编说:在上海这样竞争激烈的商业环境中,一份出色的企业样册不仅是信息的载体,更是品牌无声的代言人。许多企业在寻找设计服务时,常常困惑于如何让自己的样册在众多同类中脱颖…

作者头像 李华
网站建设 2026/5/2 17:44:14

Kotaemon Helm Chart发布:简化云原生部署流程

Kotaemon Helm Chart发布:简化云原生部署流程 在企业加速拥抱AI的今天,一个现实问题始终困扰着技术团队:为什么一个在本地运行良好的智能问答系统,到了生产环境就频频出错?配置不一致、依赖缺失、资源争用……这些“部…

作者头像 李华
网站建设 2026/5/2 16:31:51

Docker 安装 Redis

Docker 安装 Redis 是开发/生产环境中最常用的方式,核心是在线拉取镜像 自定义配置 数据持久化(避免容器销毁丢失数据)。以下是完整的在线安装步骤(适配 Linux/macOS,Windows 仅需微调路径),兼…

作者头像 李华
网站建设 2026/5/1 17:35:14

FFT 工程关键点总结(采样分辨率 / 频点 / 相位)

本文只讨论 FFT 在嵌入式与工程中的实际含义,不涉及数学推导。一、采样分辨率是什么? 1. 先定义所有变量(很重要)符号含义fs采样率(Hz),每秒采样多少次NFFT 点数(一次参与 FFT 的采样…

作者头像 李华