news 2026/5/23 20:22:29

AI动态简报之算力基建篇(2026.05.23)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI动态简报之算力基建篇(2026.05.23)

关注方向:大模型 · GPU算力 · AI芯片 · 云计算 · 大模型API


⚡ 第1条:智谱GLM-5.1高速版API刷新全球速度上限

核心信息

智谱发布GLM-5.1高速版API(GLM-5.1-highspeed),输出速度达400 tokens/s,刷新全球大模型厂商API速度纪录。首次在国产大模型中将旗舰级模型能力与极致低延迟同时带入生产环境,打破"高速模型=轻量级模型"的行业惯例。

性能/价格对比

  • 输出速度:400 tokens/s(全球大模型API速度上限)
  • 对比:传统高速API通常在100-200 tokens/s,旗舰模型往往牺牲速度换取质量
  • 适用场景:AI编程、实时交互、商业决策、实时语音等速度敏感场景

对开发者/企业的影响

AI编程场景可"10倍速"写代码;3D游戏实时建模、即时交互界面生成等此前因延迟无法实现的产品形态开始具备落地可能。目前通过智谱MaaS平台向部分企业客户开放。

信息来源:新浪财经(格隆汇) | 2026-05-22


⚡ 第2条:阿里云发布真武M890芯片+Qwen3.7-Max,全栈AI能力再升级

核心信息

2026年5月20日阿里云峰会上,阿里巴巴发布新一代自研AI芯片平头哥真武M890(已搭载于超节点服务器)及最新旗舰模型Qwen3.7-Max,同时推出适配Agent的产品官网"千问云"并优化百炼平台。

性能/价格对比

  • 真武M890:平头哥芯片累计交付已超47万片(2026年3月数据),本次为新一代升级版
  • Qwen3.7-Max:今年以来日均Token收入增长15倍,MaaS服务已实现盈利
  • 市场地位:阿里云CTO刘伟光表示,在AI云增量市场、大语言模型市场、推理市场"已拿到大部分"

对开发者/企业的影响

阿里云在金融、汽车、政务、运营商等核心行业依靠庞大客户规模形成壁垒;开发者可通过百炼平台调用Qwen3.7-Max,Agent开发者可直接使用"千问云"官网构建应用。

信息来源:财新网 | 2026-05-21


⚡ 第3条:2026年中国AI应用爆发——日均Token调用量突破140万亿

核心信息

量子位第四届中国AIGC产业峰会(5月20日)发布《2026年中国AI应用全景图谱报告》:2026年4月国内AI应用Web端月访问量突破9亿,APP端月下载量超2.4亿,日活同比增长223%;中国日均Token调用量突破140万亿,两年增长超千倍。

性能/价格对比

  • Token调用量:140万亿/天(2026年4月),两年增长超1000倍
  • Agent单次Token消耗达传统AI的百倍
  • DeepSeek V4-Pro API价格仅0.025元/百万tokens,为GPT-5.5的七分之一
  • 模型普惠化趋势明显,价格战持续

对开发者/企业的影响

AI应用进入爆发期,Web端AI效率办公用户活跃份额超七成,AI创作APP端日活同比增长449%;企业AI化门槛大幅降低,但同时也面临Token成本管控挑战(Agent消耗为传统AI百倍)。

信息来源:凤凰网科技 | 2026-05-20


⚡ 第4条:算力租赁市场井喷——160亿至190亿元大单落地

核心信息

2026年中国智能算力规模预计达1460.3 EFLOPS,为2024年的两倍。算力租赁市场景气度高企,A股上市公司密集抛出亿元级算力采购订单。5月东阳光(600673.SH)控股子公司签署《算力服务采购框架合同》,合同预计总金额高达160亿元至190亿元。

性能/价格对比

  • 2026年中国智能算力规模:1460.3 EFLOPS(为2024年的2倍)
  • 东阳光算力采购大单:160亿~190亿元(2026年5月)
  • 2025年云计算企业注册量17.1万家,创近十年峰值,同比增长19.8%
  • 截至2026年5月,云计算相关专利累计3.0万项,发明专利占比近90%

对开发者/企业的影响

算力供给持续扩张,租赁成本有望随规模效应下降;中小企业通过云平台获取算力的门槛降低,但头部大客户锁定优质算力资源可能引发阶段性供需紧张。云计算正从"资源池"向"算力+模型+服务"全栈形态演进。

信息来源:新浪财经 | 2026-05-22


⚡ 第5条:大模型商业化变局——Anthropic年收入440亿美元反超OpenAI

核心信息

2026年5月大模型产业商业化加速分化:Anthropic年化收入达440亿美元,超越OpenAI的250亿美元;字节跳动年度资本开支预计突破2000亿元,阿里巴巴未来AI相关支出将远超3800亿元;北美四大科技巨头2026年合计资本开支预计达6500亿美元。消费端涨价潮来袭——智谱价格上调83%,行业从"流量争夺"转向"价值收割"。

性能/价格对比

  • Anthropic年化收入:440亿美元 vs OpenAI:250亿美元(Anthropic反超)
  • 字节跳动年度资本开支:突破2000亿元
  • 阿里巴巴未来AI支出:远超3800亿元
  • 北美四大科技巨头合计资本开支:6500亿美元(2026年预计)
  • Gartner预测全球数据中心支出增长:55.8%
  • 智谱API价格涨幅:+83%(消费端)

对开发者/企业的影响

API成本存在上行压力,企业需建立Token成本管控机制;OpenAI在30天API测试中消耗6030亿Token、成本130.5万美元,关闭"极速模式"可降低77%成本——模型效率优化成为企业竞争力关键。同时,头部厂商资本开支狂奔,中小玩家生存空间进一步压缩。

信息来源:ITBEAR科技资讯 | 2026-05-19


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/23 20:21:10

Taotoken的Token Plan套餐如何帮助初创团队控制AI成本

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Taotoken的Token Plan套餐如何帮助初创团队控制AI成本 1. 从按需计费到预算规划 对于初创团队和独立开发者而言,在项目…

作者头像 李华
网站建设 2026/5/23 20:20:09

接口自动化测试流程详解

🍅 点击文末小卡片 ,免费获取软件测试全套资料,资料在手,涨薪更快先了解下接口测试流程:1、需求分析 2、Api文档分析与评审 3、测试计划编写 4、用例设计与评审 5、环境搭建(工具) 6、执行用例 …

作者头像 李华
网站建设 2026/5/23 20:19:06

学习笔记·敏捷开发

“嗨,阿米戈!” “嗨,比拉博!” “今天我要给大家讲讲程序通常是怎么开发的。” “在 20 世纪,当现代 IT 还处于起步阶段时,每个人似乎都认为编程就像建筑或制造。” “事情通常是这样的:” “客户会解释他需要的程序类型——它应该做什么以及应该如何做。” “业…

作者头像 李华
网站建设 2026/5/23 20:14:58

法律科技的发展脉络:从数字化管理到AI辅助办案的演进路径

摘要 执业15年,我经历了律师行业工具变迁的三个阶段:纸质时代、本地软件时代、云端时代。现在正站在第四个阶段的起点——AI辅助办案。这篇文章回顾法律科技的发展脉络,分析每个阶段的特征和局限性,以及正在发生的变化趋势。 第一…

作者头像 李华