news 2026/5/30 20:39:42

2026年5月AI模型性能排行:代码能力Claude霸榜,智谱GLM杀入前十

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
2026年5月AI模型性能排行:代码能力Claude霸榜,智谱GLM杀入前十

hello,小伙伴们,大家好啊,我是你们的大飞~

现在AI发展的实在是太快了,所以我们不得不每个月进行一次排行榜解读,感谢AI给小编赏口饭吃😂

小Tips:以下的排行数据主要来自于海外的一些测评机构,以最新的榜单为准。

AI使用量排行

主要统计API的使用总量(不包含网页对话这种)

Google、Claude、OpenAI、DeepSeek在API上面的使用量排名前4

符合直觉,前者因为足够强大,后者因为足够便宜😂

AI多维度排行

第一个是聪明程度,第二个是反应速度,第三个是它的价格对比

  • 聪明度 & 速度:OpenAI 遥遥领先,基本属于“独占一档”的存在

  • 价格:OpenAI 同样遥遥领先……毕竟好东西不便宜

  • 国产AI:智能和速度上稍逊一筹,但DeepSeek 和小米的价格低得离谱,性价比之王(虽然OpenAI也有价格低的选择,但模型太傻了🤣)

下面呢是各个AI在每个细分领域的排名,咱们一个个看~

文本生成(长思考)

在纯文本生成(写文章、对话、总结等)任务上,Claude独占了前四名,Google Gemini紧随其后,分别在第6名和7名

Claude 写出来的东西确实更有“人味儿”,而 Google 则在多语言和长上下文中表现更加优秀

代码编程

Claude 无疑是霸榜的存在了,代码编程永远的神!

但令我感到惊喜的是,我们国产的智谱AI(GLM)竟然在代码生成方面杀进了前十,甚至干掉了 OpenAI 👍

小编还真没有使用过智谱AI的模型,这次可要去试试了🙃

数学推理

数学推理一直是AI的“智商检测器”。不仅仅是复杂数学推理,也包括我们以前的那种脑筋急转弯:50米去洗车要不要开车?🙉

Google Gemini拿下第一,OpenAIClaude紧随其后。国产的模型又没上榜🫩

文生图

曾经非常火的Nano Banana已经跌落至第三名了,第一名的是GPT-image2

但AI在文生图方面还属于起步阶段,这个排名可能很快就会发生变化

文生视频

终于国产模型发力了:字节跳动、阿里巴巴通通上榜。Google、OpenAI也是紧随其后

文生视频也是起步阶段,变化非常快。不过很开心我们国产的模型走到了世界的前列

小担忧

排行榜看完了,但不知道小伙伴们有没有一种感受:AI开始“无孔不入”了

以前坐公交,车上放的是激情澎湃的保健品广告(虽然也很烦人);但现在全是AI合成的老年旅游宣传。刷短视频,十个里头五六个是AI演员、AI短剧、AI配音。连综艺节目的旁白,都换成了冷冰冰的AI阅读,感觉活在了赛博朋克的世界。

小编并不是反对AI,但是滥用就是另外一回事了,希望我们的发展可以兼顾速度与人文吧~

你觉得现在的AI是“真香”还是“泛滥”了?评论区聊聊👋

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/30 20:33:51

让AI更懂你的代码

要让AI(无论是Copilot、Cursor,还是未来的通用AI Agent)真正“懂”你的代码,不能靠魔法,而要靠信息。AI的本质是概率预测,它需要从你的代码库中提取最清晰的信号。如何构建一个“AI友好”的优秀项目。核心思…

作者头像 李华
网站建设 2026/5/30 20:33:19

「斯隆奖」得主戴亮全职加盟复旦

Jay 发自 凹非寺量子位 | 公众号 QbitAI斯隆奖得主戴亮,全职加盟复旦!是的,这位2021年斯隆奖得主,UC Berkeley物理系助理教授,北大物理系校友……现已出任复旦大学物理学系、天文与天体物理研究中心教授。继袁峰、季索…

作者头像 李华
网站建设 2026/5/30 20:27:59

告别排版焦虑:西安交大LaTeX论文模板让你专注学术创新

告别排版焦虑:西安交大LaTeX论文模板让你专注学术创新 【免费下载链接】XJTU-thesis 西安交通大学学位论文模板(LaTeX)(适用硕士、博士学位)An official LaTeX template for Xian Jiaotong University degree thesis (…

作者头像 李华
网站建设 2026/5/30 20:24:45

【自动批处理】使用 Python 编写自动化脚本,对数百个评测问题进行批量并发打分

当数百个评测问题遇上同步阻塞,你可能要等到天荒地老;而当我用 30 行代码让它们排好队同时开工,性能直接拉升了 49.6 倍。 目录 一、引言:从“龟速评测”到“秒级通关” 二、问题诊断:为什么你的评测脚本跑得这么慢? 三、方案设计:构建工业级并发打分评测框架

作者头像 李华