news 2026/5/15 20:39:10

唐杰Karpathy:2025年,大模型从「读博士」到「打工人」的生死跨越

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
唐杰Karpathy:2025年,大模型从「读博士」到「打工人」的生死跨越

2025 年底,中美 AI 界两位顶尖人物不约而同地发布了对 2026 年大模型的深度思考。

一位是唐杰,清华大学教授、智谱 AI 首席科学家,代表了国内最懂大模型落地的工程视角; 一位是Andrej Karpathy,OpenAI 联合创始人、前特斯拉 AI 总监,代表了硅谷最前沿的技术哲学视角。

将两人的观点重叠在一起,我们惊讶地发现:尽管一个是“清华理工男”的严谨逻辑,一个是“硅谷极客”的天马行空,但在核心判断上,他们达成了惊人的共识。

这也是我整理这篇文章的初衷:在这个充满噪音的时代,听听最聪明的大脑在想什么,能帮我们看清 2026 年的方向。

在展开长文之前,有一句话必须置顶高亮。这是唐杰教授提出的观点,也是对所有 AI 从业者的一记当头棒喝:

“AI 模型应用的第一性原理不应该是创造新的 App,它的本质是 AGI 替代人类工作。因此,研发替代不同工种的 AI 才是应用的关键。”

如果你还在绞尽脑汁想做一个什么“AI+X”的新产品,请停下来反复咀嚼这句话:AI 的终局不是工具,而是员工。

以下是两人观点的深度融合与复盘。

01 训练范式剧变:从「背书」到「做题」

过去几年,我们训练大模型像是在“填鸭式教育”:喂更多的数据(预训练),让它背诵世界的知识。

唐杰指出:预训练没死,但它不再是唯一的主角。光有智商(预训练)不行,现在的模型容易“偏科”。为了刷榜单(Benchmark),很多模型在做题,但在真实复杂的场景下却无法解决问题。

Karpathy进一步揭示了 2025 年最大的技术变量——RLVR(可验证奖励的强化学习)。 这标志着训练范式的根本性升级:

  • 以前(SFT):老师给标准答案,模型照葫芦画瓢。

  • 现在(RLVR):把模型扔进水里,只要能游到对岸(得出正确结果),不管你用什么姿势。

这种变化让模型产生了一种类似“顿悟”的能力。它开始学会把大问题拆解、学会自我反思、学会走错了回头重来。

共识:预训练是让模型读完九年义务教育,而接下来的重点是“中后训练”(Mid/Post-training),是把模型扔进残酷的职场(真实场景),让它在不断的试错和反馈中学会真正的推理。

02 智能的本质:从「理论博士」到「打工人」

模型读了那么多书,为什么还是干不好活?

唐杰用了一个非常精准的比喻:

“如果没有 Agent 能力,大模型就是个‘理论博士’。书读得再多,如果不能动手解决问题,那也只是知识的容器,产生不了生产力。”

Agent(智能体)就是让模型从“会说”进化到“会做”的关键。

Karpathy对此有着同样的观察,但他更进了一步。他认为 Agent 不应该只是云端的 API,而应该“住在你的电脑里”。 他以 Claude Code 为例,强调未来的 AI 就像你电脑里的一个小精灵:它能直接操控你的终端,能读取你的本地文件,能像一个坐在你身边的程序员一样,和你并肩作战。

警示:唐杰特别提到,领域大模型可能是个伪命题。 企业想用领域 Know-how 构建护城河,把 AI 驯化为工具。但在 AGI 的海啸面前,一切领域壁垒最终都会被卷入主模型。所谓的“行业专用”,可能只是通往 AGI 路上的一座临时避难所。

03 应用的真相:Vibe Coding 与工种替代

这是对普通人影响最大的一层逻辑。

Karpathy发明了一个新词:Vibe Coding(氛围编程)。 意思是,你完全不需要懂代码,只需要用自然语言描述你的需求(Vibe),AI 就能把程序写出来。代码变得像草稿纸一样廉价、即用即弃。

这不仅仅是编程方式的改变,而是生产关系的重构。

这就回到了唐杰那句振聋发聩的“第一性原理”:

  • 创业者的误区:我要开发个什么软件给用户用?

  • 正确的思考:我要造一个什么样的 AI 员工,去把某个岗位的人力成本砍掉?

Chat 已经部分替代了搜索,下一步就是替代客服、替代初级程序员、替代数据分析师。 2026 年的爆发点,不在于诞生了多少新 App,而在于“Cursor for X”——即各行各业都会出现像 Cursor 替代程序员一样,去替代其他工种的 AI 形态。

04 下一个瓶颈:记忆、在线学习与“参差不齐”

未来虽然美好,但两位专家都保持了极度的清醒,指出了当下的硬伤。

1. 记忆是刚需,但还没做对

唐杰指出,模型不仅要有短期的 Context(便签纸),还需要像人类一样的海马体(中期记忆)和大脑皮层(长期记忆)。目前的 RAG(检索增强)只是权宜之计,真正的长期记忆需要模型能实时更新自己的参数——这目前还是未解难题。

2. 参差不齐的智能(Jagged Intelligence)

Karpathy提醒我们,AI 不是在养动物,而是在“召唤幽灵”。因为优化目标不同,AI 的智力极度不均衡:它上一秒像个全知全能的学者推导复杂公式,下一秒就可能犯小学生都不会犯的低级错误。 这种“锯齿状”的智力分布,是目前大规模商用的最大隐患。

3. 在线学习(Online Learning)

现在的模型是“离线”的,训练好就不变了。唐杰认为,下一个 Scaling 范式可能在于让模型具有“自我评估”的能力——知道自己对不对,才能在工作中边用边学,越用越聪明。

结语:2026 年的路线图

把唐杰和 Karpathy 的观点拼在一起,我们得到了一张清晰的路线图:

  • 当下:预训练依然有效,但重心转移到了 RLVR 和后训练,提升模型的“推理”和“做题”能力。

  • 近期:Agent 是突破口,目标是让 AI 具备“手脚”,从云端落地到本地,从聊天框进入操作系统。

  • 中期:解决记忆和在线学习,让模型具备自我迭代的能力。

  • 长期:工种替代。所有中间形态的工具软件,最终都将被“AI 员工”取代。

正如 Karpathy 所说:“大模型比我预期的聪明,也比我预期的蠢。”

2025 年,泡沫会挤出,但技术在加速。对于我们每一个人来说,思考的维度不应再是“如何使用工具”,而是“如何管理你的 AI 员工”。

(完)

整理自唐杰微博长文及 Andrej Karpathy 2025 LLM 年度回顾

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/12 8:05:48

系统学习UDS 28服务与ISO 14229标准对接

深入理解UDS 28服务:从标准到实战的通信控制全解析在现代汽车电子系统中,随着ECU数量激增和网络复杂度提升,如何高效、安全地管理车载通信已成为诊断开发的核心课题。你是否曾在OTA刷写时遭遇总线拥塞?是否在产线测试中因响应风暴…

作者头像 李华
网站建设 2026/5/1 6:58:35

16. 普通函数调用开销

1.普通函数调用开销 2.内联函数1.普通函数调用开销 普通函数调用不是"直接执行函数代码", 而是需要先做"准备工作", 执行完毕后还要做"收尾工作", 再加上指令跳转的损耗这三部分共同构成了调用专属开销("这部分开销和函数体本身的业务逻辑执…

作者头像 李华
网站建设 2026/5/3 6:42:25

Elasticsearch下载Windows系统适配核心要点解析

Elasticsearch 在 Windows 上的本地部署实战:从下载到稳定运行 你是不是也曾在项目初期,面对日志查询慢、数据检索困难的问题,想要快速搭建一个高效的搜索系统? Elasticsearch 正是为此而生。它不是什么高不可攀的黑科技&#…

作者头像 李华
网站建设 2026/5/3 7:09:01

【鸿蒙开发实战】HarmonyOS单词库应用

核心功能:添加单词:输入英文单词和中文释义删除单词:每个单词项都有删除按钮搜索功能:实时搜索单词或释义统计信息:显示单词总数界面特点:简洁的Material Design风格两种视图模式:列表视图和添加…

作者头像 李华
网站建设 2026/5/12 8:08:28

fastbootd在A/B分区系统中的角色分析:系统启动必看

fastbootd:A/B系统里的“应急维修站”,你真的懂吗?想象一下,你的手机OTA升级失败,屏幕卡在开机画面动弹不得——这时候,你是希望拆机连线、重刷整个固件,还是能通过一根数据线,在几秒…

作者头像 李华
网站建设 2026/5/1 7:51:38

uds31服务请求格式在CANoe中的配置方法:新手教程

uds31服务在CANoe中的实战配置:从协议到脚本的完整指南你有没有遇到过这样的场景?产线刷写ECU时突然失败,提示“预条件未满足”;安全访问总卡在第二步,日志里只看到一串NRC0x22;测试人员反复手动操作同一组…

作者头像 李华