唐杰Karpathy：2025年，大模型从「读博士」到「打工人」的生死跨越-开发者社区

2025 年底，中美 AI 界两位顶尖人物不约而同地发布了对 2026 年大模型的深度思考。

一位是唐杰，清华大学教授、智谱 AI 首席科学家，代表了国内最懂大模型落地的工程视角；一位是Andrej Karpathy，OpenAI 联合创始人、前特斯拉 AI 总监，代表了硅谷最前沿的技术哲学视角。

将两人的观点重叠在一起，我们惊讶地发现：尽管一个是“清华理工男”的严谨逻辑，一个是“硅谷极客”的天马行空，但在核心判断上，他们达成了惊人的共识。

这也是我整理这篇文章的初衷：在这个充满噪音的时代，听听最聪明的大脑在想什么，能帮我们看清 2026 年的方向。

在展开长文之前，有一句话必须置顶高亮。这是唐杰教授提出的观点，也是对所有 AI 从业者的一记当头棒喝：

“AI 模型应用的第一性原理不应该是创造新的 App，它的本质是 AGI 替代人类工作。因此，研发替代不同工种的 AI 才是应用的关键。”

如果你还在绞尽脑汁想做一个什么“AI+X”的新产品，请停下来反复咀嚼这句话：AI 的终局不是工具，而是员工。

以下是两人观点的深度融合与复盘。

01 训练范式剧变：从「背书」到「做题」

过去几年，我们训练大模型像是在“填鸭式教育”：喂更多的数据（预训练），让它背诵世界的知识。

唐杰指出：预训练没死，但它不再是唯一的主角。光有智商（预训练）不行，现在的模型容易“偏科”。为了刷榜单（Benchmark），很多模型在做题，但在真实复杂的场景下却无法解决问题。

Karpathy进一步揭示了 2025 年最大的技术变量——RLVR（可验证奖励的强化学习）。这标志着训练范式的根本性升级：

以前（SFT）：老师给标准答案，模型照葫芦画瓢。
现在（RLVR）：把模型扔进水里，只要能游到对岸（得出正确结果），不管你用什么姿势。

这种变化让模型产生了一种类似“顿悟”的能力。它开始学会把大问题拆解、学会自我反思、学会走错了回头重来。

共识：预训练是让模型读完九年义务教育，而接下来的重点是“中后训练”（Mid/Post-training），是把模型扔进残酷的职场（真实场景），让它在不断的试错和反馈中学会真正的推理。

02 智能的本质：从「理论博士」到「打工人」

模型读了那么多书，为什么还是干不好活？

唐杰用了一个非常精准的比喻：

“如果没有 Agent 能力，大模型就是个‘理论博士’。书读得再多，如果不能动手解决问题，那也只是知识的容器，产生不了生产力。”

Agent（智能体）就是让模型从“会说”进化到“会做”的关键。

Karpathy对此有着同样的观察，但他更进了一步。他认为 Agent 不应该只是云端的 API，而应该“住在你的电脑里”。他以 Claude Code 为例，强调未来的 AI 就像你电脑里的一个小精灵：它能直接操控你的终端，能读取你的本地文件，能像一个坐在你身边的程序员一样，和你并肩作战。

警示：唐杰特别提到，领域大模型可能是个伪命题。企业想用领域 Know-how 构建护城河，把 AI 驯化为工具。但在 AGI 的海啸面前，一切领域壁垒最终都会被卷入主模型。所谓的“行业专用”，可能只是通往 AGI 路上的一座临时避难所。

03 应用的真相：Vibe Coding 与工种替代

这是对普通人影响最大的一层逻辑。

Karpathy发明了一个新词：Vibe Coding（氛围编程）。意思是，你完全不需要懂代码，只需要用自然语言描述你的需求（Vibe），AI 就能把程序写出来。代码变得像草稿纸一样廉价、即用即弃。

这不仅仅是编程方式的改变，而是生产关系的重构。

这就回到了唐杰那句振聋发聩的“第一性原理”：

创业者的误区：我要开发个什么软件给用户用？
正确的思考：我要造一个什么样的 AI 员工，去把某个岗位的人力成本砍掉？

Chat 已经部分替代了搜索，下一步就是替代客服、替代初级程序员、替代数据分析师。 2026 年的爆发点，不在于诞生了多少新 App，而在于“Cursor for X”——即各行各业都会出现像 Cursor 替代程序员一样，去替代其他工种的 AI 形态。

04 下一个瓶颈：记忆、在线学习与“参差不齐”

未来虽然美好，但两位专家都保持了极度的清醒，指出了当下的硬伤。

1. 记忆是刚需，但还没做对

唐杰指出，模型不仅要有短期的 Context（便签纸），还需要像人类一样的海马体（中期记忆）和大脑皮层（长期记忆）。目前的 RAG（检索增强）只是权宜之计，真正的长期记忆需要模型能实时更新自己的参数——这目前还是未解难题。

2. 参差不齐的智能（Jagged Intelligence）

Karpathy提醒我们，AI 不是在养动物，而是在“召唤幽灵”。因为优化目标不同，AI 的智力极度不均衡：它上一秒像个全知全能的学者推导复杂公式，下一秒就可能犯小学生都不会犯的低级错误。这种“锯齿状”的智力分布，是目前大规模商用的最大隐患。

3. 在线学习（Online Learning）

现在的模型是“离线”的，训练好就不变了。唐杰认为，下一个 Scaling 范式可能在于让模型具有“自我评估”的能力——知道自己对不对，才能在工作中边用边学，越用越聪明。

结语：2026 年的路线图

把唐杰和 Karpathy 的观点拼在一起，我们得到了一张清晰的路线图：

当下：预训练依然有效，但重心转移到了 RLVR 和后训练，提升模型的“推理”和“做题”能力。
近期：Agent 是突破口，目标是让 AI 具备“手脚”，从云端落地到本地，从聊天框进入操作系统。
中期：解决记忆和在线学习，让模型具备自我迭代的能力。
长期：工种替代。所有中间形态的工具软件，最终都将被“AI 员工”取代。

正如 Karpathy 所说：“大模型比我预期的聪明，也比我预期的蠢。”

2025 年，泡沫会挤出，但技术在加速。对于我们每一个人来说，思考的维度不应再是“如何使用工具”，而是“如何管理你的 AI 员工”。

(完)

整理自唐杰微博长文及 Andrej Karpathy 2025 LLM 年度回顾

唐杰Karpathy：2025年，大模型从「读博士」到「打工人」的生死跨越

01 训练范式剧变：从「背书」到「做题」

02 智能的本质：从「理论博士」到「打工人」

03 应用的真相：Vibe Coding 与工种替代

04 下一个瓶颈：记忆、在线学习与“参差不齐”

结语：2026 年的路线图

系统学习UDS 28服务与ISO 14229标准对接

16. 普通函数调用开销

Elasticsearch下载Windows系统适配核心要点解析

【鸿蒙开发实战】HarmonyOS单词库应用

fastbootd在A/B分区系统中的角色分析：系统启动必看

uds31服务请求格式在CANoe中的配置方法：新手教程