news 2026/5/10 20:48:44

xAI再失华人大将:预训练负责人已离职,马斯克又留不住人了

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
xAI再失华人大将:预训练负责人已离职,马斯克又留不住人了
克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

刚刚,xAI再失一名华人大将。

就在今天,预训练负责人庄钧堂官宣了自己已经离职的消息。

此前,庄钧堂已经在xAI工作了两年。

这期间,他主导了从Grok多个版本模型的预训练,同时负责预训练Grok在X和Tesla上的语音模型及xAI企业API模型。

虽然他在官宣前两个月就已离开,但这波刚好赶上xAI不再独立运营后的新一轮离职潮。

仅今天一天,就有多名员工相继宣布离职。

如此高密度的人员离职,让人不禁感叹,xAI到底是怎么了?

谁是庄钧堂?

2024年,庄钧堂加入xAI。

此后两年,Grok多代模型的预训练都由他主导。

Grok在X和Tesla上的语音模型,xAI对外的企业API模型,也都由他牵头预训练。

在此之前,他在OpenAI工作了两年。

这期间,他是GPT-4技术报告的联合作者,还参与了GPT-4o和DALL-E 3的核心开发,提出了GPT4-Turbo 128k算法,并作为第一贡献者搭建了OpenAI的Embedding模型。

这几件事,分别对应着OpenAI在语言模型、多模态、图像生成和向量检索等方向上的关键节点产品。

他的学术背景,和这份工作履历放在一起,有一定的反差。

庄钧堂本科就读于清华大学,但读的专业并非计算机,而是工程物理,还辅修了法律。

他的硕博生涯是在耶鲁度过的,硕士读的是统计学,博士则是生物医学工程。

读博期间,庄郡堂的研究课题是判断自闭症患者的脑连接组中哪些连接异常与自闭症的诊断相关。

在这个课题中,他使用的工具是神经网络。

在博士期间,他提出了AdaBelief优化器,其核心思路是根据模型对当前梯度的置信程度来自适应地调整步长。

如果当前观测到的梯度方向与模型的预期偏差很大,说明此刻的观测不可信,应该迈小步;如果梯度方向与预期接近,说明信号可靠,可以迈大步。

这个设计触及了深度学习训练中一个长期存在的痛点——现有优化器对噪声梯度的处理过于粗糙。

这篇论文在NeurIPS 2020拿到了Spotlight,随后被PyTorch、TensorFlow、Google Flax、DeepMind Optax等主流框架相继收录,成为研究者工具箱里的常备选项。

马斯克留不住人

就在庄钧堂宣布离职的同一天,xAI还有多名员工相继发出了同样的消息。

三天前,马斯克刚刚宣布xAI不再作为独立公司运营,并入SpaceX,统一更名为“SpaceXAI”。这个消息发出后没多久,离职的消息就接连来了。

与此同时,另一批人正在进场——Cursor的员工开始出现在xAI的办公室里,由xAI现任研究负责人Aman Madaan主持联合会议。

Cursor的到来,目的之一就是解决马斯克一直以来“留不住人”的困境。

从2024年中开始,xAI的联创就在陆续离开,SpaceX完成收购后密集爆发,到今年3月底,11位联创全部清零。

Fast Company统计,过去一年内xAI可查证的离职员工已超过80人。

马斯克也在试图解决人事危机,但专门挖来的人也是说走就走。

今年3月,马斯克把Mistral AI和Thinking Machines Lab联创Devendra Chaplot请来,直接向他汇报,但Debendra入职才一个月,便离职了。

马斯克承认,xAI“没有建立在正确的基础上,正在从头重建”。今年4月,他转向外部,与Cursor达成合作,于是便有了Cursor员工进驻xAI办公室的一幕。

Grok正常更新

尽管马斯克在人事问题上屡遭滑铁卢,但xAI的主要产品Grok,也刚刚宣布了一波更新。

新版增加了连接器功能,支持接入邮件、日历、Notion等工具,帮助用户提取邮件、整理日程。

同时马斯克还下场驳斥了“Grok将死”的传闻。

毕竟一边是团队不再独立运行,另一边又刚刚把Colossus集群租给了Anthropic,让人很难不遐想。

但马斯克表示,新的Grok模型正在Colossus 2集群上正常训练中,也算是解开了Colossus出租的疑云。

那就等着看看,马斯克还能交出怎样的模型吧。

参考链接:
[1]https://x.com/archanfel_anoth/status/2052878350868484361
[2]https://x.com/elonmusk/status/2052269744120869106

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

5月20日,我们将在北京金茂万丽酒店举办一年一度的中国AIGC产业峰会。

首波嘉宾阵容已公布昆仑万维方汉智谱吴玮杰EverMind邓亚峰风行在线易正朝百度秒哒朱广翔Fusion Fund张璐香港大学黄超MarsWave冯雷都来了,🔍了解详情

请你和我们一起,不再只是讨论AI的未来,而是现在就用起来。👉 报名参会

一键关注 👇 点亮星标

科技前沿进展每日见

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 20:32:42

娱乐圈天降紫微星淘汰虚红,海棠山铁哥硬核实力碾压假顶流

—— 致所有“假顶流”的告别书,致“海棠山铁哥”的加冕诗一、虚红乱象 三行可尽 如今娱乐圈,虚红泛滥,假流横行。 太多所谓顶流,没有真才实学,没有匠心作品,全靠资本强推、热搜炒作、人设包装、粉丝刷数据…

作者头像 李华
网站建设 2026/5/10 20:28:27

MOOTDX实战指南:构建免费高效的Python量化数据基础设施

MOOTDX实战指南:构建免费高效的Python量化数据基础设施 【免费下载链接】mootdx 通达信数据读取的一个简便使用封装 项目地址: https://gitcode.com/GitHub_Trending/mo/mootdx 在量化投资的世界中,数据获取往往是最大的技术门槛和成本瓶颈。MOOT…

作者头像 李华
网站建设 2026/5/10 20:19:38

Navicat密码解密技术方案:数据库连接密码恢复与安全分析

Navicat密码解密技术方案:数据库连接密码恢复与安全分析 【免费下载链接】navicat_password_decrypt 忘记navicat密码时,此工具可以帮您查看密码 项目地址: https://gitcode.com/gh_mirrors/na/navicat_password_decrypt 1. 问题背景与痛点分析 在数据库管理…

作者头像 李华
网站建设 2026/5/10 20:18:55

机器视觉实战:RANSAC算法思想与工程落地指南

1. RANSAC算法为什么能成为机器视觉的"离群点杀手"? 想象你正在玩一个"找不同"的游戏,但有人故意在图片里混入了大量干扰项——这就是机器视觉中特征匹配面临的真实困境。RANSAC(Random Sample Consensus)就…

作者头像 李华