‘AI六小龙’标签的兴衰
如果要用一句话概括独立大模型赛道这两年的事,那就是:‘AI六小龙’这个标签诞生于2023年4月,消亡于2025年下半年。事实上,六家公司变成了四家。零一万物在2025年放弃了万亿参数以上的超大基模预训练,百川智能转身更早。2025年4月10日成立两周年的全员信里,王小川承认过去两年百川战线过长,接下来将收缩战线,押注医疗AI。
挑战与转型
留下来的四家公司需重新论证自身存在的理由,但挑战来得很快。2025年1月20日,DeepSeek - R1发布,七天后,英伟达股价单日下跌16.97%,市值蒸发约5900亿美元,创下美国上市公司单日市值损失纪录。不过,DeepSeek那一周真正撕开的口子,是中国大模型行业的核心叙事。当一家不在六小龙名单上的公司,用1/100的训练成本做出对标顶级闭源的开源模型,过去两年围绕‘中国版OpenAI’的烧钱、投流、估值飙升,都需重新论证合理性。
港股上市与市值差距
2026年开年,留下来的四家公司在港股完成了独立大模型赛道两年来最重要的一次身份转变。智谱1月8日敲钟,香港公开发售获1159.46倍认购;MiniMax 1月9日敲钟,1837.17倍认购,再次刷新纪录。月之暗面5月被《晚点LatePost》披露完成20亿美元D轮融资,投后估值突破200亿美元;阶跃星辰被《每日经济新闻》披露即将完成近25亿美元融资,目标基石定价百亿美元区间。然而,四家公司的市值差距,远比‘AI四小龙’这个统一标签暗示的要大。基本上,智谱市值是MiniMax的两倍;月之暗面虽估值飙升,但只有智谱的三成多;阶跃星辰技术阵容看似最豪华,目标估值却最低。
生产力战场的迁移
这种差距背后,是中国大模型行业的真正生产力战场从‘超级应用’迁移到‘Coding’的结构性变化,这场迁移在不同时间、不同程度地塑造了每一家公司的命运。而这场迁移的源头,是2025年12月4日OpenRouter和a16z联合发布的一份报告。报告基于OpenRouter平台过去13个月超过100万亿token的真实使用数据,其中一组数据击穿了2025年中国大模型行业争论一整年的‘超级应用幻觉’——编程在付费模型token使用量中的占比,从2025年初的11%,飙升到2025年11月的50%以上。这意味着,过去两年里中国大模型行业内卷的战场,都不是这场革命真正的token经济学引擎,真正的引擎是Coding。
中美差距与中国公司表现
从这个角度看,中国的头部大模型公司,距离全球顶流模型还有差距。在编程类API调用量中一度占据超60%份额的,是Anthropic的Claude。但中国公司也并未缺席,打开2025 - 2026年的主流Coding评测榜单,中国名字会反复出现,如阿里巴巴的Qwen3 - Coder系列、DeepSeekV3、R1、V3.2,四小龙里押注Coding最早最深的智谱GLM - 5、Kimi K2.5、MiniMax M2.5等。虽然阿里的Qwen3 - Coder不属于‘独立大模型’范畴,但它的存在证明了Coding就是真正的主战场,连一家年营收过万亿的互联网巨头也倾全力做这件事。而独立大模型公司在这个主战场上的位置,直接决定了它们的市值排位。
四代人的不同选择
要看清这件事,得从四个人开始。2026年1月8日下午,港交所敲钟现场,智谱AI的CEO张鹏站在台上,但智谱真正的灵魂人物是唐杰——清华大学计算机系教授,中国知识图谱与图神经网络领域的顶级学者,1977年生,2026年正好49岁。他是公司从清华KEG实验室走到港交所的所有决策核心。24小时后,MiniMax在港交所敲钟,台上是闫俊杰——1989年生,创业那年32岁。他从商汤副总裁的位置出来,却做了相反的选择:C端原生、生而全球化、全模态并行。2026年2月12日,智谱和MiniMax同一天发布同一类型的旗舰模型。智谱选择凌晨发布GLM - 5,MiniMax选择上午发布M2.5,这种时间差本身就是一种竞争策略。闫俊杰带着一家‘反向押注’的公司在港交所拿到1837倍认购,但市值只有智谱的一半。而杨植麟1992年生,清华大学计算机系本科,卡内基梅隆大学博士。2024年,他被媒体称为‘中国AI最年轻的明星创业者’。2026年3月19日,他在英伟达GTC大会主舞台做了40分钟技术演讲,马斯克评价‘令人印象深刻’。他带着月之暗面在3个月内完成3轮融资,估值从43亿美元飙升至200亿美元,但他最大的挑战是,自己仍是公司技术叙事的几乎全部承重墙,没有一支有足够‘板凳深度’的团队。阶跃星辰的情况最特别,CEO姜大昕是前微软全球副总裁,2025年入选IEEE Fellow。2026年1月,阶跃宣布前旷视科技联合创始人、千里科技董事长印奇出任公司董事长。印奇1988年生于安徽芜湖,毕业于清华姚班,师从图灵奖得主姚期智。他是‘AI 1.0时代’四小龙操盘手之一,38岁的他在阶跃重新出牌,形成了中国独立大模型公司里唯一的双头结构。
谁先看见Coding
这四个人之间最大的判断差异,是他们各自在什么时候开始意识到Coding是真正的主战场。这条时间线,几乎决定了2026年五月港交所收盘那一刻的市值排位。最先看见的是唐杰,智谱从2022年押注通用大模型开始,就坚持按‘对标GPT顶级闭源’的标准做基础模型。这种‘不合时宜’恰恰是智谱2026年市值最高的根本原因。2026年2月12日凌晨,智谱发布GLM - 5,在多个评测中取得优异成绩。第二个看见的是杨植麟,但他是被叫醒的。2025年1月20日DeepSeek - R1发布后的172天里,Kimi几乎从公开舆论场消失。2025年7月11日,杨植麟用Kimi K2回答了质疑,实现了从‘中国版超级应用Kimi’到‘开源SOTA基础模型’的转身。第三个看见的是闫俊杰,MiniMax M2系列发布于2025年10月,比Kimi K2晚了3个月,比智谱GLM - 4.5的Coding路线晚了将近一年。虽然追赶速度惊人,但市场认知和市值并未跟上。一个反常现象是,转身更晚的MiniMax,2026年5月市值反而高于转身更早的月之暗面,原因是MiniMax的C端出海业务提供了独立于Coding的价值底盘。第四个,姜大昕和印奇,其实是看见了,但没来得及。阶跃在2024 - 2025年把资源分散到多个方向,在Coding主战场上失位。直到2026年1月,印奇加入,阶跃才完成战略转向,但也承认在Coding主战场上已经有点掉队。
四种决策风格的代价
只看时间线,会错过故事的另一半。四家公司的决策风格同样在塑造2026年5月的市值排位,每一种风格都有优势,也都付出了独有的代价。智谱虽强,但有学院派的运营天花板。2026年2月21日,GLM - 5上线第9天,智谱发布致歉信,承认犯了三个错,导致大量用户被限流、API超载。这暴露了学院派不擅长运营的问题。虽然市场对智谱技术认可,但当它不再是‘开源Coding第一’时,运营天花板可能变成估值天花板。此外,智谱GLM - 5系列全程在10万张华为昇腾910B芯片上训练,零英伟达GPU,使用华为自研MindSpore框架,这是在被美国列入实体清单后的无奈之举,其算力护城河的战略价值可能会因制裁尺度变化而重新评估。杨植麟的月之暗面存在‘天才少年带来的梯队脆弱’问题。2026年3月18日的GTC演讲高光之后,月之暗面的脆弱性也暴露出来,其技术叙事几乎完全靠杨植麟一个人撑起来,存在单极风险。而且在商业模式上,月之暗面是唯一没有大厂或金融集团现金奶牛支撑的独立创业公司,这限制了其市值提升。闫俊杰的标签是‘大厂派的迟到觉醒’。他在2026年3月的财报电话会上发言,强调多个模态融合的重要性,但MiniMax在过去四年虽把每个模态做到‘行业领先’,却未实现‘代际突破’。大厂派背景使MiniMax在2021 - 2024年跑通C端付费、海外市场和自负盈亏,但对市场的判断滞后,导致在Coding时代市值落后。2026年4月10日中国发布相关管理办法,MiniMax的相关产品受影响,其红利被收回。阶跃星辰的故事最低调也最沉重。由ResNet作者、IEEE Fellow、前字节AI Infra负责人组成的团队,在2025年Coding时代失去了基础大模型质量竞争的核心位置。技术派‘什么都想做’的判断模式导致‘博而不精’,2026年1月印奇加入后进行战略转向,但这是一种妥协。不过,阶跃在‘AI + 终端’方向取得了一些成绩,如手机预装机量突破4200万台,与吉利合作的座舱AgentOS量产上车等。当然,押注Coding的时间早晚并非市值差异的唯一变量,每家公司还有其他因素影响市值。如果印奇能够连续兑现自己的想法,阶跃星辰并非没有翻身的一天。