2025年的大模型使用——各有所长，各有不同-开发者社区

原文 https://openrouter.ai/state-of-ai

Anthropic 的 Claude高度集中在编程与技术用途，两者合计超过其使用量的 80%。角色扮演和通用问答只占很小一部分。这证实了 Claude 作为针对复杂推理、编码和结构化任务优化的模型定位；开发者和企业似乎主要将 Claude 用作编码助手和问题解决者。

Google 的模型使用更为多样化。我们看到翻译、科学、技术以及一些通用知识占据了显著部分。例如，约 5% 的 Google 使用量是法律或政策内容，另有约 10% 与科学相关。这可能暗示了 Gemini 广泛的训练重点。与其他公司相比，Google 的编程份额相对较少，并且在 2025 年底实际上有所下降（降至约 18%），但拥有更广泛的类别尾部。这表明 Google 的模型更多地被用作通用信息引擎。

xAI 的使用特征与其他提供商截然不同。在大部分观察期内，使用量绝大部分集中在编程，经常超过所有 token 的百分之八十。直到 11 月底，分布才开始拓宽，在技术、角色扮演和学术领域有明显增长。这种急剧转变与 xAI 的模型通过特定消费应用免费分发的时间相吻合，这可能引入了大量非开发者流量。其结果是一个混合的使用构成：早期以开发者为核心的基数，加上一波突发的通用参与浪潮。这表明 xAI 的采用路径既受到技术用户的影响，也受到与促销可用性相关的偶发性激增的塑造。

OpenAI 的使用特征在 2025 年间发生了显著变化。年初，科学任务占所有 OpenAI token 的一半以上；到 2025 年底，这一份额已降至 15% 以下。与此同时，编程和技术相关使用现在合计占总使用量的一半以上（各占 29%），反映出其更深地融入了开发者工作流、生产力工具和专业应用。OpenAI 的使用构成现在介于 Anthropic 高度集中的特征与 Google 更分散的分布之间，表明其拥有广泛的实用性基础，但越来越向高价值、结构化的任务倾斜。

DeepSeek 和 Qwen的使用模式与之前讨论的其他模型系列有很大不同。DeepSeek 的 token 分布以角色扮演、休闲聊天和娱乐导向的交互为主，通常占其总使用量的三分之二以上。只有一小部分活动属于编程或科学等结构化任务。这种模式反映了 DeepSeek 强大的消费端导向及其作为高参与度对话模型的定位。值得注意的是，DeepSeek 在夏末显示编程相关使用量有适度但稳定的增长，表明在轻量级开发工作流中正逐步被采用。

相比之下，Qwen呈现出几乎相反的特征。在整个所示期间，编程始终占所有 token 的 40-60%，表明其明确侧重于技术和开发者任务。与 Anthropic 更稳定、以工程为主的构成相比，Qwen 在相邻类别（如科学、技术和角色扮演）中表现出更高的波动性。这些周际变化意味着其用户群体具有异质性，且在应用用例上迭代迅速。9 月和 10 月期间角色扮演使用量的显著上升，随后在 11 月收缩，暗示了用户行为的演变或下游应用路由的调整。