DeepMind联手EVE Online：挑战AI智能体研究三大难题，走进23年「人造社会」-开发者社区

DeepMind与EVE Online的合作背景

DeepMind CEO、AlphaGo之父Demis Hassabis用游戏做AI研究已走过十余年。此次，他把AI投入运营了23年的太空网游EVE Online。5月初，DeepMind官宣与EVE Online建立研究合作，原因是EVE复杂且由玩家驱动的宇宙，是测试AI记忆、持续学习和长期规划的完美安全沙盒。

Fenris Creations的转型与合作

Fenris Creations（原CCP Games），即EVE Online背后的公司，在5月6日宣布了四件事：从母公司Pearl Abyss体系中重新独立；更名为Fenris Creations；完成1.2亿美元交易；Google作为本次独立的一部分，持有Fenris Creations少数股权，并同步启动与Google DeepMind的研究合作。Fenris Creations CEO Hilmar Veigar Pétursson称，这次转型不涉及裁员或重组，团队、产品、开发计划保持不变，EVE继续运营。从运营数字看，该公司并非卖资产求生。EVE Online 2025年营收超过7000万美元，11月创下历史最高收入纪录，Q4成为该游戏20年历史上营收第二高的季度。Fenris Creations独立后，EVE有了能自主决定研究合作的母公司。

为何选中EVE Online

23年「人造社会」

很多人提到「游戏+AI研究」会想到AlphaGo或AlphaStar，但EVE与它们不同。围棋和星际争霸有明确的胜负规则和终局，属于「单局智能」研究范式，而EVE没有终局。EVE Online以「单一共享宇宙」著称，玩家在此建立了真实的经济体系、政治联盟等，有些战役筹备到落幕需一年，联盟的兴衰被玩家当作历史研究。Hilmar称EVE是能在类似真实世界环境中探索智能问题的地方，Hassabis也表示EVE是其下一阶段的选择。大多数AI基准测试如体检，而EVE更像把AI放进持续23年的「人造社会」。

智能体3块最硬骨头

官方明确的三个研究方向——长程规划、记忆、持续学习，是当前AI智能体研究领域最难啃的骨头。EVE玩家在日常游戏中就面临这些挑战，如玩家的好友列表体现了跨会话长程记忆；2014年1月的B - R5RB战役改写了游戏舰队战术，各联盟围绕复盘迭代舰队配置和战术体系；EVE联盟战争以月为时间单位，玩家自发协作推进共同目标。EVE中23年的玩家驱动演化产生的复杂环境，实验室难以合成。DeepMind在2025年11月发布的SIMA 2，已从「执行指令」进化到「理解目标、推理过程、边玩边学」，EVE项目与SIMA 2同属「游戏作为智能体训练场」路线，只是场地换成了持续运转23年的真实宇宙。

合作方式：离线沙盒

DeepMind与Fenris的合作方式较为保守，初始研究将在离线版本的EVE Online上进行，使用本地服务器，在受控环境里测试和评估模型，不连接EVE Online正式运营服务器。这样既避免了消费现役玩家对战数据和扰动服务器经济，又保留了EVE的核心设计，为智能体提供了复杂的测试环境。

从Atari到EVE的进化之路

从DeepMind的训练场选择来看，有一条清晰的进化线。2013 - 2015年，Atari是起点，考的是反应和价值估计；2016 - 2017年，AlphaGo和AlphaZero考的是搜索和长链推理；2019年，AlphaStar进入《星际争霸2》，考的是部分可观察下的实时决策；2024年，SIMA想做跨多个游戏的通用智能体，考的是迁移泛化；2025年，SIMA 2升级，能和用户对话、推理目标、自我改进。此前的环境大多相对封闭、可重复评测，而EVE是长期运行、玩家驱动、经济和政治结构持续演化的持久世界。圈内认为单点任务跑分已无新意，长程记忆等缺乏像样的评估场，所以DeepMind选择走进已被人类玩家压力测试23年的「人造社会」。但更大的问题随之而来：能在EVE里持续存在、学习、规划的AI智能体，与在真实世界自主运作的智能体之间，还差什么？

免费解锁WeMod高级功能的完整指南：使用WandEnhancer工具

免费解锁WeMod高级功能的完整指南：使用WandEnhancer工具【免费下载链接】Wand-Enhancer Advanced UX and interoperability extension for Wand (WeMod) app 项目地址: https://gitcode.com/gh_mirrors/we/Wand-Enhancer 还在为WeMod专业版的订阅费用而烦恼…