DeepMind与EVE Online的合作背景
DeepMind CEO、AlphaGo之父Demis Hassabis用游戏做AI研究已走过十余年。此次,他把AI投入运营了23年的太空网游EVE Online。5月初,DeepMind官宣与EVE Online建立研究合作,原因是EVE复杂且由玩家驱动的宇宙,是测试AI记忆、持续学习和长期规划的完美安全沙盒。
Fenris Creations的转型与合作
Fenris Creations(原CCP Games),即EVE Online背后的公司,在5月6日宣布了四件事:从母公司Pearl Abyss体系中重新独立;更名为Fenris Creations;完成1.2亿美元交易;Google作为本次独立的一部分,持有Fenris Creations少数股权,并同步启动与Google DeepMind的研究合作。Fenris Creations CEO Hilmar Veigar Pétursson称,这次转型不涉及裁员或重组,团队、产品、开发计划保持不变,EVE继续运营。从运营数字看,该公司并非卖资产求生。EVE Online 2025年营收超过7000万美元,11月创下历史最高收入纪录,Q4成为该游戏20年历史上营收第二高的季度。Fenris Creations独立后,EVE有了能自主决定研究合作的母公司。
为何选中EVE Online
23年「人造社会」
很多人提到「游戏+AI研究」会想到AlphaGo或AlphaStar,但EVE与它们不同。围棋和星际争霸有明确的胜负规则和终局,属于「单局智能」研究范式,而EVE没有终局。EVE Online以「单一共享宇宙」著称,玩家在此建立了真实的经济体系、政治联盟等,有些战役筹备到落幕需一年,联盟的兴衰被玩家当作历史研究。Hilmar称EVE是能在类似真实世界环境中探索智能问题的地方,Hassabis也表示EVE是其下一阶段的选择。大多数AI基准测试如体检,而EVE更像把AI放进持续23年的「人造社会」。
智能体3块最硬骨头
官方明确的三个研究方向——长程规划、记忆、持续学习,是当前AI智能体研究领域最难啃的骨头。EVE玩家在日常游戏中就面临这些挑战,如玩家的好友列表体现了跨会话长程记忆;2014年1月的B - R5RB战役改写了游戏舰队战术,各联盟围绕复盘迭代舰队配置和战术体系;EVE联盟战争以月为时间单位,玩家自发协作推进共同目标。EVE中23年的玩家驱动演化产生的复杂环境,实验室难以合成。DeepMind在2025年11月发布的SIMA 2,已从「执行指令」进化到「理解目标、推理过程、边玩边学」,EVE项目与SIMA 2同属「游戏作为智能体训练场」路线,只是场地换成了持续运转23年的真实宇宙。
合作方式:离线沙盒
DeepMind与Fenris的合作方式较为保守,初始研究将在离线版本的EVE Online上进行,使用本地服务器,在受控环境里测试和评估模型,不连接EVE Online正式运营服务器。这样既避免了消费现役玩家对战数据和扰动服务器经济,又保留了EVE的核心设计,为智能体提供了复杂的测试环境。
从Atari到EVE的进化之路
从DeepMind的训练场选择来看,有一条清晰的进化线。2013 - 2015年,Atari是起点,考的是反应和价值估计;2016 - 2017年,AlphaGo和AlphaZero考的是搜索和长链推理;2019年,AlphaStar进入《星际争霸2》,考的是部分可观察下的实时决策;2024年,SIMA想做跨多个游戏的通用智能体,考的是迁移泛化;2025年,SIMA 2升级,能和用户对话、推理目标、自我改进。此前的环境大多相对封闭、可重复评测,而EVE是长期运行、玩家驱动、经济和政治结构持续演化的持久世界。圈内认为单点任务跑分已无新意,长程记忆等缺乏像样的评估场,所以DeepMind选择走进已被人类玩家压力测试23年的「人造社会」。但更大的问题随之而来:能在EVE里持续存在、学习、规划的AI智能体,与在真实世界自主运作的智能体之间,还差什么?