news 2026/5/25 9:25:02

DeepMind联手EVE Online:挑战AI智能体研究三大难题,走进23年「人造社会」

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
DeepMind联手EVE Online:挑战AI智能体研究三大难题,走进23年「人造社会」

DeepMind与EVE Online的合作背景

DeepMind CEO、AlphaGo之父Demis Hassabis用游戏做AI研究已走过十余年。此次,他把AI投入运营了23年的太空网游EVE Online。5月初,DeepMind官宣与EVE Online建立研究合作,原因是EVE复杂且由玩家驱动的宇宙,是测试AI记忆、持续学习和长期规划的完美安全沙盒。

Fenris Creations的转型与合作

Fenris Creations(原CCP Games),即EVE Online背后的公司,在5月6日宣布了四件事:从母公司Pearl Abyss体系中重新独立;更名为Fenris Creations;完成1.2亿美元交易;Google作为本次独立的一部分,持有Fenris Creations少数股权,并同步启动与Google DeepMind的研究合作。Fenris Creations CEO Hilmar Veigar Pétursson称,这次转型不涉及裁员或重组,团队、产品、开发计划保持不变,EVE继续运营。从运营数字看,该公司并非卖资产求生。EVE Online 2025年营收超过7000万美元,11月创下历史最高收入纪录,Q4成为该游戏20年历史上营收第二高的季度。Fenris Creations独立后,EVE有了能自主决定研究合作的母公司。

为何选中EVE Online

23年「人造社会」

很多人提到「游戏+AI研究」会想到AlphaGo或AlphaStar,但EVE与它们不同。围棋和星际争霸有明确的胜负规则和终局,属于「单局智能」研究范式,而EVE没有终局。EVE Online以「单一共享宇宙」著称,玩家在此建立了真实的经济体系、政治联盟等,有些战役筹备到落幕需一年,联盟的兴衰被玩家当作历史研究。Hilmar称EVE是能在类似真实世界环境中探索智能问题的地方,Hassabis也表示EVE是其下一阶段的选择。大多数AI基准测试如体检,而EVE更像把AI放进持续23年的「人造社会」。

智能体3块最硬骨头

官方明确的三个研究方向——长程规划、记忆、持续学习,是当前AI智能体研究领域最难啃的骨头。EVE玩家在日常游戏中就面临这些挑战,如玩家的好友列表体现了跨会话长程记忆;2014年1月的B - R5RB战役改写了游戏舰队战术,各联盟围绕复盘迭代舰队配置和战术体系;EVE联盟战争以月为时间单位,玩家自发协作推进共同目标。EVE中23年的玩家驱动演化产生的复杂环境,实验室难以合成。DeepMind在2025年11月发布的SIMA 2,已从「执行指令」进化到「理解目标、推理过程、边玩边学」,EVE项目与SIMA 2同属「游戏作为智能体训练场」路线,只是场地换成了持续运转23年的真实宇宙。

合作方式:离线沙盒

DeepMind与Fenris的合作方式较为保守,初始研究将在离线版本的EVE Online上进行,使用本地服务器,在受控环境里测试和评估模型,不连接EVE Online正式运营服务器。这样既避免了消费现役玩家对战数据和扰动服务器经济,又保留了EVE的核心设计,为智能体提供了复杂的测试环境。

从Atari到EVE的进化之路

从DeepMind的训练场选择来看,有一条清晰的进化线。2013 - 2015年,Atari是起点,考的是反应和价值估计;2016 - 2017年,AlphaGo和AlphaZero考的是搜索和长链推理;2019年,AlphaStar进入《星际争霸2》,考的是部分可观察下的实时决策;2024年,SIMA想做跨多个游戏的通用智能体,考的是迁移泛化;2025年,SIMA 2升级,能和用户对话、推理目标、自我改进。此前的环境大多相对封闭、可重复评测,而EVE是长期运行、玩家驱动、经济和政治结构持续演化的持久世界。圈内认为单点任务跑分已无新意,长程记忆等缺乏像样的评估场,所以DeepMind选择走进已被人类玩家压力测试23年的「人造社会」。但更大的问题随之而来:能在EVE里持续存在、学习、规划的AI智能体,与在真实世界自主运作的智能体之间,还差什么?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/25 9:24:47

动态推理技术解析:AI代理的核心与优化

1. 动态推理技术解析:AI代理的核心工作机制 动态推理(Dynamic Reasoning)是当前AI代理(AI Agent)实现复杂任务处理的核心技术范式。与传统的单次前向传播(Static Reasoning)不同,动态…

作者头像 李华
网站建设 2026/5/25 9:19:27

免费解锁WeMod高级功能的完整指南:使用WandEnhancer工具

免费解锁WeMod高级功能的完整指南:使用WandEnhancer工具 【免费下载链接】Wand-Enhancer Advanced UX and interoperability extension for Wand (WeMod) app 项目地址: https://gitcode.com/gh_mirrors/we/Wand-Enhancer 还在为WeMod专业版的订阅费用而烦恼…

作者头像 李华
网站建设 2026/5/25 9:17:19

解锁音乐自由:QMCDecode帮你一键解密QQ音乐加密格式

解锁音乐自由:QMCDecode帮你一键解密QQ音乐加密格式 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac,qmc0,qmc3转mp3, mflac,mflac0等转flac),仅支持macOS,可自动识别到QQ音乐下载目录,默认转换…

作者头像 李华
网站建设 2026/5/25 9:15:01

【数据库篇|MySQL】事务

一.定义事务(Transaction)是把一组 SQL 操作当作一个逻辑单元来执行,要么全部成功,要么全部失败回滚,以此保证数据的一致性和完整性。二.事务的四大特性(ACID)原子性(Atomicity&…

作者头像 李华