news 2026/4/29 3:15:35

大模型进阶必读:收藏这份Agent记忆系统综述,掌握形态-功能-动力学三大框架

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型进阶必读:收藏这份Agent记忆系统综述,掌握形态-功能-动力学三大框架

这篇由NUS、人大、复旦等名校联合出品的综述,采用"形态-功能-动力学"三维框架系统分析了AI Agent记忆领域的200+最新研究。文章提出三大记忆形态(Token-level、Parametric、Latent)替代传统记忆二分法,详细阐述记忆形成、演化与检索机制,并展望生成式记忆、自动记忆管理等七大前沿方向,为AI Agent记忆研究提供全面路线图和资源汇总。

分享今年看到最系统&最新的Agents Memory综述,NUS&人大&复旦&北大&同济等联合出品:《Memory in the Age of AI Agents: A Survey

  • “形态-功能-动力学”三维框架把 200+ 篇最新论文一次讲透。
  • 提出新三大记忆形态:Token-level / Parametric / Latent,取代传统“长-短期记忆”二分法。
  • 展望7 大前沿:生成式记忆、自动记忆管理、RL 驱动、多模态、多 Agent 共享、世界模型、可信记忆。

1 为什么需要“Agent 记忆”?

图 1 给出一张“地图”,把 200+ 方法按形态 & 功能 & 动态一次定位:

LLM 再强,也怕“金鱼脑”——上下文一断就失忆。
把 LLM 包装成能持续交互、自我进化的 Agent,必须外挂一块可读写、可增长、可遗忘的记忆体。

2 预备知识:Agent 与记忆的形式化

图 2 用韦恩图厘清Agent Memoryvs **LLM Memory **vsRAGvsContext Engineering

作者先把 Agent 抽象成部分可观测马尔可夫博弈,再把记忆定义为三元组运算符

  • FormationF:把原始交互 φ_t 提炼成记忆单元
  • EvolutionE:合并、去重、纠错、遗忘
  • RetrievalR:按需查询

3 形态篇:记忆到底“长”什么样?

图 3 把Token-level再细拆成 1D-Flat / 2D-Planar / 3D-Hierarchical:

形态载体可读性更新成本典型场景
Token-level文本、JSON、Graph人类可读对话机器人、法律审计
ParametricLoRA、Adapter不可读角色扮演、代码生成
LatentKV-cache、Embedding机器可读极低端侧部署、多模态流

表 1 给出 60+ 代表性方法的横向对比(多模态、任务、结构):

4 功能篇:Agent 到底“用”记忆做什么?

图 6 给出功能-时间双轴全景:

把“为什么记”拆成三大职能:

  1. Factual Memory——“我知道什么”:用户画像、文档状态、世界知识。
  2. Experiential Memory——“我学会什么”:成功/失败轨迹 → 策略 → 可执行技能。
  3. Working Memory——“我现在想什么”:单轮压缩、多轮状态折叠、计划缓存。

experiential memory范式

表 4-6 分别对应三大功能的 100+ 方法速查表:

5 动力学篇:记忆如何“动”起来?

完整生命周期 =形成 → 演化 → 检索闭环,用一张“地铁图”串起 30+ 操作符:

  • Formation五板斧:语义摘要、知识蒸馏、结构化、潜空间编码、参数内化。
  • Evolution三件套:合并(Consolidate)、更新(Update)、遗忘(Forget)。
  • Retrieval四步曲:触发时机 → 查询构造 → 检索策略 → 后处理。

图 9 记忆演化机制蓝图

图 10 agentic系统中检索方法

6 资源篇:Benchmark & 开源框架速览

表 8 汇总 30 个记忆/终身学习/自演化评测集:

表 9 对比 20+ 开源框架(MemGPT / Mem0 / Zep / MemOS …):

7 前沿篇:7 大风向标

  1. 生成式记忆> 检索式记忆
  • 不再“查什么用什么”,而是“缺什么生什么”。
  1. 自动记忆管理
  • 把“写/删/改”做成 Agent 可调用的 Tool,让 LLM 自己管自己。
  1. RL 全面接管记忆策略
  • 从“人工拍阈值”到“策略网络端到端优化”。
  1. 多模态记忆
  • 视频、音频、传感器流统一进 Embedding 空间。
  1. 多 Agent 共享记忆
  • 角色-权限-隐私三权分立,防止“集体幻觉”。
  1. 世界模型内存
  • 从“缓存帧”到“可查询状态模拟器”。
  1. 可信记忆
  • 差分隐私、可验证遗忘、审计日志、用户级 GDPR 擦除。

那么,如何系统的去学习大模型LLM?

作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~

为什么要学习大模型?

我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年,人才缺口已超百万,凸显培养不足。随着AI技术飞速发展,预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。加强人才培养,优化教育体系,国际合作并进是破解困局、推动AI发展的关键。

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/24 9:14:09

收藏!2026大模型行业就业趋势全景报告:小白程序员转型必看

近两年来,大模型技术浪潮以不可阻挡之势席卷整个科技领域,热度长期居高不下且持续攀升。无论是深耕Java、C、Go等传统技术栈的后端开发者、专注交互体验与可视化的前端工程师,还是扎根数据处理、分析与挖掘的数据分析师、算法工程师&#xff…

作者头像 李华
网站建设 2026/4/24 3:52:35

前端开发提效神器:Open-Lovable 克隆网页 + cpolar 远程访问太香了

Open-Lovable 作为一款开源的前端工具,核心能力是通过 AI 对话快速生成完整的 React 应用,最实用的功能就是网页克隆 —— 输入目标网址、选择合适的 AI 模型,就能自动生成结构清晰的 React 代码,还集成了 E2B 沙箱和 Firecrawl 抓…

作者头像 李华
网站建设 2026/4/24 5:58:26

漏洞挖掘实战指南:从原理到落地(2026最新版)

漏洞挖掘实战指南:从原理到落地(2026最新版) 一、漏洞挖掘的核心本质:不止于 “找漏洞” 漏洞挖掘(Vulnerability Mining)是主动发现软件 / 系统中未被披露的安全缺陷的过程,但核心不止于 “找…

作者头像 李华
网站建设 2026/4/24 7:45:24

拼多多多家店铺怎么同步商品?拼多多怎么备份商品?

拼多多店铺商品数据如何备份?两家店铺的商品怎样同步?有不少在拼多多同时经营多家店铺的店主存在这样的需求:“想同步自己多家店铺的商品,有没有什么办法能把商品数据备份下来,直接导入上传到另一家店铺,或…

作者头像 李华
网站建设 2026/4/22 16:05:33

86万商户装不满高德榜单

膨胀的高德扫街榜,商户还够用吗?作者|景行编辑|古廿9.96亿、6.6亿、86万、2559。这是高德扫街榜上线100天交出的四个数字。1月7日,在高德扫街榜2026发布会上,高德CEO郭宁首次系统披露了这组数据:高德App月活跃用户规模…

作者头像 李华
网站建设 2026/4/26 19:42:35

企业AI支出失控?NJET AI网关如何帮您守住预算红线

随着DeepSeek、通义千问、豆包等国内大模型的商业化落地,越来越多的企业正在将AI能力嵌入核心业务流程。但基于Token的计费模式(按输入输出的汉字/字符数收费),正在让AI支出成为不可预测的定时炸弹,Token消耗就像打开的水龙头&…

作者头像 李华