写在前面
欢迎大家关注Rocky的公众号:WeThinkIn
欢迎大家关注Rocky的知乎:Rocky Ding
AIGC算法工程师/开发工程师面试面经秘籍分享:WeThinkIn/Interview-for-Algorithm-Engineer欢迎大家Star~
AIGC时代的《三年面试五年模拟》AI算法工程师/开发工程师求职面试秘籍独家资源:【三年面试五年模拟】AI算法工程师面试秘籍
Rocky最新撰写AI Agent(AI智能体)的深入浅出全维度解析文章:深入浅出完整解析AI Agent(AI智能体)的核心基础知识
AIGC算法岗/开发岗面试面经交流社群(涵盖AI Agent、AIGC图像创作、AI视频、LLM大模型、AI多模态、数字人、传统深度学习、具身智能等AIGC面试干货资源)欢迎大家加入:https://t.zsxq.com/33pJ0
大家好,我是Rocky。
核心导读
Lilian Weng 这篇《LLM Powered Autonomous Agents》写于 2023 年 6 月,是早期把大模型智能体讲清楚的一篇关键技术博客。它的价值不在于提出某个单点算法,而在于给出了一个非常稳定的系统框架:当 LLM 成为 Agent 的“大脑”之后,真正决定系统能力上限的,不只是模型参数本身,而是围绕模型搭起来的规划、记忆和工具调用系统。
Rocky 认为,这篇文章到今天仍然值得反复读,原因很简单:它没有把 Agent 神化成“自动完成一切的数字员工”,也没有把 Agent 降低成“Prompt 工程的小技巧集合”。它讨论的是一个更底层的问题:如何把一个擅长语言建模的模型,改造成一个能分解任务、保存状态、调用工具、观察反馈并迭代修正的执行系统。
如果用一句话概括这篇文章的主线:LLM Agent 的核心不是“模型会思考”,而是“模型被放进了一个可执行、可记忆、可反馈的闭环里”。规划负责把目标拆成步骤,记忆负责让系统不被当前上下文窗口困住,工具负责把语言能力接到外部世界,自我反思负责让失败轨迹变成下一轮行动的约束。所谓自主智能体,实质上是大模型从“回答器”向“任务控制器”的跃迁。
这也是本文希望进一步展开的判断:Agent 不是一个模型形态,而是一种系统组织方式。大模型只是中枢,真正让它接近“能做事”的,是控制流、状态管理、外部工具、环境反馈和安全边界共同构成的工程结构。理解这一点,比追逐某一个 Agent 框架更重要。
问题背景:作者到底想解决什么
在 ChatGPT 出现之后,行业很快发现,大模型的能力并不止于写文章、写代码、回答问题。它还能在自然语言空间中做任务分解、生成计划、解释中间状态,甚至根据外部反馈调整下一步行动。AutoGPT、BabyAGI、GPT-Engineer 这类早期 Demo 就是在这个背景下出现的:它们把用户目标交给模型,让模型自己拆解任务、调用命令、写文件、搜索信息,最后尝试交付一个结果。
但早期 Agent Demo 的兴奋点和风险点其实是同一个东西:它们让模型“看起来”像在自主行动,却也暴露出模型在长程任务、状态保持、工具调用可靠性、格式稳定性上的脆弱。模型可以生成计划,但计划未必可执行;模型可以反思失败,但反思未必真实有效;模型可以调用工具,但参数、接口、返回结果处理都可能出错。
Lilian Weng 的文章想解决的不是“如何做一个更酷的 Demo”,而是把这些现象拆成可分析的系统模块。她把 LLM-powered autonomous agent 分成三个关键组件:Planning、Memory、Tool use。这个拆法非常重要,因为它把“智能体”从一个模糊词汇,变成了可以被工程化讨论的结构。
图 1 是全文的骨架。LLM 位于系统中心,但它不是孤立工作的。规划模块让它能把大目标拆成子目标,记忆模块让它能跨越有限上下文保存信息,工具模块让它能访问模型权重之外的知识、计算和外部系统。真正的 Agent 能力,不是这三个模块的简单相加,而是它们形成一个循环:模型提出行动,工具产生观察,记忆保存轨迹,规划更新下一步。
这张图的本质含义是:大模型智能体不是“一个更长 Prompt”,而是一套围绕 LLM 的认知操作系统。Prompt 只是入口,Agent 系统真正要处理的是任务生命周期。
核心思路:用一句主线串起来
如果把这篇文章当作 Agent 的技术地图,可以看到一条非常清晰的递进关系。
第一层是规划。没有规划,模型只能在当前问题上生成一个局部答案;有了规划,模型才可能把复杂目标拆成多个可执行步骤。Chain of Thought、Tree of Thoughts、LLM+P、ReAct、Reflexion 等方法,本质上都在回答同一个问题:如何让模型在行动之前、行动之中、行动之后形成更好的决策轨迹。
第二层是记忆。没有记忆,智能体会被 Transformer 的上下文窗口限制在一次对话里;有了短期记忆和长期记忆,系统才可能把历史经验、外部知识、用户偏好和任务状态重新带回当前决策。这里的关键不是“把所有东西都塞进上下文”,而是如何用检索和表示机制,在需要的时候找到真正相关的信息。
第三层是工具。没有工具,LLM 只能在参数化知识和当前上下文中工作;有了工具,模型才可以连接搜索、计算器、代码解释器、数据库、API、机器人实验平台、图像/音频/视频模型等外部能力。工具让模型从“语言空间”进入“操作空间”。
第四层是案例与边界。ChemCrow、Generative Agents、AutoGPT、GPT-Engineer 等例子说明,Agent 可以在科研、仿真、软件工程中产生新能力,但也暴露出可靠性、安全性、长程规划和自然语言接口不稳定等问题。
Rocky 认为,这条主线背后有一个更底层的判断:Agent 的能力不是来自“模型突然有了自我”,而是来自系统把模型的语言推理能力转化成了可循环执行的过程。这也是为什么 Agent 不是单纯的模型 Benchmark 问题,而是模型、检索、工具、环境、反馈和工程约束共同作用的问题。
方法展开:沿着原文逻辑拆解
规划:让模型从“回答问题”变成“推进任务”
复杂任务通常不是一步完成的。写一段代码、完成一次调研、规划一次旅行、设计一个实验,都需要把大目标拆成小目标,并在执行过程中根据新信息调整路径。规划模块解决的正是这个问题。
原文首先讨论的是 Chain of Thought。CoT 的核心做法很简单:让模型“think step by step”,用更多测试时计算把复杂问题拆成中间步骤。它的价值不只是提高答案准确率,更重要的是让模型的中间推理过程以自然语言形式显性化。对于 Agent 来说,这种显性化非常关键,因为只有当中间步骤可以被看见、保存和检查,后续的反思、纠错和工具调用才有入口。
但 CoT 的局限也很明显:它通常是一条线性的推理链。一旦前面的中间步骤偏掉,后面可能会沿着错误方向继续扩展。Tree of Thoughts 试图解决这个问题,它不是只生成一条思路,而是在每个思考步骤上生成多个候选,并用 BFS、DFS 或投票/评估器去搜索更好的路径。换句话说,ToT 把大模型推理从“单路径生成”推向“搜索式决策”。
这背后的本质变化是:模型不再只是输出一个答案,而是在构造一个可搜索的状态空间。一旦推理被看成状态空间,Agent 就可以引入评估器、剪枝、回溯、外部规划器等传统 AI 和工程系统里的方法。
LLM+P 则更进一步,把长程规划交给外部经典规划器。LLM 负责把自然语言问题翻译成 PDDL,经典规划器负责生成计划,再由 LLM 翻译回自然语言。这种路径很有启发:在某些结构化场景里,LLM 不一定要自己完成所有规划,而可以作为自然语言和符号系统之间的接口。
Rocky 认为,LLM+P 的意义不在于 PDDL 本身会成为所有 Agent 的标准,而在于它提醒我们:优秀的 Agent 系统不应该迷信“模型单独解决一切”。当外部规划器、优化器、数据库、规则系统更擅长某件事时,LLM 更适合做语义理解、任务转译、结果解释和流程调度。
自我反思:把失败轨迹变成下一轮行动的约束
如果说任务分解解决的是“下一步该做什么”,自我反思解决的就是“做错之后如何变好”。现实任务充满试错,Agent 不可能每一步都正确。关键不在于消灭失败,而在于系统能不能识别失败、解释失败,并把失败经验压缩成下一轮行动的上下文。
ReAct 是这条路线的代表。它把 Reasoning 和 Acting 放在同一个循环里,让模型交替生成 Thought、Action、Observation。Thought 是模型的中间推理,Action 是对外部环境或工具的调用,Observation 是环境返回的新信息。这样一来,模型不是一次性生成答案,而是在“想一想、做一步、看结果、再想一想”的循环中推进任务。
图 2 展示了 ReAct 在知识密集型任务和决策任务中的轨迹。真正值得注意的是,它把模型的语言推理和环境交互合在了一起。纯 Act-only 系统只能执行动作,缺少可解释的中间推理;纯 CoT 系统只有思考,缺少环境反馈。ReAct 的价值在于把“思考”和“行动”组织成一个闭环。
从工程角度看,ReAct 的关键不只是 Prompt 模板,而是状态机设计。Thought、Action、Observation 本质上是 Agent 的循环协议:模型提出假设,工具验证假设,系统把验证结果重新交给模型。这也是为什么后来很多 Agent 框架虽然名称不同,但底层循环仍然长得很像。
Reflexion 在 ReAct 基础上加入了动态记忆和自我反思。它把任务看成一种强化学习式环境:Agent 执行动作,环境返回观察和奖励;如果轨迹低效或出现幻觉,系统可以停止当前尝试,让模型生成反思,并把反思写入工作记忆,指导下一次尝试。
图 3 的重点在于“反思不是一句口号”,而是一种可以被写入记忆的中间对象。失败轨迹经过模型总结,变成对未来行动有约束力的语言反馈。这使得 Agent 可以在不更新模型参数的情况下,通过上下文中的经验积累改善后续表现。
图 4 展示了 Reflexion 的实验结果,也暴露出一个很重要的事实:在环境交互任务里,幻觉往往比“规划太慢”更常见。Agent 的失败不只是算力不够、步骤不够多,而是模型可能在重复无效动作、误读观察、编造状态。自我反思机制可以缓解这类问题,但它的效果依赖于系统能否可靠地检测失败轨迹。
这里有一个很容易被忽略的边界:自我反思并不等于真实学习。Reflexion 更多是在上下文层面让模型“记住这次失败的教训”,它没有改变模型参数。它可以提升单任务或同类任务中的迭代表现,但不能保证模型从根本上获得稳定的新能力。Rocky 认为,理解这个边界非常重要,否则很容易把 Agent 的上下文技巧误读成模型已经具备长期自主学习能力。
Chain of Hindsight 则从训练角度讨论反思能力。它把人类反馈组织成一串逐步改进的输出,让模型学习“看见历史反馈之后生成更好答案”的趋势。原文中的数据形式可以概括为:给定 promptx xx、多个输出y i y_iyi、评分r i r_iri和反馈z i z_izi,模型被训练在历史反馈序列条件下预测更高质量的最终输出y n y_nyn。
图 5 说明了 CoH 的核心直觉:模型不是只学习“正确答案长什么样”,而是学习“输出如何沿着反馈变好”。这对 Agent 很重要,因为 Agent 的行动通常不是一次生成完成,而是在多轮观察和修正中逐渐接近目标。
Algorithm Distillation 把类似思想放到强化学习轨迹里。它不只是蒸馏某个专家策略,而是蒸馏“一个算法如何在多轮 episode 中变好”的过程。也就是说,模型条件化在历史轨迹上,学习下一步如何产生更好表现。
图 6 很适合用来理解 Agent 的“经验压缩”问题。传统监督学习通常学的是输入到输出的映射,而 AD 想学的是跨 episode 的改进过程。对 Agent 来说,这意味着历史轨迹不是垃圾日志,而是下一轮策略的重要条件。
图 7 展示了 AD 在需要记忆和探索的环境中接近 RL^2 的表现,同时比一些基线更快学习。需要注意的是,原文也强调了上下文窗口的限制:要让模型从多 episode 历史中学到东西,上下文必须足够长,episode 也必须足够短。这个限制在今天仍然非常现实。长上下文可以缓解问题,但不能自动解决历史选择、压缩、检索和信用分配问题。
因此,规划模块真正带来的启发是:Agent 的“智能”很大一部分来自过程组织。CoT、ToT、ReAct、Reflexion、CoH、AD 看起来方法不同,但都在尝试把模型输出从一次性文本生成,变成可拆解、可搜索、可反馈、可积累的行动过程。
记忆:有限上下文之外的状态管理
Agent 要执行长任务,就必须面对记忆问题。Transformer 的上下文窗口再长,也不是无限的;更重要的是,任务中的所有历史信息并不都同等重要。真正的挑战不是“存下所有内容”,而是“在当前决策时找回最相关的内容”。
原文先借用人类记忆的分类,区分感觉记忆、短期记忆、长期记忆。这个类比不是神经科学意义上的严格等价,而是帮助我们理解 Agent 系统中的不同信息层级。
图 8 对 Agent 设计很有启发。感觉记忆可以粗略对应原始输入的表示学习,短期记忆对应当前上下文中的 in-context learning,长期记忆对应外部向量数据库或其他可检索存储。也就是说,Agent 的记忆并不只是一个“聊天记录”,而是由表示、上下文、检索、排序、压缩共同构成的系统。
Rocky 认为,很多 Agent 项目失败,不是因为没有接向量数据库,而是因为把“存储”误当成了“记忆”。真正的记忆至少包含四个步骤:写入什么、如何表示、何时检索、检索后如何影响决策。只把所有历史切块后塞进向量库,往往会制造一种“看起来有长期记忆”的幻觉,但在关键任务上并不能稳定帮助模型。
原文讨论的 MIPS,就是外部记忆工程化的底层问题。向量数据库通常把信息编码成 embedding,然后在查询时做最大内积搜索或近似最近邻搜索。为了速度,系统往往使用 ANN,在少量准确率损失和大幅检索加速之间做权衡。
图 9 比较了不同 MIPS 算法在 recall@10 上的表现。LSH、ANNOY、HNSW、FAISS、ScaNN 等方法的差异,表面上是检索算法差异,背后其实是 Agent 记忆系统的工程取舍:你是更在意召回准确率,还是更在意响应速度?是数据规模更大,还是更新频率更高?是语义相似就够了,还是还要时间、来源、权限、重要性一起排序?
这也是为什么长期记忆不能被简单理解为“无限上下文”。向量检索提供的是相关信息的候选集,而不是完整注意力。被检索出来的信息可能不完整、不新鲜、不可信,也可能因为 embedding 表示偏差而遗漏关键线索。原文在挑战部分也提到,检索可以扩展知识池,但它的表示能力不等同于完整 attention。
所以,记忆模块的本质是状态管理。短期记忆负责当前任务上下文,长期记忆负责跨任务和跨时间的信息沉淀,检索机制负责把长期状态重新接入当前推理。好的 Agent 系统,必须把记忆当成产品和工程问题一起设计:哪些信息值得存?哪些信息应该过期?哪些信息具有权限边界?哪些信息是事实,哪些只是模型过去的猜测?
工具使用:把语言模型接入外部世界
如果没有工具,LLM 再强也只能在已有参数和输入上下文里工作。工具使用让模型获得三类关键能力:访问最新或私有信息,执行精确计算和代码,调用外部系统完成真实操作。
原文用工具使用的类比引出这个模块:人类使用工具来突破身体和认知限制。对 LLM 来说,工具也是能力外延。搜索引擎弥补知识时效,计算器弥补算术稳定性,代码解释器弥补复杂执行,数据库弥补私有信息访问,行业 API 则把模型接入真实业务流程。
图 10 的作用不是提供技术架构,而是提醒我们:工具使用是智能系统扩展能力边界的基本方式。Agent 的工具调用不应该被看成“让模型多几个插件”,而应该被看成模型与外部世界之间的执行接口。
MRKL 是较早把这种思想结构化的系统。它把通用 LLM 作为路由器,把问题分发给一组专家模块。这些专家可以是神经网络模型,也可以是符号工具,比如计算器、汇率转换器、天气 API。MRKL 的关键判断是:LLM 未必适合亲自完成所有子任务,但可以负责识别问题类型、选择模块、组织输出。
这里的难点并不在工具本身。计算器本来就比 LLM 更擅长算术,数据库本来就比 LLM 更擅长存储事实。难点在于模型是否知道什么时候该用工具、该用哪个工具、该如何构造参数、如何解释工具返回。原文提到,MRKL 在数学问题上发现,显式算式比口头数学题更容易处理,因为模型可能抽取不出正确参数。这是一个非常现实的提醒:工具越强,调用协议越重要。
Toolformer、TALM 等方法试图通过训练让语言模型学会使用 API。它们的思路是判断新增 API 调用标注是否能改善模型输出,然后用这些标注扩充训练数据。与纯 Prompt 式工具调用相比,训练式工具使用更接近把“何时调用、如何调用”的能力内化到模型中。
HuggingGPT 展示了更复杂的工具生态:它把 ChatGPT 当作任务规划器,根据 Hugging Face 上的模型描述选择合适模型执行子任务,再汇总结果返回用户。
图 11 展示了 HuggingGPT 的四阶段流程:任务规划、模型选择、任务执行、结果生成。它的启发在于,Agent 可以不只调用传统 API,还可以调用其他 AI 模型。LLM 在这里像一个调度器,负责把用户需求拆成多个任务,再把任务分配给图像、语音、视频、文本等不同专家模型。
但这套流程也暴露出真实系统的成本:多轮 LLM 推理会带来延迟,复杂任务内容会消耗上下文窗口,外部模型服务会引入稳定性问题,模型输出格式一旦不稳,整个链路就可能失败。也就是说,工具使用让 Agent 能力边界变大,同时也让工程可靠性问题变得更尖锐。
API-Bank 则把工具调用能力变成了可评测问题。它包含多种常用 API、完整的工具增强 LLM 工作流和带 API 调用标注的对话。它不仅评估模型能不能调用一个给定 API,还评估模型能不能检索到合适 API,以及在模糊用户需求下规划多个 API 调用。
图 12 的价值在于,它把“工具调用”拆成多个决策点:是否需要 API、该调用哪个 API、参数是否正确、结果是否满足需求、是否需要再次调用。每一步都可能出错,也都可以被单独评测。
Rocky 认为,工具调用是 Agent 从 Demo 走向生产的分水岭。演示一个 Agent 会调用搜索很容易,构建一个在真实业务里稳定调用 API、处理异常、遵守权限、记录审计、可回滚的 Agent 则完全不同。真正的产品级 Agent,必须把工具调用当作工程协议,而不是一段自然语言魔法。
案例:从科研工具到生成式社会仿真
原文的案例部分非常重要,因为它让前面的模块从抽象结构落到具体系统里。
ChemCrow 是科研场景里的代表。它把 LLM 和 13 个化学专家工具结合起来,处理有机合成、药物发现、材料设计等任务。这个系统延续了 ReAct 和 MRKL 的思路:模型根据任务选择工具,在工具观察结果基础上继续推理。
ChemCrow 的一个关键观察是,LLM 作为评价器可能无法可靠判断深度专业领域里的答案质量。原文提到,在 LLM-based evaluation 看起来 GPT-4 和 ChemCrow 接近,但专家人工评估更关注完成度和化学正确性,结果显示 ChemCrow 明显优于 GPT-4。这说明在专业领域里,Agent 的价值往往不只是“回答更像”,而是能不能把专业工具、约束和验证过程接入系统。
Boiko 等人的科学发现 Agent 则进一步讨论了风险边界。它可以浏览互联网、阅读文档、执行代码、调用机器人实验 API,也可以在药物发现等任务中产生实验计划。但当任务涉及已知化学武器或危险合成路径时,系统可能出现安全风险。这个案例提醒我们:Agent 一旦接入工具和现实执行环境,安全问题就不再只是“模型说错话”,而可能变成“系统做错事”。
Generative Agents 是另一个方向:25 个由 LLM 控制的虚拟角色在沙盒环境中生活和互动,形成类似 The Sims 的社会仿真。这个系统把记忆、反思、规划和行动结合起来,让角色根据过去经历和当前环境做出行为。
图 13 展示了 Generative Agents 的架构。Memory stream 记录角色经历,Retrieval 根据相关性、近期性、重要性检索记忆,Reflection 把过去事件合成为更高层推论,Planning & Reacting 则把这些信息转成具体行为。这个案例最有意思的地方在于,它展示了 Agent 不只是“完成任务”,还可以“维持行为连续性”。
这种连续性对未来很多产品都很关键。一个 AI 助理如果今天完全不记得昨天的协作背景,就很难成为真正的工作伙伴;一个游戏 NPC 如果无法形成关系记忆,就很难产生可信行为;一个企业 Agent 如果不理解历史任务和组织流程,就很难进入核心业务。
AutoGPT 和 GPT-Engineer 代表的是早期通用 Agent Demo。它们展示了自然语言目标驱动工具链的可能性,也暴露了大量格式解析、短期记忆、任务边界和用户澄清问题。尤其是 AutoGPT,大量系统提示都围绕命令列表、JSON 输出、短期记忆限制、文件读写和自我批评展开。这说明早期 Agent 的工程重点并不神秘,很多时候就是让模型输出可以被程序稳定解析,让任务状态不至于丢失,让工具调用不要越界。
GPT-Engineer 的设计则强调需求澄清。它先让模型提出需要澄清的问题,再进入代码生成模式。这个设计非常有现实意义:Agent 不应该永远假装用户需求已经完整。很多真实软件工程任务的第一步不是写代码,而是搞清楚目标、约束和验收标准。
实验与证据:结果能支撑到什么程度
这篇文章不是一篇单一论文,所以它的“证据”来自多个研究和系统案例,而不是一个统一实验表。我们需要区分三类证据。
第一类证据来自方法论文的实验结果。ReAct 在知识密集型任务和决策任务中优于去掉 Thought 的 Act-only 基线,说明显式推理轨迹对环境交互有帮助。Reflexion 在 AlfWorld 和 HotpotQA 等任务上通过反思记忆提升表现,说明失败轨迹可以在上下文层面转化为下一轮行动的约束。Algorithm Distillation 在需要记忆和探索的环境中接近 RL^2,说明历史轨迹条件化可以让模型学到某种 in-context 改进过程。
第二类证据来自系统案例。HuggingGPT、ChemCrow、Generative Agents 等案例说明,把 LLM 和外部工具、记忆、规划系统结合,可以产生超出单次问答的复杂行为。它们不是证明“Agent 已经可靠自主”,而是证明“LLM 可以作为系统控制器,组织多个模块协作”。
第三类证据来自失败和限制。上下文长度有限、长程规划不稳、自然语言接口格式不可靠、工具参数容易错、专业领域评价困难,这些都不是边缘问题,而是 Agent 系统的核心瓶颈。某种意义上,文章最有价值的部分恰恰是这些限制,因为它们把 Agent 从幻想拉回工程现实。
Rocky 认为,这篇文章能支撑的结论是:LLM Agent 作为系统范式是成立的,但作为全自动可靠执行体还远未成熟。规划、记忆、工具、反思都能提升能力,但每一项都引入新的误差来源。一个 Agent 系统如果没有评测、权限、日志、异常处理和人类介入机制,很难在高风险任务中稳定落地。
这篇工作的边界与可复现性
这篇博客的边界也很清楚。
首先,它更像一个高质量技术综述,而不是一个端到端系统实现。它把当时的重要方法和案例组织成 Agent 框架,但没有提供一个统一的可复现实验环境。因此读者不能把它当成某个系统的性能证明,而应该把它当成理解 Agent 架构的地图。
其次,文章讨论的大量方法处在 2023 年早期 Agent 浪潮中,很多系统更接近 proof-of-concept。AutoGPT、GPT-Engineer 等项目展示了很强的想象力,但也存在稳定性和工程边界问题。回看这些项目,最重要的收获不是“早期 Demo 是否完美”,而是它们把 Agent 需要解决的问题暴露得很充分:任务拆解、工具协议、状态保存、格式解析、失败恢复、用户澄清。
第三,记忆和反思机制容易被过度解读。向量数据库不等于真正长期记忆,自我反思不等于模型参数层面的持续学习。它们更像系统层面的状态增强和上下文增强。有效,但有边界。
第四,工具使用带来的安全风险在原文里已经出现端倪。尤其是科学实验、药物合成、机器人 API、外部账户操作等场景,Agent 的行动可能产生现实后果。越是接近真实执行,越需要权限控制、沙箱、审计、人类确认和风险分类。
如果继续研究/落地,应该关注什么
如果把这篇文章作为 Agent 研究和产品落地的起点,后续最值得关注的不是“再包装一个 Agent 框架”,而是五个更硬的问题。
第一,规划能力如何从自然语言列表走向可验证任务图。很多 Agent 失败,是因为它只有“看起来像计划”的文本,没有严格的依赖关系、状态约束、验收条件和失败回退。未来更可靠的 Agent,应该把计划表示成可执行的 DAG、状态机或工作流,而不是只保存在自由文本里。
第二,记忆系统如何从向量检索走向可信状态管理。Agent 需要的不只是相似内容,还需要事实性、时效性、权限、来源、重要性、用户偏好和任务上下文。长期记忆如果没有清洗和治理,很容易变成长期污染。
第三,工具调用如何从 Prompt 协议走向工程协议。真实业务系统需要类型检查、参数校验、权限控制、错误码、重试、回滚、审计日志和人类确认。Agent 的工具层越像严肃软件工程,它越有机会进入生产。
第四,反思机制如何从语言总结走向可评测改进。模型说“我下次会改正”没有意义,关键是下一次是否真的减少同类错误。因此 Agent 需要可量化的任务轨迹评测,而不是只依赖模型自我评价。
第五,安全边界如何前置设计。Agent 不是普通聊天机器人,它有行动能力。对于代码执行、网络访问、金融交易、实验操作、账户权限等场景,安全策略必须成为系统架构的一部分,而不是上线前补一个提示词。
术语与概念速查
| 概念 | 本文中的含义 | Rocky 视角下的本质 |
|---|---|---|
| LLM Agent | 以大模型为核心控制器的智能体系统 | 把语言模型放进任务闭环,而不是只做单次回答 |
| Planning | 任务分解、路径搜索、计划生成和调整 | 控制流设计,决定复杂任务能否推进 |
| Chain of Thought | 让模型显式生成中间推理步骤 | 把隐式推理转成可观察文本轨迹 |
| Tree of Thoughts | 同一步生成多条候选思路并搜索 | 把推理链扩展成状态空间搜索 |
| ReAct | Reasoning 和 Acting 交替循环 | Agent 的基础行动协议:想、做、看、再想 |
| Reflexion | 把失败轨迹总结成反思并写入记忆 | 上下文层面的失败经验压缩 |
| Memory | 短期上下文与长期外部存储 | Agent 的状态管理系统 |
| MIPS / ANN | 向量检索中的近似相似搜索 | 长期记忆被重新接入当前决策的底层机制 |
| Tool Use | 调用搜索、计算、API、代码、模型等外部工具 | 模型从语言空间进入操作空间的接口 |
| MRKL | LLM 路由到专家模块的神经符号架构 | 让模型做调度器,而不是亲自做所有事 |
| API-Bank | 工具增强 LLM 的评测基准 | 把工具调用拆成可评价的多个决策点 |
| Generative Agents | 多智能体社会仿真系统 | 记忆、反思、规划共同产生行为连续性 |
拓展思考:值得继续扩展研究与思考的创新点
这篇文章最值得延展的地方,是它隐含地提出了一个 Agent 系统的“操作系统类比”。如果 LLM 是 CPU 或大脑,那么规划是调度器,记忆是状态和存储,工具是外设和系统调用,反思是错误诊断和反馈优化,权限与安全则是内核边界。这个类比并不完美,但它能帮助我们避免一个常见误区:把 Agent 能力全部归因于模型本身。
Rocky 认为,未来真正有价值的 Agent 产品,大概率不是最会喊“自主”的产品,而是最懂系统边界的产品。它知道哪些任务可以自动完成,哪些任务必须请求确认;知道哪些记忆应该长期保存,哪些信息必须过期;知道什么时候应该调用工具,什么时候应该停止;知道失败之后如何收集证据,而不是编造解释。
从技术研究看,Agent 的下一个关键问题会集中在可靠性和可验证性上。早期 Agent 追求“能不能做”,下一阶段 Agent 必须回答“做得对不对、错了怎么知道、怎么恢复、谁来负责”。这会推动任务图、工具协议、评测基准、安全沙箱、人机协作界面成为核心基础设施。
从产品落地看,Agent 的价值也不是替代所有人,而是进入具体工作流。客服、数据分析、代码开发、科研助理、运营自动化、知识管理、企业内部流程,都不是只靠一个聊天框就能解决。真正能沉淀商业价值的 Agent,需要理解业务上下文,接入真实工具链,并在低风险场景中逐步获得信任。
从个人能力看,这篇文章也给 AI 从业者一个很强的提醒:未来的竞争不只是会不会调 Prompt,而是能不能理解模型、检索、工具、数据、工作流和业务目标之间的关系。工具红利会退潮,认知红利会留下。一个工程师如果只懂模型调用,很容易被更强的基础模型吸收;但如果能把模型组织进可执行系统,就更接近 Agent 时代真正稀缺的能力。
最后回到 Lilian Weng 这篇文章本身。它真正重要的地方,不是预言了某一个产品,而是把 Agent 从一个令人兴奋的概念,拆成了可以研究、可以工程化、可以质疑的系统结构。今天再读它,最应该记住的不是“Agent 很强”,而是:Agent 的本质,是让模型在记忆、工具、规划和反馈构成的闭环里持续推进任务;它的上限来自模型能力,它的下限取决于系统工程。
参考资料
- Lilian Weng. LLM Powered Autonomous Agents. Lil’Log, 2023.
- Wei et al. Chain of Thought Prompting Elicits Reasoning in Large Language Models. NeurIPS 2022.
- Yao et al. ReAct: Synergizing Reasoning and Acting in Language Models. ICLR 2023.
- Yao et al. Tree of Thoughts: Deliberate Problem Solving with Large Language Models. 2023.
- Shinn and Labash. Reflexion: an Autonomous Agent with Dynamic Memory and Self-Reflection. 2023.
- Shen et al. HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face. 2023.
- Li et al. API-Bank: A Benchmark for Tool-Augmented LLMs. 2023.
- Park et al. Generative Agents: Interactive Simulacra of Human Behavior. 2023.
推荐阅读
Rocky一直在运营技术交流群(WeThinkIn-技术交流群),这个群的初心主要聚焦于技术话题的讨论与学习,包括但不限于算法,开发,竞赛,科研以及工作求职等。群里有很多人工智能行业的大牛,欢迎大家入群一起学习交流~(请添加小助手微信Jarvis8866,拉你进群~)
1. 深入浅出完整解析AI Agent(AI智能体)的核心基础知识
2025年可以说是AI Agent全面落地应用的元年,因此Rocky在持续撰写对AI Agent的全维度解析文章:深入浅出完整解析AI Agent(AI智能体)的核心基础知识
2. 深入浅出完整解析扩散模型DDPM、DDIM、Classifier/Classifier-Free Guidance、Rectified Flow核心基础知识
和Rocky一起学习探究扩散模型的本质原理与和核心基础知识,同时不断跟进扩散模型的最新发展。Rocky在本文中对扩散模型的本质做了全面系统的梳理与讲解:深入浅出完整解析扩散模型DDPM、DDIM、SDE、Classifier/Classifier-Free Guidance、Rectified Flow核心基础知识
3. 深入浅出完整解析FLUX.2、Seedream(即梦)、Z-image、GLM-Image核心基础知识
https://zhuanlan.zhihu.com/p/1975174691049189562
4. 深入浅出完整解析FLUX.1 Kontext和FLUX.1 Krea核心基础知识
深入浅出完整解析FLUX.1 Kontext和FLUX.1 Krea核心基础知识
5. 深入浅出完整解析DeepSeek系列核心基础知识
深入浅出完整解析DeepSeek系列核心基础知识
6、Sora等AI视频大模型的核心原理,核心基础知识,网络结构,经典应用场景,从0到1搭建使用AI视频大模型,从0到1训练自己的AI视频大模型,AI视频大模型性能测评,AI视频领域未来发展等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Sora等AI视频大模型文章地址:深入浅出完整解析Sora、Wan2.1、AnimateDiff、CogVideoX等AI视频大模型核心基础知识
7、Stable Diffusion 3和FLUX.1核心原理,核心基础知识,网络结构,从0到1搭建使用Stable Diffusion 3和FLUX.1进行AI绘画,从0到1上手使用Stable Diffusion 3和FLUX.1训练自己的AI绘画模型,Stable Diffusion 3和FLUX.1性能优化等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Stable Diffusion 3和FLUX.1文章地址:深入浅出完整解析Stable Diffusion 3(SD 3)和FLUX.1系列核心基础知识
8、Stable Diffusion XL核心基础知识,网络结构,从0到1搭建使用Stable Diffusion XL进行AI绘画,从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型,AI绘画领域的未来发展等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Stable Diffusion XL文章地址:深入浅出完整解析Stable Diffusion XL(SDXL)核心基础知识
9、Stable Diffusion 1.x-2.x核心原理,核心基础知识,网络结构,经典应用场景,从0到1搭建使用Stable Diffusion进行AI绘画,从0到1上手使用Stable Diffusion训练自己的AI绘画模型,Stable Diffusion性能优化等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Stable Diffusion文章地址:深入浅出完整解析Stable Diffusion(SD)核心基础知识
10、ControlNet核心基础知识,核心网络结构,从0到1使用ControlNet进行AI绘画,从0到1训练自己的ControlNet模型,从0到1上手构建ControlNet商业变现应用等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
ControlNet文章地址:深入浅出完整解析ControlNet核心基础知识
11、LoRA系列模型核心原理,核心基础知识,从0到1使用LoRA模型进行AI绘画,从0到1上手训练自己的LoRA模型,LoRA变体模型介绍,优质LoRA推荐等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
LoRA文章地址:深入浅出完整解析LoRA(Low-Rank Adaptation)模型核心基础知识
12、深入浅出完整解析AIGC时代Transformer核心基础知识
在AIGC时代中,Transformer为AI行业带来了深刻的变革。Transformer架构正在一步一步重构所有的AI技术方向,成为AI技术架构大一统与多模态整合的关键核心基座,大有一统“AI江湖”之势。Rocky也对Transformer模型进行持续的深入浅出梳理与解析:
Transformer文章地址:深入浅出完整解析AIGC时代Transformer核心基础知识
13、最全面的AIGC面经《手把手教你成为AIGC算法工程师,斩获AIGC算法offer!(2024年版)》文章正式发布!
码字不易,欢迎大家多多点赞:
AIGC面经文章地址:手把手教你成为AIGC算法工程师,斩获AIGC算法offer!
14、50万字大汇总《“三年面试五年模拟”之算法工程师的求职面试“独孤九剑”秘籍》文章正式发布!
码字不易,欢迎大家多多点赞:
算法工程师三年面试五年模拟文章地址:https://zhuanlan.zhihu.com/p/545374303
《三年面试五年模拟》github项目地址(希望大家能多多star):https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer
15、Stable Diffusion WebUI、ComfyUI、Fooocus三大主流AI绘画框架核心知识,从0到1搭建AI绘画框架,从0到1使用AI绘画框架的保姆级教程,深入浅出介绍AI绘画框架的各模块功能,深入浅出介绍AI绘画框架的高阶用法等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
AI绘画框架文章地址:深入浅出完整解析主流AI绘画框架(ComfyUI、Stable Diffusion WebUI、Fooocus)核心基础知识
16、GAN网络核心基础知识,网络架构,GAN经典变体模型,经典应用场景,GAN在AIGC时代的商业应用等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
GAN网络文章地址:https://zhuanlan.zhihu.com/p/663157306
17. AI算法工程师的《三年面试五年模拟》求职秘籍
AIGC时代的算法工程师的求职面试秘籍(持续更新中)
18. AIGC产业的深度思考与分析
2023年3月21日,微软创始人比尔·盖茨在其博客文章《The Age of AI has begun》中表示,自从1980年首次看到图形用户界面(graphical user interface)以来,以OpenAI为代表的科技公司发布的AIGC模型是他所见过的最具革命性的技术进步。
Rocky也认为,AIGC及其生态,会成为AI行业重大变革的主导力量。AIGC会带来一个全新的红利期,未来随着AIGC的全面落地和深度商用,会深刻改变我们的工作、生活、学习以及交流方式,各行各业都将被重新定义,过程会非常有趣。
那么,在此基础上,我们该如何更好的审视AIGC的未来?我们该如何更好地拥抱AIGC引领的革新?Rocky准备从技术、产品、商业模式、长期主义等维度持续分享一些个人的核心思考与观点,希望能帮助各位读者对AIGC有一个全面的了解:
深入浅出全面解析AIGC时代核心价值与发展趋势(2025年版)