news 2026/4/28 17:09:23

03 | AI Agent 架构设计:任务规划与执行循环 ——OpenClaw、Claude Code、Hermes Agent 对比

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
03 | AI Agent 架构设计:任务规划与执行循环 ——OpenClaw、Claude Code、Hermes Agent 对比

03 | AI Agent 架构设计:任务规划与执行循环 ——OpenClaw、Claude Code、Hermes Agent 对比

声明:📝 作者:甜城瑞庄的核桃(ZMJ)
原创学习笔记,欢迎分享,但请保留作者信息及原文链接哦~


前言

基本信息内容
系列AI Agent 架构设计(三):任务规划与执行循环
核心目标执行循环解决四大痛点——规划能力、错误恢复、执行可见性、状态持久性,三个框架给出不同答案
适合读者想理解 Agent 执行机制和防失控设计的开发者
预计阅读20 分钟

记忆系统决定 Agent 知道什么,工具系统决定 Agent 能做什么。

执行循环决定 Agent 怎么把"知道的"和"能做的"结合起来,把一个用户指令变成一系列真实的操作。

一个设计糟糕的执行循环,会让 Agent 出现这些症状:

  • 盲目执行:接到复杂任务,直接冲进去执行,中途才发现方向错了
  • 无限重试:工具调用失败,无休止重试,消耗资源却没有进展
  • 过程黑盒:跑了很长时间,用户完全不知道在做什么,感觉像黑盒
  • 状态崩溃:任务执行到一半,上下文满了,状态丢失,从头来过

这四个症状对应四个架构问题:规划能力、错误恢复、执行可见性、状态持久性

三个框架对这四个问题,给出了截然不同的答案。


一、ReAct 循环:所有框架共同的底层

在拆解三个框架之前,先把共同的底层说清楚。

现代 Agent 框架普遍基于ReAct 模式(Reason-Act-Observe)

┌─────────────────────────────────────────────────────────────┐ │ ReAct 循环:AI Agent 的心脏 │ │ │ │ ┌──────────────────────────────────────────────────────┐ │ │ │ 1. 接受输入 (Input) │ │ │ │ 接受用户指令、工具清单、上下文 │ │ │ └────────────────────────┬─────────────────────────────┘ │ │ │ │ │ ▼ │ │ ┌──────────────────────────────────────────────────────┐ │ │ │ 2. 推理 (Reason) │ │ │ │ 分析用户指令,规划如何调用工具来完成任务 │ │ │ │ 决定下一步行动是什么 │ │ │ └────────────────────────┬─────────────────────────────┘ │ │ │ │ │ ▼ │ │ ┌──────────────────────────────────────────────────────┐ │ │ │ 3. 行动 (Act) │ │ │ │ 根据推理结果执行具体操作 │ │ │ │ 调用 API、文件操作、查询数据库… │ │ │ └────────────────────────┬─────────────────────────────┘ │ │ │ │ │ ▼ │ │ ┌──────────────────────────────────────────────────────┐ │ │ │ 4. 观察 (Observe) │ │ │ │ 接收执行结果反馈 │ │ │ │ 将结果作为下一步推理的输入依据 │ │ │ └────────────────────────┬─────────────────────────────┘ │ │ │ │ │ └──────────────→ 回到步骤 2 │ │ (循环,直到完成) │ └─────────────────────────────────────────────────────────────┘

ReAct 循环用来解决四个核心架构问题:

架构问题ReAct 的作用
规划能力Reason 阶段分析目标,防止盲目执行
错误恢复Observe 阶段接收失败结果,触发下一轮 Reason 重新规划
执行可见性每个循环步骤可被外部观察,消除黑盒感
状态持久性循环状态注入上下文,支持长程任务持续运行

这个循环听起来简单,但生产级实现的复杂度远超想象

从 Claude Code 泄露的源码里能看到一个侧面:仅QueryEngine.ts一个文件就有46,000 行,负责处理所有 LLM 调用、流式响应、缓存、重试和编排逻辑。

这不是意外的膨胀——这是 ReAct 循环在生产环境里运行所需要的工程量的真实写照。

生产级工程复杂度:冰山模型 [水面以上:可见的 ReAct 能力] 推理 → 行动 → 观察 → 循环 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ [水面以下:看不见的工程支撑] QueryEngine.ts(46,000 行) ├── LLM 调用管理与流式响应处理 ├── Prompt Cache 命中率优化 ├── 多层次重试策略(含熔断器) ├── 上下文 Compaction(3 次重试机制) └── 多 Agent 编排与状态同步 对比: OpenClaw → 无 QueryEngine 等价物,缺少工程级错误处理 Hermes → 迭代预算 + 双重超时监控,从框架层介入

三个框架的 ReAct 实现都建立在这个基础上,但在触发方式、规划深度、错误处理、停止条件上做出了不同的架构选择。


二、OpenClaw:双触发模式,被动响应 + 主动唤醒

2.1 核心设计:两种不同的执行入口

OpenClaw 的执行循环有一个很独特的设计——它有两种触发方式,各自走不同的路径:

┌──────────────────────────────────────────────────────
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/28 17:05:34

别再只看分辨率了!实测优酷、爱奇艺、B站、抖音的视频码率到底差多少(附省流量观看技巧)

视频码率真相:四大平台实测与省流量实战指南 在地铁刷剧突然卡成PPT,户外看视频疯狂转圈——这些糟心体验背后,隐藏着一个被多数人忽视的关键参数:视频码率。我们耗时72小时,对优酷、爱奇艺、B站、抖音四大平台的热门内…

作者头像 李华
网站建设 2026/4/28 17:04:30

Windows驱动管理终极指南:DriverStore Explorer深度解析与实战教程

Windows驱动管理终极指南:DriverStore Explorer深度解析与实战教程 【免费下载链接】DriverStoreExplorer Driver Store Explorer 项目地址: https://gitcode.com/gh_mirrors/dr/DriverStoreExplorer Windows驱动管理是每个高级用户和系统管理员必须掌握的技…

作者头像 李华
网站建设 2026/4/28 17:02:01

Mysql的快速安装与基本配置(Centos)

1.关闭防火墙systemctl stop firewalld systemctl disable firewalld2.安装Mysql依赖包yum install -y libaio numactl-libs##libaio:支持异步I/O操作,Mysql运行必需 ##numactl:优化多核cpu内存分配(非必需,但建议安装)3.创建专用…

作者头像 李华