news 2026/3/13 19:23:42

Clawdbot架构深度剖析 - 大模型Agent设计与底层原理解析

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Clawdbot架构深度剖析 - 大模型Agent设计与底层原理解析

Clawdbot(OpenClaw)是一种基于TypeScript的智能个人助理,文章详细解析了其架构组件:频道适配器、网关服务器、Agent执行器等,特别介绍了其创新记忆系统(会话转录和记忆文件)和安全性机制。该系统能在本地执行工具操作,使用语义快照技术进行浏览器交互,而非传统截图。这种设计使其成为理解大模型Agent架构的优秀案例,为开发者提供了实用的技术参考。


Clawdbot(也称为Moltbot,最近又改名为OpenClaw)在Agent执行、工具使用、浏览器等方面的架构值得关注。深入了解Clawdbot的底层原理,有助于更好地理解其系统及能力,尤其是它擅长的地方,以及能力边界。

本文从技术层面介绍Clawdbot的工作原理,探讨它如何处理记忆和执行任务。

1Clawdbot的技术背景

Clawdbot是一种智能个人助理,既可以在本地运行,也可以通过模型API进行访问,使用方式类似手机上的应用程序。其核心技术是基于TypeScript的CLI应用程序,而不是Python、Next.js或者Web应用程序。它的工作方式包括:

  • 在本地设备上运行,并提供网关服务器来处理所有的频道连接(如Telegram、WhatsApp、Slack等)。
  • 调用LLM API(如Anthropic、OpenAI、本地等)。
  • 在本地执行工具,并且可以在计算机上执行各种操作。

2架构

以下是Clawdbot处理信息的基本流程:

1. 频道适配器(Channel Adapter)
频道适配器接收消息并处理(标准化、提取附件等)。每种消息平台都有自己的适配器。

2. 网关服务器(Gateway Server)
网关服务器是任务/会话的协调者,它将消息传递到正确的会话。它是Clawdbot的核心,能够处理多个重叠的请求。为了序列化操作,Clawdbot使用基于车道(Lane)的命令队列。每个会话有自己的专用车道,低风险可并行执行的任务可以在不同的车道上并行执行(如定时任务)。

这种设计避免了常见的async/await混乱,过度并行化会破坏系统的可靠性,带来调试的噩梦。默认采用串行执行,只有明确要求时才会进行并行处理。

3. Agent执行器(Agent Runner)
Agent执行器负责选择使用哪个模型,挑选API密钥(如果没有密钥,它会标记配置并尝试下一个密钥)。如果主模型失败,它会回退到其他模型。Agent执行器动态组装系统提示,结合可用的工具、技能、记忆,并加入会话历史(从.jsonl文件中读取)。

接下来,Agent执行器将提示传递给上下文窗口守卫,确保上下文空间足够。如果上下文接近满负荷,它会压缩会话内容(总结上下文),或者在无法继续时优雅地退出。

4. LLM API调用(LLM API Call)
这个过程会流式传输响应,并在不同的提供商之间进行抽象。如果模型支持,Agent还可以请求扩展思考。

5. Agent循环(Agentic Loop)
如果LLM返回了工具调用响应,Clawdbot会在本地执行该工具,并将结果添加到会话中。这一过程会持续进行,直到LLM返回最终文本或者达到最大回合数(默认为20回合)。

6. 响应路径(Response Path)
这一部分比较标准,响应通过频道返回给用户。会话还会通过基本的JSONL格式进行持久化,每行一个JSON对象,包含用户消息、工具调用、结果、响应等。这是Clawdbot如何记住信息(基于会话的记忆)。

3Clawdbot的记忆系统

没有适当的记忆系统,AI助手的效果就像金鱼一样。Clawdbot通过以下两种系统处理记忆:

  • 会话转录(Session Transcripts)以JSONL格式保存。
  • 记忆文件(Memory Files)存储在MEMORY[.]mdmemory/文件夹下。

在搜索时,它使用向量搜索和关键词匹配的混合方式,结合了两者的优点。因此,搜索“认证错误”不仅能找到包含“auth issues”的文档(语义匹配),还能够找到包含准确短语的文档(关键词匹配)。

向量搜索使用SQLite,而关键词搜索则使用FTS5(SQLite扩展)。嵌入提供者是可配置的。它还支持智能同步,当文件变动时触发。

这些记忆文件是通过Agent自己使用标准的“写入”工具生成的,而没有特别的记忆写入API。Agent直接写入memory/*.md文件。

每当新的对话开始时,Clawdbot会读取之前的对话,并将总结写入Markdown格式。这种简洁的记忆系统类似于工作流记忆。没有复杂的记忆合并或定期压缩。

这种简化有其优点,但也有一定的局限性。从可解释性角度看,简化设计比复杂的代码更加易于理解,也减少了潜在的错误。

4Clawdbot如何利用计算机

Clawdbot的一大优势是能够在计算机上执行各种操作。其工作原理如下:

Clawdbot通过exec工具运行shell命令:

  • 默认情况下,命令会在Docker容器中运行。
  • 它也可以直接在主机上运行命令。
  • 还支持在远程设备上运行命令。

除了执行命令外,Clawdbot还提供了文件系统工具(读取、写入、编辑)、浏览器工具(基于Playwright,支持语义快照),以及进程管理工具(管理后台长期命令、终止进程等)。

5安全性(或缺乏安全性)

Clawdbot提供了允许列表(Allowlist)机制,允许用户批准某些命令(可以选择一次性批准、始终批准或拒绝提示)。
对于安全命令(如jqgrepcut等)是预先批准的,而危险的shell命令则默认被阻止。

例如,以下命令会被拒绝执行:

  • npm install $(cat /etc/passwd)
  • cat file > /etc/hosts
  • rm -rf / || echo "failed"
  • (sudo rm -rf /)

这种安全性设计与Claude Code类似,允许用户根据需求授予适当的权限,同时尽量保持系统的自主性。

6浏览器:语义快照

Clawdbot的浏览器工具不依赖于传统的截图,而是使用语义快照,这是一种基于文本的表示页面可访问性树(ARIA)的方式。

因此,Agent能够读取到页面的语义结构:

  • 按钮“Sign In” [ref=1]
  • 文本框“Email” [ref=2]
  • 文本框“Password” [ref=3]
  • 链接“Forgot password?” [ref=4]
  • 标题“Welcome back”
  • 列表
  • 列表项“Dashboard”
  • 列表项“Settings”

这种方式带来了几个显著优势。

首先,浏览网站不仅仅是视觉上的任务;

其次,传统截图可能大于5MB,而语义快照的大小不到50KB;

最后,显著降低了token的使用成本。

如何学习AI大模型?

如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!


第一阶段:从大模型系统设计入手,讲解大模型的主要方法;

第二阶段:在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段:大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段:大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段:大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段:以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段:以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

100套AI大模型商业化落地方案

大模型全套视频教程

200本大模型PDF书籍

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

LLM面试题合集

大模型产品经理资源合集

大模型项目实战合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/11 13:55:15

2026年AI大模型彻底爆发,从入门到高薪,一篇搞定

AI大模型迎来爆发式增长,岗位需求激增543%,高薪岗位涌现。自学面临资源零散、缺乏指导、跟不上发展速度三大困境。专业培训提供系统化内容、及时反馈和实战项目,是快速掌握AI技能的最优路径。未来职场趋势是"AI岗位"模式&#xff0…

作者头像 李华
网站建设 2026/3/13 9:18:38

解锁周庄:从双桥到沈厅,读懂枕水江南的精髓

周庄,位于江苏省昆山市西南部,是一座四面环水、由澄湖、淀山湖、南湖等湖泊环抱的“岛中之镇”。这座古镇始于北宋时期,至今已有九百余年历史,以保存完好的明清建筑群落、纵横交错的“井”字形河道体系和“小桥、流水、人家”的典…

作者头像 李华
网站建设 2026/3/11 19:04:11

破解大模型交付困境:从“烧钱“到“赚钱“的转型指南

大模型交付面临成本与收益倒挂困境:高固定成本与线性收入模式不匹配。解决方案是从"项目制"转型为"产品化"模式,通过构建"资产漏斗"将交付转化为资产沉淀,降低边际成本,提升价值溢价。同时需改变与…

作者头像 李华
网站建设 2026/3/13 7:01:19

小白/程序员如何成功转型大模型行业?全方位指南与岗位解析

本文探讨了进入AI行业的路径选择,针对不同背景人群提出建议:非技术背景者可考虑AI产品、运营、分析等岗位;刚毕业学生可根据风险偏好选择杭州(新兴AI企业)或清华(学术氛围);转行需培养AI理解能力和项目思维,建议先工作…

作者头像 李华
网站建设 2026/3/12 6:35:42

大模型时代AI产品岗招聘火爆:零基础小白如何1-2个月快速上岸?2026年从被裁员到涨薪转行到AI圈,我是怎么做到的?

文章介绍AI产品岗位招聘火爆情况,强调12月是转行AI的最佳启动点,可避开竞争高峰。详细列举2026年AI高薪岗位TOP4,展示多个成功转行案例。课程专为土建背景人士设计,通过系统学习和实战项目,帮助学员在2-4个月内完成转行…

作者头像 李华