一、Deep Agents 是什么
Deep Agents是 LangChain 官方推出的生产级 Agent Harness(智能体驾驭层),基于LangGraph(执行引擎)+ LangChain(工具 / 模型层)构建,面向长周期、多步骤、复杂目标设计。
一句话对比:
- 普通 Agent:你问一句、它做一步(临时工)
- Deep Agents:你给一个目标,它拆计划、分工、执行、沉淀、交付(项目负责人)
核心定位:把 LLM 的 “智能” 包装成可观测、可控制、可稳定运行的复杂任务执行环境。
- 开源:MIT 协议(商用自由)
- 模型:完全无关,支持所有工具调用型 LLM
- 运行时:LangGraph 提供持久化、断点续跑、流式输出LangChain
二、核心架构(四层)
1)入口层(Harness)
- create_deep_agent:工厂函数,一行生成完整 Agent
- 内置系统提示词模板(规范思考 / 行动 / 输出格式)
2)核心能力层(四大支柱)
- 显式规划(Planning):内置
write_todos,把目标拆成待办列表(状态:pending/in_progress/completed),每步审查 + 更新,失败调整计划而非盲目重试。 - 上下文管理(Context)
- 虚拟文件系统(VFS):
ls/read_file/write_file/edit_file,把大上下文卸载到文件,突破窗口限制。 - 自动摘要:长会话自动压缩旧消息,降低 token 占用。
- 虚拟文件系统(VFS):
- 层级子 Agent(Subagents):
task工具生成独立上下文子 Agent(如 Researcher/Coder/Writer),主 Agent 只做编排 + 汇总,避免上下文污染LangChain。 - 持久记忆(Memory):基于 LangGraph Store/PostgreSQL,跨会话、跨线程保存状态、文件、偏好LangChain。
3)工具与执行层
- Shell 执行:沙箱(Modal/Deno/Daytona)中运行
execute,支持测试、Git、构建等,隔离主机。 - MCP 协议:接入任意 MCP Server,调用外部工具 / API / 数据库。
- Skill 系统:可复用能力包(如 “论文阅读”“TDD 编码”),固化经验,避免每次写 prompt。
4)生产运行时(Runtime)
- 持久化执行:崩溃 / 部署后断点续跑,支持小时级任务LangChain。
- 人机闭环(Human-in-the-loop):关键操作人工审批 / 编辑 / 拒绝。
- 可观测性:日志、追踪、审计,全链路可查。
三、Deep Agents vs 普通 LangChain Agent
表格
| 能力 | 普通 Agent(create_agent) | Deep Agents |
|---|---|---|
| 工具调用 | ✅ | ✅ |
| 多轮对话 | ✅ | ✅ |
| 任务规划 | ❌ 隐式、易混乱 | ✅ 显式待办、可追踪 |
| 文件系统 | ❌ 自己实现 | ✅ 内置 VFS、自动上下文卸载 |
| 子 Agent | ❌ 自己实现 | ✅ 内置、上下文隔离 |
| 长期记忆 | ❌ 有限 | ✅ 跨会话、持久化 |
| 沙箱执行 | ❌ 无 | ✅ 内置、安全隔离 |
| 生产就绪 | ❌ 需大量二次开发 | ✅ 开箱即用 |
四、典型工作流程(示例:写一篇技术博客)
- 规划:Agent 生成待办(调研→大纲→初稿→修改→发布)
- 子 Agent 分工:
- Researcher:搜索资料、整理要点
- Writer:写初稿、保存到 VFS
- Reviewer:修改润色
- 上下文管理:长文本写入文件,避免窗口溢出
- 执行与迭代:按计划执行,失败调整待办
- 交付:汇总结果,输出最终博客
五、适用场景
- 复杂研究:文献综述、数据分析、报告生成
- 软件开发:全栈项目生成、测试、部署
- 内容创作:长文、小说、剧本、营销文案
- 企业自动化:报表生成、流程审批、数据处理
- 个人助理:长期任务管理、邮件处理、日程安排
六、快速上手(Python 伪代码)
python
运行
from langchain_deepagents import create_deep_agent from langchain_openai import ChatOpenAI # 1. 基础模型 llm = ChatOpenAI(model="gpt-4o") # 2. 创建 Deep Agent(内置规划、VFS、子Agent) agent = create_deep_agent( llm=llm, system_prompt="你是资深技术博主,擅长写高质量AI技术文章", tools=[], # 可添加自定义工具 subagents=["researcher", "writer", "reviewer"] ) # 3. 运行任务 result = agent.run("写一篇 2000 字的 Deep Agents 技术详解博客") print(result)七、与 LangChain/LangGraph 的关系
- LangGraph:底层 Runtime(发动机),负责状态管理、持久化、流式执行。
- LangChain:工具 / 模型生态(基础零件),提供模型集成、工具接口、记忆组件。
- Deep Agents:上层 Harness(整车),把 LangGraph+LangChain 封装成开箱即用的生产级 Agent。
官方比喻:
- LangGraph = 发动机
- LangChain create_agent = 基础车
- Deep Agents =高配车(所有选配装好)
八、优缺点
优点
- ✅开箱即用:一行代码创建生产级 Agent
- ✅复杂任务能力强:规划 + 子 Agent + 文件系统,解决长周期任务
- ✅生产就绪:持久化、可观测、安全沙箱、人机闭环
- ✅模型无关:支持所有主流 LLM
- ✅完全开源:MIT 协议,无供应商锁定
缺点
- ❌学习曲线:比普通 Agent 复杂,需理解规划、子 Agent、VFS 等概念
- ❌资源消耗:长会话 + 多子 Agent,token 与计算成本较高
- ❌抽象成本:高度封装,定制底层逻辑需 override 组件
九、总结
Deep Agents 是 LangChain 生态的 “Agent 2.0”,核心是显式规划、层级子 Agent、虚拟文件系统、持久记忆四大能力,把 LLM 从 “问答工具” 升级为能独立完成复杂项目的智能体。