在过去的两三年中,LangChain 的 Agent 架构经历了翻天覆地的变化。对于许多开发者来说,从create_openai_tools_agent和AgentExecutor迁移到现代化的架构不仅是 API 的替换,更是思维模式的根本转变。
本文将以极其详尽的代码实例,深度剖析 LangChain Agent 架构的“旧范式”与“新范式”,揭示它们背后的设计哲学差异,并指导你如何在企业级生产环境中做出正确的架构选择。
1. 旧范式:黑盒化的 AgentExecutor
1.1 核心组件
在 LangChain v0.1.0 时代(及更早),构建一个具备 Tool Calling 能力的 Agent 通常涉及两个核心组件:
- Factory Function (
create_openai_tools_agent): 负责将 LLM、Prompt 和 Tools 组装成一个Runnable(Agent 定义)。 - Runtime Engine (
AgentExecutor): 负责执行 Agent 的思考-行动循环(Think-Act Loop)。
1.2 代码解剖
让我们看一个典型的旧范式实现:
fromlangchain.agentsimportAgentExecutor,create_openai_tools_agentfromlangchain_openaiimportChatOpenAIfromlangchainimporthub# 1. 准备工具tools=[get_weather_tool,search_tool]# 2. 准备 Prompt (通常从 LangSmith Hub 拉取)# 这个 Prompt 包含了复杂的 {agent_scratchpad} 占位符,用于存放中间步骤prompt=hub.pull("hwchase17/openai-tools-agent")# 3. 初始化 LLMllm=ChatOpenAI(model="gpt-4-turbo",temperature=0)# 4. 创建 Agent (The Brain)# 这是一个 Runnable,输入是 {input, chat_history},输出是 AgentAction 或 AgentFinishagent=create_openai_tools_agent(llm,tools,prompt)# 5. 创建 Executor (The Body)# 这是一个循环控制器,负责解析 Agent 输出,执行工具,并将结果喂回给 Agentagent_executor=AgentExecutor(agent=agent,tools=tools,verbose=True,handle_parsing_errors=True,max_iterations=5)# 6. 执行result=agent_executor.invoke({"input":"What is the weather in SF?"})1.3 致命缺陷
尽管AgentExecutor让 demo 跑得很快,但它在生产环境中暴露出了严重的问题:
- 黑盒循环: 你无法控制循环的内部逻辑。比如,你想在 Tool 执行前人工审批?很难。你想在 Tool 报错时执行特定的重试策略?非常麻烦。
- 流式输出困难:
AgentExecutor的流式输出粒度非常粗(Step 级别),很难实现 Token 级别的平滑流式体验,尤其是在前端需要区分“思考内容”和“最终答案”时。 - Prompt 强耦合: 它严重依赖特定的 Prompt 结构(如
agent_scratchpad),导致切换模型或自定义 Prompt 变得异常痛苦。
2. 新范式:LCEL 与 LangGraph 的崛起
为了解决上述问题,LangChain 推出了两套互相配合的“新范式”:
- LCEL (LangChain Expression Language): 提供底层的、原子的组件组合能力。
- LangGraph: 提供状态机(State Machine)级别的循环控制能力。
2.1 方案 A:轻量级 LCEL (bind_tools)
如果你只需要一个简单的 Tool Calling 流程,不需要复杂的循环,LCEL 是最佳选择。
取代对象:create_openai_tools_agent
# 新范式:纯 LCEL 实现fromlangchain_openaiimportChatOpenAIfromlangchain_core.promptsimportChatPromptTemplatefromlangchain_core.runnablesimportRunnablePassthrough# 1. 绑定工具 (Native Tool Calling)# 不再需要复杂的 create_xxx_agent,直接用 bind_toolsllm=ChatOpenAI(model="gpt-4-turbo")llm_with_tools=llm.bind_tools(tools)# 2. 定义简单的 Promptprompt=ChatPromptTemplate.from_messages([("system","You are a helpful assistant."),("user","{input}"),])# 3. 组合链chain=prompt|llm_with_tools# 4. 执行# 结果是原生的 AIMessage,包含 .tool_calls 属性msg=chain.invoke({"input":"What is the weather in SF?"})ifmsg.tool_calls:# 开发者自己决定如何执行工具,拥有完全的控制权fortool_callinmsg.tool_calls:print(f"Calling{tool_call['name']}with{tool_call['args']}")优势:
- 透明: 没有黑盒,每一步都是标准的 Runnable。
- 原生: 直接利用模型原生的 Tool Calling API,不再需要 Prompt Hacking (
agent_scratchpad)。
2.2 方案 B:LangGraph (prebuilt.create_react_agent)
如果你需要一个具备完整循环、记忆、流式输出能力的 Agent(即替代AgentExecutor),LangGraph 是标准答案。
取代对象:AgentExecutor
# 新范式:LangGraph 实现fromlanggraph.prebuiltimportcreate_react_agentfromlanggraph.checkpoint.memoryimportMemorySaver# 1. 初始化模型和工具model=ChatOpenAI(model="gpt-4-turbo")tools=[get_weather_tool]# 2. 状态持久化 (可选)checkpointer=MemorySaver()# 3. 创建 Graph# 这取代了 AgentExecutor,构建了一个标准的状态机图app=create_react_agent(model,tools,checkpointer=checkpointer)# 4. 执行 (支持细粒度流式)inputs={"messages":[("user","What is the weather in SF?")]}config={"configurable":{"thread_id":"thread-1"}}# stream_mode="values" 可以实时获取消息列表的更新foreventinapp.stream(inputs,config=config,stream_mode="values"):event["messages"][-1].pretty_print()LangGraph 的核心优势:
- 状态机架构: Agent 的逻辑被显式定义为图(Nodes & Edges)。你可以清晰地看到数据如何在
Agent节点和Tools节点之间流转。 - 完全可控的循环: 你可以插入
Human-in-the-loop(人工介入)节点,可以在任何步骤暂停、修改状态、然后继续。 - 原生持久化: 内置 Checkpointer 机制,完美解决长对话的记忆问题。
3. 深度对比总结
| 特性 | 旧范式 (AgentExecutor) | 新范式 (LangGraph/LCEL) |
|---|---|---|
| 控制流 | 隐式、硬编码的 Pythonwhile循环 | 显式的图结构 (Graph),可定制 Edge |
| Prompt | 依赖agent_scratchpad等魔术变量 | 标准的消息列表 (list[BaseMessage]) |
| 流式能力 | 弱,只能流式输出 Callback 事件 | 强,支持 Token 级、消息级、更新级流式 |
| 调试难度 | 困难,内部状态不可见 | 容易,状态 (State) 是显式定义的字典 |
| 工具调用 | 依赖 OutputParser 解析文本 | 依赖模型原生的bind_toolsAPI |
4. 迁移建议
- 对于简单任务: 如果你只是想让 LLM 调一个工具并返回结果,不要用 Agent。直接使用LCEL (
llm.bind_tools)。它更快、更便宜、更稳定。 - 对于复杂 Agent: 立即迁移到LangGraph。
AgentExecutor已经被标记为 Legacy,且在复杂场景下(如多 Agent 协作)几乎不可用。LangGraph 提供了构建生产级 Agent 所需的一切原语。
拥抱新范式,意味着你不再是框架的“使用者”,而是 Agent 逻辑的“编排者”。