【AI Agent开发书籍】《智能体设计模式：构建智能系统的实践指南》（全文）-开发者社区

10月初，谷歌资深工程主管、杰出工程师Antonio Gulli免费公开发布了一本长达400多页的新书——《Agentic Design Patterns: A Hands-On Guide to Building Intelligent Systems》。该书旨在为当前火热的AI Agent开发领域提供首批系统性的“设计模式”，更有条理地构建强大、可靠的智能系统。

全书内容覆盖从提示链、路由、工具使用等基础单元操作，到记忆管理、多智能体协作、安全护栏等高级主题，为开发者提供了一份从原型到生产实践的完整学习路线图。

本书正文部分共21个章节，分为四个部分，如图所示。

前言

欢迎阅读《智能体设计模式：构建智能系统的实践指南》。放眼现代人工智能领域，一条清晰的演进脉络展现在我们眼前：技术正从简单的反应式程序，演变为复杂的自主化实体。这些实体能够理解上下文、制定决策，并与环境及其他系统进行动态交互——它们，就是智能体以及由智能体构成的智能体系统。

强大的 LLM 的问世，为理解和生成文本、媒体等类人内容提供了前所未有的能力，也为众多智能体提供了核心的认知引擎。然而，要将这些能力有效地组织起来，构建一个能够可靠达成复杂目标的系统，仅仅拥有一个强大的模型是远远不够的。这还需要精良的结构、巧妙的设计，以及一套关于智能体如何感知、规划、行动与交互的深思熟虑的方法论。

我们可以将构建智能系统想象成在一块“画布”上创作一件复杂的艺术品或工程杰作。这块“画布”并非一块空白的画板，而是指那些为智能体提供生存与运作环境的底层基础设施与框架。它正是您构建智能应用所依赖的基石，负责管理状态、通信、工具调用以及逻辑流程。

在这块智能体的“画布”上高效地构建系统，绝非简单地堆砌组件。它要求我们深入理解那些业经考验的技术——即“模式”。这些模式专门用于应对在设计与实现智能体行为时所面临的普遍挑战。正如建筑模式指导着楼宇的建造，软件设计模式规范着程序的结构，智能体设计模式也为开发者在选定的“画布”上赋予智能体生命力时遇到的各种重复性问题，提供了可复用的解决方案。

1.什么是智能体系统？

本质上，智能体系统是一种计算实体。它被设计用以感知所处的环境（数字环境，甚至物理环境），基于这些感知信息以及一系列预设或习得的目标来做出明智决策，并自主执行行动以达成这些目标。不同于遵循固定、逐步指令的传统软件，智能体展现出了相当的灵活性与主动性。

试想您需要一个系统来处理客户咨询。传统系统或许只会遵循一套固定脚本。而一个智能体系统则能够洞察客户查询中的细微差别，自主访问知识库，与订单管理等内部其他系统交互，在必要时提出追问以澄清问题，并主动解决客户的困扰，甚至可能预判其未来需求。这些智能体在您应用程序的基础设施这块“画布”上运行，并充分利用其所能触及的服务与数据。

智能体系统通常具备几大特征：

自主性，使其无需持续的人工监督即可行动；
主动性，能为达成目标主动发起行动；
反应性，能对环境变化做出有效响应。

它们从根本上是目标导向的，时刻为实现既定目标而努力。一项至关重要的能力是工具使用，这使其能够与外部API、数据库或服务进行交互——有效地将其能力延伸至直接“画布”之外。此外，它们还拥有记忆能力，可在多次交互中保留信息，并能与用户、其他系统，乃至在相同或互联“画布”上运行的其他智能体进行通信。

要高效地实现上述特性，系统的复杂性会显著增加。例如，智能体如何在“画布”上的多个步骤之间维持自身状态？它如何决策何时以及如何使用某个工具？不同智能体之间的通信应如何管理？您又该如何为系统构建韧性，以应对非预期的结果或错误？

2.为什么模式在智能体开发中很重要

系统的复杂性，恰恰凸显了智能体设计模式不可或缺的价值。它们并非僵化的规则，而是久经考验的模板与蓝图，为应对智能体领域的各种标准设计与实现挑战，提供了行之有效的解决方案。通过识别并应用这些设计模式，开发者可以显著提升自己在“画布”上所构建的智能体的结构合理性、可维护性、可靠性与运行效率。

使用设计模式，可以帮助开发者避免在管理对话流、集成外部功能或协调多智能体行动等任务上“重复造轮子”。这些模式提供了一套通用的语言和结构，使智能体的逻辑更清晰，也便于团队成员（以及未来的自己）理解和维护。采纳专为错误处理或状态管理而设计的模式，更是构建稳健可靠系统的直接途径。总而言之，利用这些成熟的方法能够加快开发进程，让开发者可以专注于应用本身的独特业务，而非智能体行为的底层机制。

本书精心提炼了21个关键的设计模式，它们是在各种技术“画布”上构建复杂智能体的基础构件与核心技术。理解并应用这些模式，将极大地提升您高效设计与实现智能系统的能力。

3.概述及使用方法

本书旨在成为一本实用且易于上手的参考资源。其核心焦点在于清晰地阐释每一种智能体模式，并提供具体、可运行的代码范例来展示其实现方式。全书包含21个专属章节，系统性地探讨了各种设计模式，内容涵盖了从“提示词链”（构建顺序操作）和“工具使用”（外部交互）等基础概念，到“多智能体协作”（协同工作）和“自我修正”（自我完善）等高级主题。

本书逐章展开，每章深入剖析一种智能体模式。在各章中，您将看到以下内容：

模式概览：清晰阐释模式的定义及其在智能体设计中的核心作用。
应用场景与用例：列举真实的业务场景，展示模式的价值所在及其带来的益处。
代码动手实践：提供基于主流智能体开发框架的实用、可运行代码，直观演示模式的实现。您将在此看到如何在技术“画布”的上下文中具体应用该模式。
核心要点总结：归纳本章最重要的知识点，便于快速回顾。
参考文献：提供相关资源，供您围绕该模式及其相关概念进行更深入的学习。

尽管各章节按由浅入深的顺序编排，您仍可将本书作为一本参考手册，根据自己项目中遇到的特定挑战，随时翻阅相应章节。书末的附录全面介绍了高级提示词技巧、在真实环境中应用AI智能体的原则，以及主流智能体框架的概览。

此外，本书还提供了仅在线阅览的实践教程作为补充，通过分步指导，教您如何使用AgentSpace等特定平台或在命令行界面中构建智能体。全书始终强调实践应用，我们强烈建议您亲手运行、调试并改造书中的代码范例，在您选定的“画布”上构建属于您自己的智能系统。

作者经常被问到一个很好的问题：“人工智能技术日新月异，为何还要写一本可能很快就过时的书？” 实际上，作者的初衷恰恰相反。正因为技术更迭如此之快，才更需要停下来，识别并沉淀那些正在稳定成型的底层原则。诸如RAG（检索增强生成）、Reflection（反思）、Routing（路由）、**Memory（记忆）**等本书所探讨的模式，正逐渐成为该领域的基础构件。本书诚邀您一同对这些核心思想进行深入反思，它们将为我们未来的创新提供坚实的地基。人类的进步，正需要这样在基础模式上不断反思的时刻。

4.本书所用框架介绍

为了给书中的代码范例提供一个可实际操作的“画布”，本书将主要采用三种主流的智能体开发框架。LangChain及其有状态扩展LangGraph，提供了一种灵活的方式来串联语言模型及其他组件，为构建复杂的操作序列和图谱提供了一个稳健的平台。Crew AI则提供了一个结构化框架，专为组织协调多个AI智能体、角色及任务而设计，尤其适合构建协作式智能体系统。Google ADK提供了用于构建、评估和部署智能体的系列工具，是另一个极具价值的“画布”，且通常与谷歌的AI基础设施深度集成。

这些框架从不同侧面代表了智能体开发的“画布”，且各有千秋。通过展示贯穿这些工具的范例，无论您最终为自己的智能体系统选择何种技术环境，都能对如何应用这些模式获得更宏观的理解。书中的所有示例都旨在清晰地阐释模式的核心逻辑及其在特定框架“画布”上的实现方式，力求清晰、实用。

5.是什么让一个AI系统成为智能体？

简单来说，AI智能体是一个能够感知环境并采取行动以达成特定目标的系统。它是标准 LLM 的演进形态，被赋予了规划、使用工具以及与周围环境交互的能力。您可以将智能体AI想象成一个能够“边干边学”的智能助手。它通过一个简洁的五步循环来执行任务：

接收任务：用户为其设定一个目标，例如“帮我安排日程”。
分析环境：它会收集所有必要信息——如阅读邮件、检查日历、访问联系人——来全面理解当前状况。
制定计划：它会构思行动计划，思考达成目标的最佳路径。
执行行动：它开始执行计划，例如发送会议邀请、预定会议室以及更新用户的日历。
学习与优化：它会观察成功的行动结果并相应地调整自身行为。例如，如果一次会议被重新安排，系统会从这一事件中学习，以提升未来的任务表现。

图1 | Agentic AI 作为一个智能助手运作，通过经验不断学习。它通过一个简单的五步循环来完成任务。

智能体正以惊人的速度普及。根据近期研究，大多数大型IT公司已在积极使用智能体，其中五分之一的企业是在过去一年内才刚刚起步。金融市场也敏锐地捕捉到了这一趋势。截至2024年底，AI智能体领域的初创公司累计融资已超过20亿美元，市场估值达到52亿美元。预计到2034年，该市场规模将激增至近2000亿美元。简而言之，种种迹象表明，AI智能体将在未来的经济格局中扮演至关重要的角色。

图2 | AI技术已从 LLM 演进至 RAG，再到智能体RAG，并最终迈向智能体AI的时代。

短短两年间，人工智能的范式经历了从简单自动化到复杂自主系统(见图2)的巨大转变。最初，工作流依赖基础的提示词和触发器来驱动 LLM 处理数据。随后，RAG技术通过将模型 grounding 在事实信息上，提升了系统的可靠性。再后来，我们见证了能够使用各种工具的独立AI智能体的发展。如今，我们正迈入智能体AI的时代——一个由多个专业智能体组成的团队协同运作，以实现复杂的目标，这标志着AI的协作能力实现了重大飞跃。

本书旨在深入探讨这些专业智能体协同合作以达成复杂目标时所遵循的设计模式。在后续的每一章中，您都将学习到一种独特的协作与交互范式。

在此之前，让我们先来考察几个跨越不同复杂度的智能体示例（见图3）。

图3 | 展示智能体复杂度范围的各种实例

0级：纯粹的推理引擎

尽管 LLM 本身并非智能体，但它可以作为基础智能体系统的核心推理引擎。在“0级”的配置下，LLM 在没有工具、记忆或与环境交互的情况下运行，其响应完全基于自身的预训练知识。它的优势在于能够利用其海量的训练数据来阐释已有的概念。然而，这种强大内部推理能力的代价在于，它完全无法感知当前发生的事件。例如，如果相关信息超出了其预训练知识的范围，它将无法说出2025年奥斯卡“最佳影片奖”的得主。

1级：联通外部的问题解决者

在这一级别，LLM 通过连接并利用外部工具，演变为一个功能型智能体。此时，它解决问题的能力不再局限于预训练的知识。相反，它能够执行一系列动作，从互联网（通过搜索）或数据库（通过检索增强生成，即RAG）等外部来源收集并处理信息。

例如，当需要查找最新的电视节目时，智能体能意识到这需要实时信息，于是调用搜索工具来获取数据，并对结果进行整合。更关键的是，它还能调用专用工具以追求更高的准确度，例如通过金融API获取苹果公司（AAPL）的实时股价。这种跨越多步骤与外部世界进行交互的能力，正是1级智能体的核心特征。

2级：运筹帷幄的策略家

在这一级别，智能体的能力得到显著扩展，涵盖了战略规划、主动辅助和自我优化等多个维度，而提示词工程与上下文工程则是实现这些能力的核心技能。

首先，智能体不再局限于使用单一工具，而是通过战略性地解决问题来应对复杂的多阶段任务。在执行动作序列时，它会主动进行上下文工程——这是一个为每一步操作精心选择、组织并管理最相关信息的战略过程。

例如，要在两个地点之间寻找一家咖啡店，智能体首先会使用地图工具。然后，它会对输出信息进行加工，构建一个简短、集中的上下文（也许只是一张街道名称列表），再将其输入本地搜索工具。这样做可以避免信息过载，确保第二步操作既高效又精准。

要让AI发挥出最佳性能，就必须为其提供简短、聚焦且有效的上下文。上下文工程正是这样一门学问：它通过从所有可用信源中战略性地筛选、组织和管理最关键的信息，有效地引导模型有限的注意力，防止信息过载，从而确保在任何任务上都能实现高质量、高效率的输出。

这种能力也催生了智能体的主动持续运作模式。例如，一个与用户邮箱关联的旅行助手，能够从一封冗长的航班确认邮件中进行上下文工程，仅提取出航班号、日期、地点等关键细节，然后将这些信息组织打包，用于后续调用日历和天气API等工具。

在软件工程等专业领域，智能体运用这套方法论来管理整个工作流程。当接到一份错误报告时，它会阅读报告、访问代码库，然后战略性地将这些庞大的信息源加工成一个精炼、聚焦的上下文，从而高效地编写、测试并提交正确的代码补丁。

最后，智能体通过优化自身的上下文工程流程来实现自我改进。当它就“某个提示词应如何改进”而征求反馈时，它实际上是在学习如何更好地组织其初始输入。这使得它能自动优化未来任务的信息组织方式，从而形成一个强大的自动化反馈闭环，其准确性和效率会随着时间的推移而不断提升。

3级：多智能体协作新纪元

在3级，我们见证了AI发展的一次重大范式转变：研究的重心不再是追求单一、全能的“超级智能体”，而是转向构建复杂的、协同工作的多智能体系统。这种模式的本质在于，它承认复杂的挑战往往并非由一位“通才”独立解决，而是通过一个各司其职、协同运作的“专家团队”来攻克。该模式直接借鉴了人类组织的架构，在组织中，不同部门承担特定角色，通过协作来实现多维度的目标。这种系统的集体力量，正源于劳动分工以及协同合作所产生的巨大合力。

一个具体的例子是发布新产品的复杂工作流。与其让单个智能体包揽所有任务，不如设立一个“项目经理”智能体作为总协调员。这位“经理”会把任务分派给其他专业智能体，从而调度整个流程：由“市场研究”智能体收集消费者数据，由“产品设计”智能体构思产品概念，再由“营销”智能体策划推广材料。这个团队成功的关键在于各智能体之间无缝的沟通与信息共享，确保所有个体付出的努力都能统一服务于最终的集体目标。

尽管这种基于团队的自主自动化愿景已在逐步实现，但我们必须正视当前面临的障碍。目前，这类多智能体系统的效能，受限于其所依赖的 LLM 的推理能力。此外，它们作为团队真正实现相互学习、共同进步的能力尚处于起步阶段。攻克这些技术瓶颈是下一步的关键所在。一旦成功，我们将释放这一级别的巨大潜力：实现从头至尾全业务流程的自动化。

6.智能体的未来：五大猜想

人工智能智能体的研发，正在软件自动化、科学研究、客户服务等诸多领域以前所未有的速度高歌猛进。尽管现有系统已令人印象深刻，但这仅仅是一个开端。下一波创新浪潮，可能会聚焦于让智能体变得更可靠、更善于协作，并更深度地融入人们的日常生活。以下是关于未来发展的五大核心猜想。

猜想1：通用型智能体的崛起

第一个猜想认为，AI智能体将从能力狭隘的“专才”演变为真正的“通才”，能够以极高的可靠性管理复杂、模糊的长期目标。例如，用户可以给智能体下达一个简单的提示词，如“为公司策划下季度在里斯本举行的30人异地团建”。随后，该智能体将自主管理整个项目长达数周，处理从预算审批、机票谈判，到场地选择、乃至根据员工反馈制定详细行程等一切事务，并在此期间定期汇报进展。要实现如此高度的自主性，需要在AI的推理、记忆和近乎完美的可靠性方面取得根本性突破。

与此并行但并不互斥的另一条路径，是**小语言模型（SLM）**的兴起。这一“乐高式”的理念，主张通过组合多个小而精的专家智能体来构建系统，而非不断扩展单一的庞大模型。该方法有望构建出成本更低、调试更快、部署更容易的系统。归根结底，无论是发展大型通用模型，还是组合小型专业模型，都是未来可行的路径，两者甚至可能相辅相成。

猜想2：深度个性化与主动目标发现

第二个猜想断言，智能体将演变为深度个性化且具备前瞻性的合作伙伴。我们正在见证一类新型智能体的诞生：主动型伙伴。通过学习用户的独特行为模式与目标，这些系统正从“听令行事”转变为“预判需求”。当AI系统不再仅仅响应聊天或指令，而是能够代表用户主动发起并执行任务，并在此过程中积极协作时，它才真正成为了“智能体”。这已超越了简单的任务执行，迈入了“主动目标发现”的全新领域。

例如，当一个用户正在研究可持续能源时，智能体可能会识别出其潜在的深层目标，并主动提供支持，如推荐相关课程或自动总结前沿研究报告。尽管这类系统尚在发展之中，但其演进轨迹已十分清晰：它们将变得日益主动，在高度确信其行为有益时，学会代表用户主动决策。最终，智能体将成为用户不可或缺的盟友，帮助人们发现并实现那些自己甚至还未能清晰言说的远大抱负。

猜想3：具身化与物理世界交互

该猜想预见到，智能体将摆脱纯粹数字形态的束缚，进入物理世界进行操作。通过将智能体AI与机器人技术相融合，“具身智能体”将会兴起。届时，用户可能不再是预约一位水管工，而是直接让家庭智能体去修理漏水的龙头。该智能体将利用视觉传感器勘查问题，访问管道维修知识库以制定方案，然后精准控制其机械臂完成修理。这将是里程碑式的一步，彻底打通数字智能与物理行动之间的壁垒，并为制造业、物流业、养老护理乃至家庭维护等各行各业带来颠覆性变革。

猜想4：智能体驱动型经济

第四个猜想认为，高度自主的智能体将成为经济活动的积极参与者，催生全新的市场与商业模式。可以预见，智能体将作为独立的经济实体运作，以实现特定结果（如利润）的最大化为目标。一位创业者可以启动一个智能体来运营完整的电子商务业务：该智能体通过分析社交媒体洞察热门产品，自动生成营销文案与视觉素材，通过与其他自动化系统交互来管理供应链，并根据实时需求动态调整价格。这一转变将创造一个全新的、超高效率的“智能体经济”，其运行速度与规模，将远超人类直接管理的极限。

猜想5：目标驱动的自适应变形多智能体系统

该猜想预言了一种新型智能系统的出现，其运作并非基于显式编程，而是源于一个声明式的目标。用户只需陈述期望的结果，系统便能自主规划并找出达成路径。这标志着向“自适应变形多智能体系统”的根本性转变，该系统能够在个体与集体层面实现真正的自我完善。

这样的系统是一个动态实体，而非单个智能体。它能分析自身表现，并动态调整其多智能体团队的拓扑结构——根据任务需求，随时创建、复制或移除智能体，以组建最高效的团队。这种进化发生在多个层面：

架构层面的修改：在最底层，单个智能体可以重写自身源代码，重构内部结构以提升效率。指令层面的修改：在更高层，系统会持续进行自动化的提示词工程与上下文工程，不断优化给予每个智能体的指令与信息，确保它们在无人干预的情况下获得最佳指引。

例如，一位创业者只需声明意图：“创办一家成功的手工咖啡电商企业。” 系统无需额外编程，便会迅速投入运作。它起初可能生成一个“市场研究”智能体和一个“品牌构建”智能体。根据初步调研结果，它可能会决定撤销品牌构建智能体，转而生成三个新的专业智能体：“Logo设计”智能体、“网店平台”智能体和“供应链”智能体。系统会持续调整它们的内部提示词以优化表现。如果网店智能体成为瓶颈，系统可能会将其复制为三个并行工作的智能体，分别处理网站的不同部分，从而动态地重构自身组织结构，以最佳方式实现既定目标。

7.前言小结

本质上，AI智能体是相较于传统模型的一次重大飞跃，它作为一个能够感知、规划并行动以达成特定目标的自主系统而运作。这项技术正从使用单一工具的独立智能体，向能够应对多维度目标的复杂协作式多智能体系统演进。未来的假说预示着通用型、个性化乃至具身化的智能体即将出现，它们将成为经济活动中积极的参与者。这一持续的发展趋势，标志着一场重大的范式革命：一个由目标驱动、能够自我完善的系统时代即将来临，这样的系统势必将实现全工作流程的自动化，并从根本上重新定义人类与技术之间的关系。

前言参考文献

Cloudera, Inc. (2025年4月), 96%的企业正在增加AI智能体的使用：https://www.cloudera.com/about/news-and-blogs/press-releases/2025-0416-96-percent-of-enterprises-are-expanding-use-of-ai-agents-according-to-latestdata-from-cloudera.html
自主生成式AI智能体： https://www.deloitte.com/us/en/insights/industry/technology/technology-media-and-telecom-predictions/2025/autonomous-generative-ai-agents-still-under-development.html
Market.us. 全球智能体AI市场规模、趋势与预测 2025–2034：https://market.us/report/agentic-ai-market/

写在最后

本书的旅程始于智能体 AI 的基础概念，终于复杂自主系统的实践部署。其核心前提是：构建智能体好比是在一块技术的画布上创作一幅复杂的艺术品——这个过程不仅需要一个如大型语言模型 (LLM) 般强大的认知引擎，更需要一套稳健的架构蓝图。这些蓝图，也即“智能体模式（agentic patterns）”，为我们将简单的、被动响应式的模型，转变为能够进行复杂推理与行动的、主动的、以目标为导向的实体，提供了所必需的结构与可靠性。

本章作为总结，将对书中探讨的核心原则进行整合。首先，将回顾关键的智能体模式，并将它们归入一个统一的框架中，以彰显其整体重要性。接着，将探讨如何将这些独立的模式组合成更复杂的系统，以创造出强大的协同效应。最后，将展望智能体开发的未来，探索那些将塑造下一代智能系统的新兴趋势与挑战。

关键智能体原则回顾

本指南详述的 21 种模式，共同构成了一套用于智能体开发的综合性工具集。尽管每种模式都旨在解决一个特定的设计挑战，但若将它们归入反映智能体核心能力的几个基础类别中，便能更好地理解其整体。

一、核心执行与任务分解（Core Execution and Task Decomposition）

从最基础的层面看，智能体必须具备执行任务的能力。提示词链（Prompt Chaining）、路由（Routing）、并行化（Parallelization）和规划（Planning）这几种模式，共同构成了智能体行动能力的基石。提示词链提供了一种简洁而强大的方法，可将一个问题分解为一系列离散的线性步骤，并确保上一步操作的输出能够逻辑清晰地传递给下一步。当工作流需要更动态的行为时，路由模式引入了条件逻辑，允许智能体根据输入内容的上下文，选择最合适的执行路径或工具。并行化则通过支持独立的子任务并发执行来优化效率。而规划模式更是将智能体从一个单纯的执行者，提升为一个战略家，使其能够为达成一个宏观目标而自主制定多步骤的计划。

二、与外部环境的交互 (Interaction with the External Environment)

智能体的功用，会因其与自身内部状态之外的世界进行交互的能力而得到极大的增强。在此，“工具使用”或称“函数调用”模式至关重要，它为智能体提供了调用外部 API、数据库及其他软件系统的机制，从而将其行动根植于真实世界的数据与能力之上。为了有效使用这些工具，智能体常常需要从浩如烟海的信息库中获取特定、相关的信息。知识检索（Knowledge Retrieval）模式，特别是检索增强生成（Retrieval-Augmented Generation, RAG），正是为了解决这一问题，它使智能体能够查询知识库，并将检索到的信息整合到其响应中，从而使其输出更准确、更贴合上下文。

三、状态、学习与自我完善（State, Learning, and Self-Improvement）

要让智能体能够执行超越单轮交互的任务，它就必须具备维持上下文和持续自我提升的能力。记忆管理（Memory Management）模式对于赋予智能体短期的对话上下文记忆和长期的知识沉淀能力而言，是不可或缺的。除了简单的记忆，真正智能的智能体还展现出自我完善的潜力。反思（Reflection）与自我修正（Self-Correction）模式使智能体能够批判性地审视自己的输出，识别其中的错误或不足，并对其工作进行迭代式优化，最终产出更高质量的结果。学习与适应（Learning and Adaptation）模式则更进一步，它允许智能体的行为基于外部反馈和过往经验不断演进，从而随时间推移而变得更加高效。

四、协作与沟通（Collaboration and Communication）

许多复杂问题最好由协作来解决。多智能体协作（Multi-Agent Collaboration）模式支持创建这样一种系统：其中多个拥有不同角色和能力的专业化智能体协同工作，以达成一个共同的目标。这种劳动分工使得系统能够处理那些单个智能体无法应对的多维度复杂问题。而这类系统的效能，则高度依赖于清晰、高效的沟通。智能体间通信（Inter-Agent Communication, A2A）与模型上下文协议（Model Context Protocol, MCP）等模式正是为了应对这一挑战，它们旨在为智能体及工具之间的信息交换提供标准化的规范。

当这些原则通过其各自对应的模式得以应用时，便为构建智能系统提供了一个稳健的框架。它们指导着开发者去创造出这样的智能体：不仅能执行复杂任务，而且在结构上清晰、在行为上可靠、在能力上可不断适应。

为复杂系统组合模式

智能体设计的真正力量，并非源于孤立地应用单一模式，而在于将多种模式巧妙地组合，以构建出精密的、多层次的系统。一个智能体应用的蓝图，绝非由单一、简单的工作流构成；恰恰相反，它更像是一幅由各种模式交织而成的画卷，这些模式协同运作，以达成一个复杂的宏观目标。

以开发一个自主的 AI 科研助理为例，这项任务需要综合运用规划、信息检索、分析和整合等多种能力。这样的一个系统，便是模式组合的典型范例：

初始规划

当系统收到一个用户查询（例如，“分析量子计算对网络安全领域的影响”）时，请求将首先由一个“规划器（Planner）”智能体接收。该智能体将利用规划（Planning）模式，把这个宏观的请求分解为一个结构化的、多步骤的研究计划。该计划可能包含如下步骤：“识别量子计算的基础概念”、“研究主流的密码学算法”、“检索关于量子技术对密码学威胁的专家分析”，以及“将研究发现整合成一份结构化报告”。

利用工具进行信息收集

为了执行上述计划，智能体将深度依赖工具使用（Tool Use）模式。计划中的每一步，都可能触发对 Google Search 或vertex_ai_search等搜索工具的调用。若需获取更结构化的数据，它还可能调用工具去查询 ArXiv 等学术数据库或各类金融数据 API。

协作式分析与写作

虽然单个智能体也能处理整个流程，但一个更稳健的架构会采用多智能体协作 (Multi-Agent Collaboration)模式。例如，可以设计一个“**研究员 (Researcher)**”智能体，专门负责执行搜索计划并收集原始信息。其输出（一系列信息摘要和来源链接）随后将被传递给一个“**写作者 (Writer)**”智能体。这个专业的写作智能体将以初始计划为大纲，把收集到的信息整合成一篇逻辑连贯的报告初稿。

迭代式反思与优化

初稿往往难以尽善尽美。此时，可以通过引入第三个“批判者 (Critic)”智能体来实施反思 (Reflection)模式。该智能体的唯一职责就是审阅“写作者”的草稿，检查其中是否存在逻辑矛盾、事实错误或表述不清之处。它的批判性意见将被反馈给“写作者”智能体，后者则会利用自我修正 (Self-Correction)模式来优化其输出，通过吸收这些反馈来产出更高质量的最终报告。

状态管理

在整个复杂流程中，一个记忆管理（Memory Management）系统是必不可少的。它将负责维护研究计划的当前状态、存储“研究员”收集到的信息、持有“写作者”创建的各版草稿，并追踪“批判者”的反馈，从而确保在整个多步骤、多智能体的工作流中，上下文信息始终保持一致。

在这个例子中，至少有五种不同的智能体模式被有机地结合在一起。规划模式提供了宏观结构，工具使用将智能体的行动根植于真实世界的数据，多智能体协作实现了专业化与劳动分工，反思确保了最终的质量，而记忆管理则维持了整个过程的连贯性。正是这种模式的组合，将一系列独立的能力，升华为一个强大的、自主的系统，使其能够胜任那些对于单个提示词或简单处理链而言过于复杂的任务。

未来展望

如前文 AI 科研助理一例所示，将多种智能体模式组合成复杂系统，并非故事的终点，而是软件开发新篇章的序幕。展望未来，若干新兴的趋势与挑战将共同定义下一代智能系统，它们将不断拓展可能性的边界，并对其创造者提出更高的要求。

通往更高级智能体 AI 的征程，将以追求更强的自主性与推理能力为标志。本书所探讨的各类模式，为实现目标导向的行为提供了基础框架，但未来需要的是能够处理模糊性、执行抽象与因果推理，乃至展现出一定程度常识判断的智能体。这很可能需要将新颖的模型架构与“神经符号方法（neuro-symbolic approaches）”进行更紧密的集成，以融合 LLM 的模式匹配优势与经典 AI 的逻辑严谨性。

同时，人机协作的范式也将从“人在回路（human-in-the-loop）”（智能体作为副驾）转变为“人在回路之上（human-on-the-loop）”（智能体作为值得信赖的执行者），即智能体被授权以最少的人工监督来执行复杂的、长期运行的任务，仅在目标达成或发生关键异常时进行汇报。

伴随这一演进的，将是智能体生态系统与相关标准的兴起。多智能体协作模式已彰显出专业化智能体的强大威力，未来将会涌现出开放的市场与平台，允许开发者在其中部署、发现并编排“作为服务的智能体”集群。要实现这一愿景，模型上下文协议（Model Context Protocol, MCP）与智能体间通信（Inter-Agent Communication, A2A）背后的原则将变得至关重要，并最终催生出覆盖全行业的标准，用以规范智能体、工具和模型之间如何交换数据、上下文、目标与能力。

“Awesome Agents” GitHub 代码库便是这个日益增长的生态系统的一个绝佳例证。作为一个宝贵的资源，它精选并维护了一份涵盖开源 AI 智能体、框架和工具的列表。通过对从软件开发到自主研究、再到对话式 AI 等各类应用的尖端项目进行系统性梳理，它充分展现了该领域的迅猛创新势头。

然而，这条发展道路同样充满了艰巨的挑战。随着智能体变得日益自主和互联，其安全性、对齐性与稳健性等核心问题将变得愈发关键。如何确保智能体的学习与适应过程不会使其偏离最初设定的目标？如何构建能够抵御对抗性攻击和应对不可预测的现实场景的、具备高韧性的系统？要回答这些问题，就需要一套全新的“安全模式”，以及一套专注于测试、验证和伦理对齐的、更严谨的工程学科。

结语

在本指南中，构建智能体被描绘为一种在技术画布上进行的艺术创作。书中所介绍的这些智能体设计模式，便是创作所需的调色板与笔触——它们是让创造者能够超越简单的提示词，进而构建出动态、敏捷且以目标为导向的实体的基础元素。这些模式提供了必要的架构准则，能够将大型语言模型原始的认知能力，转化为一个可靠且有明确目标的系统。

真正的技艺，不在于精通某一种单一模式，而在于深刻理解它们之间的相互作用——能够着眼于画布的全局，并组合出一个让规划、工具使用、反思与协作等能力和谐共存的系统。智能体设计的各项原则，构成了一门新兴创造语言的“语法”，它使得机器不仅能被告知“做什么”，更能被引导“如何做”。

智能体 AI 领域是当今技术界最激动人心、发展最迅猛的领域之一。本书所详述的概念与模式并非终极不变的教条，而是一个全新的起点——一个可供业界在其之上继续构建、实验和创新的坚实基础。未来，人类将不再仅仅是 AI 的使用者，更是智能系统的架构师。这些由我们亲手构建的系统，将助力解决世界上最复杂的一系列问题。画卷已在面前展开，画笔已在手中。现在，是时候开始创造了。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

AI Agent开发必看！LangGraph vs 低代码平台：从“拖拽幻象“到“代码真香“，小白也能构建生产级智能系统[特殊字符]

【AI Agent开发书籍】《智能体设计模式：构建智能系统的实践指南》（全文）

前言