news 2026/5/27 3:32:01

Agent应用实践之十一 - 三驾马车:工具之初级使用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Agent应用实践之十一 - 三驾马车:工具之初级使用

AI 大模型飞速进化,不懂 AI、不会用 Agent 的程序员,正在慢慢被行业淘汰。现在 AI 新技术迭代快到离谱:RAG 还没学明白,MCP 接踵而来;工具刚上手,Skills、各类新 Agent 概念又轮番刷屏;Manus还没看懂,就出来OpenClaw,OpenClaw热度还没退,又出来Hermes。越追越乱、越学越焦虑,永远在被动跟风,陷入学不完、跟不上、用不上的内耗。其实焦虑的根本原因,不是新技术太多,而是不懂大模型 Agent 应用底层原理,只会零散跟风,没有通用方法论。

为此我专门推出Agent 应用实战专栏,采用Agent基础 + Agent设计模式 + 工程实践三位一体体系,帮你彻底摆脱 AI 焦虑。
专栏分为三大模块:

  • Agent基础:深入浅出拆解AgentScope Java源码,掌握Agent应用基础的三驾马车(提示词、工具和记忆),夯实 Agent 开发底层根基;
  • Agent设计模式:基于《agentic-design-patterns》精讲经典架构模式(提示词链、并行、路由、规划、反思、推理、人机协同等等),掌握高阶 AI 应用设计思路;
  • 工程实践:手把手从零手搓简易版 OpenClaw,还原真实项目落地全流程。

学完本专栏,你将彻底吃透底层逻辑、掌握架构思维、并具备工程落地能力。未来无论再涌现 MCP、Skills 还是其他任何新技术,你都能一眼看透其本质、快速上手复用,不再盲目跟风,稳稳守住程序员的职业护城河。

注意由于框架的不同版本会有些使用的不同,因此本次系列中使用基本框架是agentscope-1.0.11,JDK版本使用的是open-jdk-21(agentscope-java最低要求java版本为17)

本文章的代码地址:https://github.com/forever1986/agentscope-agent-pattern

目录

  • 1 工具
  • 2 代码示例
  • 3 AgentScope的Tool底层原理
    • 3.1 Tool的定义
      • 3.1.1 AgentTool类
      • 3.1.2 @Tool 注解
    • 3.2 Tool的注册源码解析
      • 3.2.1 Tool 注册流程
    • 3.3 Tool的调用源码解析

前三章主要讲解了Agent三驾马车之提示词,本章开始讲解Agent三驾马车之工具

1 工具

在《Agent应用实践之七 - 三驾马车:总览》中讲过大模型是没有手脚,也就是说它无法操作电脑上面的其它功能或者软件,之所以现在市面上的聊天模型能生成PPT、Word,读懂PDF,实际上是做了工具给大模型。工具从编程角度来说就是一个函数,将这个函数有什么功能,入参是什么、返回是什么作为提示词告诉大模型,大模型是根据你问的问题决定是否使用这个工具,如果使用,会返回这个工具名称和入参,然后程序再调用这个工具,将执行结果返回给大模型,这就是工具的基本原理。可以看出来大模型并不会执行工具,最终还是程序来执行工具。工具之所以作为基础,后面你会了解到所谓的MCP、Skills都是一种更为复杂的工具而已。下图是Agent与工具的关系:

工具使用模式通常通过工具调用机制实现,使智能体接入外部 API、数据库、服务,甚至执行代码。该机制在于智能体核心的语言模型(LLM)能基于用户请求或任务状态,决策何时以及如何调用特定外部函数。该过程通常包括:

  • 工具定义:外部函数或能力被定义并描述给 LLM
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/27 3:31:02

SWD vs JTAG:用STLINK给STM32调试,到底选哪个?实测对比与避坑指南

SWD vs JTAG:用STLINK给STM32调试的终极选择指南当你在一个PCB空间紧张的项目中为STM32选择调试接口时,SWD和JTAG的取舍往往让人纠结。上周我的团队就遇到了这样的困境——一个仅有4层板的物联网终端设备,IO口资源几乎被传感器和通信模块占满…

作者头像 李华
网站建设 2026/5/27 3:26:58

【AI Agent 开发实战·第01讲】从“缸中之脑”到“全能助手”:为什么我们需要 AI Agent?它与 ChatGPT 有什么本质区别?

前言 自 ChatGPT 发布以来,大语言模型(LLM)展现出的逻辑推理和自然语言理解能力颠覆了整个科技圈。在惊叹于其“涌现能力”的同时,越来越多的开发者和企业在尝试将 LLM 落地到生产环境时,却撞上了一堵无形的墙&#xf…

作者头像 李华