引言:Agent 慢,并不总是模型的问题
在智能体系统中,总是存在抱怨“Agent 反应有点慢,但模型已经是最好的了”。于是我们开始检查:
Prompt 是否太长
推理参数是否保守
是否需要更强的模型
但在不少真实系统中,最终的瓶颈并不在模型推理,而是在一个更底层、也更容易被忽略的地方:Agent 与工具服务之间,参数是如何被传递的。尤其当工具参数不再是简单的字符串,而是包含几十个字段、层层嵌套的业务对象时,序列化与反序列化本身,可能已经吃掉了整个调用链路中最多的 CPU 和时间预算。
一、为什么这个问题在“智能体时代”突然变得严重?
在传统微服务架构中,序列化成本通常是“可以接受的背景噪音”。但在智能体系统中,这个问题被急剧放大。
1. 工具调用变得极其频繁
一个典型的Agent任务流程可能是:
读取用户请求
查询订单
校验权限
计算价格
更新状态
记录日志
每一步,都是一次工具调用。十几次、几十次调用,在一次用户请求中非常常见。
2. 工具参数开始携带“完整业务对象”
为了减少模型推理不确定性,很多系统选择:直接把“完整上下文”作为参数传给工具,例如一个订单对象,可能包含:
基础信息(ID、状态、金额)
用户信息(地址、联系方式)
商品明细(数组 + 嵌套对象)
营销