news 2026/6/13 2:31:52

Agent 系列(19):Harness 完整体系——8 层防护框架全景

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Agent 系列(19):Harness 完整体系——8 层防护框架全景

从五要素到八层框架

第 17 篇介绍了 Harness 的五个要素:动作空间、人工检查点、执行边界、审计日志、回滚。五要素是骨架,能处理大多数场景。

但生产级 Agent 面对的威胁更复杂:

  • LLM 被提示注入操控,绕过工具白名单用合法工具实现非法意图
  • 多步推理耗尽 Token 预算,系统雪崩
  • 审计日志被事后篡改,合规失效
  • 模型报告"已执行",但实际状态已被回滚——谁的话算数?

完整的 8 层框架在五要素基础上增加了三层主动防御:

Layer 1 Minimal Footprint 最小权限:任务只暴露必要工具 Layer 2 Action Space Registry 动作注册表:PermissionLevel 枚举,每个动作有 budget_cost Layer 3 Permission Budget 权限预算:spend() / BudgetExhaustedError Layer 4 Execution Sandbox 执行沙箱:输入净化 + 子进程隔离 Layer 5 Human Checkpoint 人工检查点:LangGraph interrupt(第 17 篇详述) Layer 6 Immutable Audit Log 不可篡改审计日志:哈希链 JSONL + 完整性验证 Layer 7 Rollback Coordinator 回滚协调器:事务 context manager Layer 8 Threat Model 威胁模型:对抗场景测试

本文用实测数据覆盖全部 8 层,附三个反直觉结论。


Layer 1:最小权限——任务决定工具范围

核心思路:不同任务类型只暴露必要工具,LLM 连其他工具的存在都不知道。

TASK_TOOL_MAP:dict[str,list]={"read_only":[read_data],"reporting":[read_data,send_report],"data_entry":[read_data,write_data],"admin":[read_data,write_data,send_report,delete_record],}defget_tools_for_task(task_type:str)->list:returnTASK_TOOL_MAP.get(task_type,[read_data])

每种任务类型的工具子集:

Task type → Available tools read_only → ['read_data'] reporting → ['read_data', 'send_report'] data_entry → ['read_data', 'write_data'] admin → ['read_data', 'write_data', 'send_report', 'delete_record']

read_only任务下,模型完全不知道write_datadelete_record的存在——bind_tools()只传入该任务的工具子集。

实测read_onlyAgent 查询sales_q1,预算消耗 1(一次read_data),没有任何越权行为。


Layer 2 & 3:注册表 + 权限预算

注册表设计:每个动作声明权限等级和预算成本。

classPermissionLevel(Enum):READ=1WRITE=2ADMIN=3IRREVERSIBLE=4@dataclassclassRegisteredAction:name:strlevel:PermissionLevel budget_cost:intdescription:strhandler:Any ACTION_REGISTRY:dict[str,RegisteredAction]={"read_data":RegisteredAction("read_data",READ,1,"Read a record",read_data),"write_data":RegisteredAction("write_data",WRITE,3,"Write/update a record",write_data),"send_report":RegisteredAction("send_report",WRITE
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/13 2:29:51

2026年商务资源对接平台哪个好用?实测数据告诉你

2026年了,商务资源对接平台早就不是什么新鲜事物。市面上相关的APP、小程序、网站多到挑花眼。但到底哪个平台真正好用、能对接到资源?光看平台自己的介绍没用——每个平台都说自己"资源丰富、对接高效"。光看别人的推荐也没用——别人用着好用…

作者头像 李华
网站建设 2026/6/13 2:28:54

Proteus实战:5分钟搞定DAC0832数模转换电路搭建与电压测量

Proteus实战:5分钟搞定DAC0832数模转换电路搭建与电压测量在电子设计领域,快速验证电路原型的能力往往决定了项目开发的效率。Proteus作为一款功能强大的电子设计自动化软件,为工程师和学生提供了从原理图设计到电路仿真的完整解决方案。本文…

作者头像 李华
网站建设 2026/6/13 2:24:02

PotPlayer字幕翻译插件:5分钟极速配置百度翻译完整指南

PotPlayer字幕翻译插件:5分钟极速配置百度翻译完整指南 【免费下载链接】PotPlayer_Subtitle_Translate_Baidu PotPlayer 字幕在线翻译插件 - 百度平台 项目地址: https://gitcode.com/gh_mirrors/po/PotPlayer_Subtitle_Translate_Baidu 还在为观看外语影视…

作者头像 李华