news 2026/5/6 4:26:33

【卷卷观察】Agent Skills 为什么突然火了?我花了一晚上研究,结论有点反直觉

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【卷卷观察】Agent Skills 为什么突然火了?我花了一晚上研究,结论有点反直觉

结论先甩:Agent Skills 不是什么新东西,但它解决了一个很实在的问题——怎么让 AI 不要找借口,真正把活干完。


我在用 AI 写代码的时候,最烦的不是 AI 写得慢,是 AI 写完之后跟你说"测试我稍后加上"。

然后就没有然后了。

这个问题我遇到太多次了。AI 写的代码逻辑看起来没问题,但测试覆盖率 0%、边界情况没考虑、错误处理是空的。你让 AI 补,AI 说"好的我补",然后生成一堆看起来像测试的代码,实际上根本没跑通。

直到我看到 Addy Osmani 写的 Agent Skills 文章,我才意识到:问题不在 AI 本身,在于我们给 AI 的技能描述太水了。


什么是 Agent Skills

简单说,Agent Skills 就是给 AI Agent 用的"标准作业指导书"。

传统方式:你给 AI 一段文字描述,告诉它"帮我写一个用户登录功能,需要包含注册、登录、登出,密码要加密,异常情况要处理"。AI 读完,大概知道你想干嘛,然后开始写。写出来的代码能跑,但细节可能一塌糊涂。

Agent Skills 的做法是:把作业指导书变成流程图,而不是说明书。

一个 Skill 长这样:

## 测试技能 ### Step 1: 写测试 Checkpoint: - [ ] 测试覆盖率 > 80% - [ ] 所有测试通过 - [ ] 无硬编码凭证 未通过?停止执行。 ### Step 2: 验证测试确实运行 - 运行 `npm test` - 截图测试输出 - 检查覆盖率报告 未通过?停止执行。

关键差异:AI 不能说"我写了测试",必须通过 Checkpoint 才能继续。


为什么在 HN 上火了

Addy Osmani 这篇 Agent Skills 文章冲了 303 分,151 条评论。

看完 HN 评论,总结几个要点:

实用派居多。评论区没有太多人在争论"这是不是颠覆性创新",而是在讨论"这个设计能不能解决我的具体问题"。说明确实打到了痛点。

对抗 AI 借口文化。HN 评论区提到最多的一个词是anti-rationalization——反合理化。

AI 很擅长给自己找借口:

  • "这只是原型,先这样吧"
  • "测试稍后加上"
  • "重构太复杂,先不搞了"

Agent Skills 的做法是:把这些借口直接写进技能文档里,并附上反驳。"我会稍后添加测试"→ 稍后 = 永不,现在写。"能跑就行"→ 能跑不等于可维护。

这个设计太骚了。AI 看到借口,就会想起反驳。相当于给 AI 植入了一个内部监督机制。

渐进式披露节省算力。传统方式下,AI 每次任务开始都要读取大量背景信息。Agent Skills 采用渐进式披露——AI 只在真正需要时才加载对应技能的知识,对长任务链特别有意义。


跟 MCP 的关系

这是 HN 评论里很多人问的问题。

简单说:MCP 解决"接得上"的问题,Skills 解决"干得对"的问题。

MCP(Model Context Protocol)是工具调用协议——让 AI 能调用外部工具。MCP 负责的是"AI 能不能做到"。

Agent Skills 是流程规范——让 AI 按正确顺序、正确标准完成任务。Skills 负责的是"AI 做的时候会不会偷懒"。

两者是互补关系,不是替代关系。MCP 是基础设施,Skills 是上层规范。


我的踩坑经验

用 AI 写代码这么久,有几个跟 Skills 理念非常吻合的经验:

验收标准必须可量化。"测试要写得好"是废话,"测试覆盖率 > 80%"才是标准。把"做好"翻译成具体的数字指标,AI 执行起来才不会走偏。

每个节点都要有明确的退出条件。AI 任务经常虎头蛇尾——开头认真,后面糊弄。给每个步骤设置 Checkpoint,未通过就停止,逼着 AI 在每个节点都交出合格产出。

让 AI 提供执行证据,不要主观判断。AI 说"测试都通过了"——这是主观判断,不可信。AI 说"运行 npm test,输出显示 15 passed,0 failed,覆盖率 82%"——这是执行证据,可验证。Skills 的 Checkpoint 机制,就是强制 AI 提供证据而不是判断。


什么时候该用 Agent Skills

适合的场景:

  • 重复性高的任务流程(代码审查、测试生成、数据清洗)
  • 多步骤、长链路的任务(需要按顺序完成,不能跳步)
  • 团队需要固化最佳实践(把资深工程师的经验转成 Skills)
  • 对输出质量有明确标准的任务

不适合的场景:

  • 探索性任务(你都不知道答案是什么,让 AI 自由发挥)
  • 一次性小任务(写个 hello world 还要配 Skill 杀鸡用牛刀)
  • 创意类任务(写文案、做设计,Skills 规范太死板)

判断与行动建议

Agent Skills 是 2026 年最值得投入的 AI 工程化实践之一。

它的价值不在于技术多先进,而在于解决了一个很实在的问题:怎么让 AI 在实际干活的时候不摸鱼、不糊弄、不找借口。

如果你在带团队做 AI 应用落地,建议把 Skills 设计纳入开发规范:

先从高频任务开始,找到团队里重复执行最多的 3-5 个任务,为它们编写 Skills。把 Checkpoint 当成 CI,不过不了就不能继续——每个 Skill 的 Checkpoint 就是一道质量门。积累团队数字资产,Skills 是可以被版本管理、复用的团队知识,这是 AI 时代最重要的资产之一。


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/6 4:23:27

AI战略决策系统:应对战争迷雾的不完全信息博弈技术

1. 项目背景与核心挑战 现代战略决策领域正面临前所未有的复杂性挑战。在高度不确定的环境中,决策者常常需要在信息不完整、动态变化的情况下做出关键判断。这种情境被军事战略家称为"战争迷雾"——就像浓雾中看不清全貌的战场,决策者只能依靠…

作者头像 李华
网站建设 2026/5/6 4:22:27

从游戏引擎到CAD:曲面法向量计算在Unity和Blender中的实际应用与坑点

从游戏引擎到CAD:曲面法向量计算在Unity和Blender中的实际应用与坑点 在三维建模和游戏开发中,曲面法向量是一个看似基础却至关重要的概念。无论是Unity中物体表面的光照效果,还是Blender里模型的平滑渲染,法向量的正确计算直接决…

作者头像 李华
网站建设 2026/5/6 4:20:26

对接Claude Code编程助手时配置Taotoken兼容通道详解

对接Claude Code编程助手时配置Taotoken兼容通道详解 1. Claude Code 与 Taotoken 的兼容性说明 Claude Code 作为基于 Anthropic 协议的编程助手工具,可通过 Taotoken 平台接入多种大模型服务。Taotoken 提供的 Anthropic 兼容通道采用标准 HTTP 接口&#xff0c…

作者头像 李华
网站建设 2026/5/6 4:18:44

微软HydraLab:云原生移动端自动化测试平台部署与实战指南

1. 项目概述:一个被低估的移动端自动化测试利器如果你和我一样,长期在移动应用开发和质量保障的一线摸爬滚打,那你一定对自动化测试的“痛”深有体会。设备碎片化、测试环境搭建繁琐、脚本维护成本高、真机资源难以管理……这些问题就像房间里…

作者头像 李华
网站建设 2026/5/6 4:16:34

双曲空间视觉语言模型中的不确定性对齐技术

1. 项目背景与核心挑战在计算机视觉与自然语言处理的交叉领域,多模态模型的对齐问题一直是研究的重点难点。传统方法往往采用欧式空间进行特征表示,但近年来双曲几何空间因其独特的层级结构表示能力,在处理具有树状或层级关系的数据时展现出显…

作者头像 李华
网站建设 2026/5/6 4:16:32

McpHub:AI应用开发的MCP协议枢纽与工具聚合实践

1. 项目概述与核心价值最近在折腾AI应用开发,特别是想把不同的大模型能力整合到自己的项目里时,遇到了一个挺普遍的问题:每个模型、每个工具都有自己的接口协议和调用方式,想做一个功能稍微复杂点的Agent,光是在不同AP…

作者头像 李华