news 2026/5/28 6:26:12

给 AI 编程助手装上大脑:209K 星的项目教它先想后做

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
给 AI 编程助手装上大脑:209K 星的项目教它先想后做

你还在让 AI 直接写代码然后擦屁股?Superpowers 的做法是:让它在写第一行代码之前,先花 30 秒想清楚你到底要什么。

读完本文你将了解:它和其他 prompt 包有什么本质区别 | 技能自触发系统怎么做到的 | 子代理驱动开发的二阶审查机制 | 为什么 209K 开发者愿意试用


🎯 不用 Superpowers 的 AI 编程助手,像是没有项目经理的开发

你有没有过这样的经历:让 Claude 写一个 React 组件,它 3 秒就啪地输出一坨代码——看上去挺像那么回事,但一跑就报错。你告诉它错了,它说"抱歉,让我修正",然后输出另一坨,又错。来回 5 轮后你发现它根本没理解你要什么,只是根据关键字猜了一个最常见实现。

这不是 AI 能力不够,是缺少一个项目管理的环节

传统 prompt 集合的做法是:塞一堆规则到 system prompt——“你要先分析需求”、“写测试再写代码”、“代码要优雅”。问题是这些规则写进去了,AI 记不记得看心情,执行不执行看状态,没人监督没人提醒。

Superpowers 的选择截然不同:把方法论做成技能,让 AI 在正确的时机自动触发正确的工作流。不是告诉 AI “你应该怎么做”,而是让它在特定场景下不得不这么做。

它的核心是一个包含 14 个技能的系统。每个技能是一份 SKILL.md 文件,描述了某个工作流的完整流程。但关键不是文件本身,而是触发机制——AI 在开始任务前会自动检测当前场景是否匹配某个技能的触发条件。匹配上了,技能自动激活,不匹配,AI 跳过它直接执行。

维度普通 prompt 包Superpowers
触发方式用户手动调用或完全依赖 AI 自觉自动检测场景,技能自触发
执行保障无——AI 可能忽略某条规则强制——技能一旦触发,必须完成流程
可组合性线性叠加,prompt 越长效果越差模块化,14 个技能可灵活组合
方法论深度表面规则(“写测试”)完整流程(TDD 的 RED-GREEN-REFACTOR + 提交节奏)
跨平台每个平台写一份同一技能适配 Claude Code/Codex/Cursor/Gemini CLI 等 8 个平台

Superpowers 和普通的 prompt 集合不是竞争关系——后者告诉你方向,前者替你规划路线。如果你已经有一套 prompt 用着顺手,加 Superpowers 只是让执行落地更稳。


🔧 3 行命令给任何 AI 编程助手装上系统

安装分两步:装框架,然后它自己跑起来。

Claude Code(最推荐,体验最完整)

# 方法一:官方插件市场安装 /plugin install superpowers@claude-plugins-official

这是最干净的安装方式,不像其他方法需要注册外部 marketplace。安装完立马可以用,不需要额外配置。

Codex CLI 和其他平台

# Codex CLI# 打开插件搜索界面/plugins# 搜索 "superpowers"# Gemini CLIgemini extensionsinstallhttps://github.com/obra/superpowers# Cursor# 在 Agent chat 中输入/add-plugin superpowers

所有平台安装完后,你只需要做一件事:给 AI 下达一个开发任务

⚠️ 不要跳过第 0 步直接说"帮我写一个函数"。Superpowers 的工作流全程依赖你一开始的描述——越模糊,它 brainstorm 阶段问你的问题就越多。我的经验是花 30 秒说清楚"做什么+为什么+不做什么",它后面 20 分钟完全不需要你干预。

预期效果

安装完 Superpowers 后,你对 Claude 说"让我们做一个 React 待办列表",它不会直接写代码。它会先触发brainstorming技能,问你一系列问题:

  • 这个待办列表的核心用户是谁?
  • 需要支持离线吗?
  • 数据持久化用什么方案?
  • 移动端要适配吗?

你回答完后,它生成设计文档让你确认。你点头了,它才会进入writing-plans阶段把任务分解成每个 2-5 分钟的子任务。最后通过subagent-driven-development逐步执行。

如果你不回答面试官问题而是直接甩一份代码出去——Superpowers 上的 agent 最后会自己意识到"我没有走完流程,得重来"。


⚙️ 技能自触发:不是 AI 听话,是它别无选择

Superpowers 的技术核心不是有多少条 prompt 规则,而是那套让技能自动激活的引导系统

自触发原理

Superpowers 利用每个 AI 编程助手的"系统引导"机制——Claude Code 有CLAUDE.md,Codex 有AGENTS.md,Gemini CLI 有GEMINI.md。这些文件在 session 启动时被注入 AI 的上下文中。

Superpowers 在引导文件中写了一条铁律:开始任何任务前,先检查 skills 目录中是否有匹配当前上下文的技能。匹配规则很简单——通过技能名和触发关键词做模糊匹配。比如说,你提到"写代码"或者"实现"等词,brainstorming技能的触发条件就匹配了。

如果匹配了多条技能,它们的执行优先级是固定的:

  1. brainstorming(最高)—— 项目开始前
  2. writing-plans —— 设计确认后
  3. subagent-driven-development / test-driven-development —— 实施时
  4. requesting-code-review —— 任务间
  5. finishing-a-development-branch —— 完成时

如果选了另一种方案——把所有规则塞进一个超大 system prompt——结果是 token 溢出和注意力稀释。Anthropic 自己的内部测试表明,prompt 超过 8K token 后,越靠后的规则被遵循的概率呈指数下降。Superpowers 把方法论拆成独立技能文件,每个不到 3K token,只在需要时才被加载,解决了这个根本矛盾。

所以:不是 Superpowers 的 AI 更聪明,是它的信息加载方式更高效。你的 AI 还是那个 AI,但它每次思考时只看到跟当前任务最相关的 3K token,而不是 20K 的废话。

用户提出任务

Agent 启动

加载引导文件
CLAUDE.md / AGENTS.md

扫描 skills/ 目录

匹配到技能?

加载匹配技能 SKILL.md

直接执行

技能优先级排序

brainstorming
最高优先级

执行技能指定流程

进入下一技能
或完成任务

输出结果

这个机制妙的地方是冷启动——不需要 API 额外调用,不需要 AI 理解复杂的调度逻辑。所有决策在 AI 的注意力窗口内自然发生。


🏗️ 架构分析:14 个技能的分层协作体系

模块划分

Superpowers 的 14 个技能分为四个层次,每个层解决一类问题:

层级技能功能
项目启动brainstorming, using-git-worktrees需求澄清 + 开发环境隔离
规划执行writing-plans, subagent-driven-development, executing-plans任务分解 + 多 Agent 并行执行
质量保障test-driven-development, requesting-code-review, systematic-debugging测试先行 + 代码审查 + 系统排查
元管理writing-skills, using-superpowers技能开发 + 系统自愈

每个技能在流程中有明确的触发点和退出条件,形成一个闭环工作流。如果某个环节失败了(比如测试不通过),流程不会继续推进,而是回退到问题定位阶段。

设计亮点:二阶代码审查

这是最让我觉得巧妙的设计。Superpowers 的subagent-driven-development不是简单地让 AI 执行完任务就完事。每个子任务完成后,会启动两个独立审查环节

  1. 规范审查(Spec Review):检查输出是否符合设计要求
  2. 代码质量审查(Code Quality Review):检查代码风格、测试覆盖率、性能

两个审查由不同的 AI 实例执行(每次调用都是独立 session),确保审查者不会"帮作者圆谎"。如果不这样——让写代码的 AI 自己审查自己的代码——它大概率觉得自己的产出完美无缺。

Code Quality ReviewerSpec ReviewerSubAgentwriting-plansbrainstormingUserCode Quality ReviewerSpec ReviewerSubAgentwriting-plansbrainstormingUser两阶审查在不同 session 执行提出任务出设计文档派发子任务实现功能提交实现审查规范符合度规范通过审查代码质量审查通过,提交

不够好的地方

当然有缺点。Superpowers 的强流程设计在简单任务上显得笨重——改一行配置也要走 brainstorm → plan → implement → review 的完整流程,浪费的成本比收益高。所以它更适合中大型项目,而不是 quick fix。


✅ 优缺点 & 适用场景

优点

  1. 自触发系统真正解决了"AI 不听话"的问题。不是靠不停地改 prompt,而是从架构层面让 AI 别无选择。
  2. 多平台覆盖让学习成本降低。学会一套流程,Claude Code、Codex、Cursor 都能用同一套方法论。
  3. TDD + 子代理二阶审查的组合把代码质量提到了团队协作水平。不再是单人 solo 的代码质量。

缺点

  1. 简单任务的开销不可忽视。改一个变量名也要走完整流程,简单粗暴。
  2. 越狱/绕过成本低。如果用户明确说"不用 Superpowers,直接写代码",AI 可以选择不触发技能。依赖的是 AI 的服从性,不是硬限制。

适合谁

  • 立刻试试:团队用 AI 写核心模块但代码质量不稳定的
  • 再等等:项目以零散修复和配置修改为主,很少从头写功能

竞品一句话

跟市面上杂乱的 prompt 工厂相比,Superpowers 的独特之处是用方法论替换了规则列表。代价是简单任务上你会多花 2-3 分钟走流程。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/28 6:25:32

54.高通 9008 + 联发科 Preloader + 苹果 DFU,全机型救砖维修实录

摘要 本文面向具备基础Linux操作能力的维修工程师与进阶发烧友,系统阐述Android与iOS双平台刷机维修的底层原理与工程实践。内容涵盖高通、联发科、苹果A系列芯片的引导链差异,详细拆解EDL深度刷写、Fastboot分区修复、iTunes DFU恢复三大核心流程,并给出可直接运行的Pytho…

作者头像 李华
网站建设 2026/5/28 6:24:18

SCP协议与Plexa框架:基于数字肌肉记忆实现LLM实时物理控制

1. 项目概述:当大语言模型遇上60帧物理世界如果你尝试过让一个大语言模型去实时控制一个60帧每秒的物理模拟循环——无论是机器人、MuJoCo仿真环境,还是游戏里的NPC——你大概率会立刻撞上一堵墙。这堵墙不是算力不够,也不是模型不聪明&#…

作者头像 李华
网站建设 2026/5/28 6:23:12

AI智能体协同协议:构建高效多智能体系统的关键缺失层

1. 项目概述:寻找智能体身份之后的“缺失层”在AI智能体(Agent)领域,我们花了大量时间讨论“身份”(Identity)问题:如何让智能体拥有一个稳定、可信、可识别的数字身份,如何管理其权…

作者头像 李华
网站建设 2026/5/28 6:13:09

Cursor Composer 最佳实践

Cursor Composer 最佳实践(2026年最新) 是 Cursor 最强大的“杀手级”功能,用于多文件编辑、自治 Agent 任务和复杂变更。它本质上是 AI 驱动的“多文件 Agent”,能规划、编辑、运行命令并迭代。 1. 基础操作与快捷键 打开 Compos…

作者头像 李华
网站建设 2026/5/28 6:12:21

shm待整理

MyLogger 完整详解 一、设计思想 为什么需要 MyLogger? 项目中有大量地方要记录日志:用户注册、登录、摄像头操作……如果每个地方都直接用 std::cout,会有这些问题:问题coutMyLogger同时输出到控制台文件❌ 只能选一个✅ 一次调用…

作者头像 李华