news 2026/4/20 9:10:55

AI 编程工具的四层能力体系:Skills、MCP、Rules、Agents 完全指南

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI 编程工具的四层能力体系:Skills、MCP、Rules、Agents 完全指南

2024 年底,Anthropic 发布了 Model Context Protocol(MCP);2025 年底,Agent Skills 作为开放标准正式推出;到 2026 年初,Claude Code 已跃居开发者最喜爱的 AI 编程工具榜首。

在这场变革背后,有四个核心概念正在重塑我们与 AI 协作编程的方式:Skills(技能)、MCP(模型上下文协议)、Rules(规则)和Agents(智能体)。

它们各自解决什么问题?彼此之间是什么关系?为什么说理解它们就是理解 AI 编程的未来?


在深入技术细节之前,我们先用一个直观的类比来建立整体认知:

概念医院类比核心作用
Rules医院管理制度始终生效的行为规范
Skills医疗操作手册按需查阅的专业知识
MCP检验设备与病历系统连接外部工具和数据
Agents各科室的医生独立执行复杂任务

医院的管理制度(Rules)规定了所有人都必须遵守的基本规范——手术前必须洗手、处方必须双人核对。医疗操作手册(Skills)则是各种专业操作的详细指南——心脏搭桥手术怎么做、急救流程是什么。检验设备和病历系统(MCP)让医生能够获取化验结果、调阅影像资料、查看患者历史。而各科室的医生(Agents)则是独立思考、自主行动的专业人员,他们遵循制度、参考手册、使用设备,最终完成诊疗任务。

理解了这个类比,我们就可以逐一展开了。


Rules:始终在线的行为规范

什么是 Rules?

Rules 是 AI 编程助手启动时就加载的持久化指令,定义了 AI 在整个工作过程中必须遵循的约束和规范。在 Claude Code 中,Rules 主要通过CLAUDE.md文件和.claude/rules/目录来定义。

它解决什么问题?

每次你开启一个新的 AI 对话,AI 对你的项目一无所知——它不知道你用的是什么构建工具、测试框架是哪个、代码风格有什么偏好、提交信息该怎么写。如果每次都要重新交代这些,效率极低。

Rules 就是解决这个问题的:一次定义,每次对话自动生效。

实际例子

# CLAUDE.md — 项目根目录## 构建命令- 运行测试:`npm test`- 构建项目:`npm run build`## 代码规范- 使用 TypeScript strict 模式- 组件文件使用 PascalCase 命名- commit 信息遵循 Conventional Commits 格式## 架构约定- API 路由放在 src/routes/ 下- 数据库操作必须通过 Repository 层

作用范围:层叠式继承

Rules 支持多层级继承,从最宽泛到最具体:

全局规则 ~/.claude/CLAUDE.md → 所有项目生效项目规则 ./CLAUDE.md → 当前项目生效目录规则 ./src/api/CLAUDE.md → 特定目录生效条件规则 .claude/rules/python.md → 仅处理 .py 文件时生效

层级越深,优先级越高。你可以在全局设置通用偏好,在项目中覆盖特定配置,在子目录中进一步细化——就像 CSS 的层叠规则一样。

跨工具支持

Rules 并非 Claude Code 独有。几乎所有主流 AI 编程工具都有类似机制:

工具Rules 实现
Claude CodeCLAUDE.md+.claude/rules/
Cursor.cursor/rules/*.mdc
GitHub Copilot.github/copilot-instructions.md
Windsurf.windsurf/rules/
KiroSteering 文件

2025 年,一个跨平台标准AGENTS.md应运而生(由 Google、OpenAI、Sourcegraph 等联合推出),目前已被6 万多个 GitHub 仓库采用,旨在让一份指令文件适配所有 AI 编程工具。


Skills:按需加载的专业技能

什么是 Skills?

如果说 Rules 是「公司制度手册」,那 Skills 就是「岗位操作手册」。

Skills 是模块化的指令包,每个 Skill 是一个文件夹,核心是一个SKILL.md文件,里面包含了完成特定任务的详细步骤、工作流程和参考资料。它由 Anthropic 在 2025 年 10 月首次推出,12 月作为开放标准 Agent Skills 发布,现已被 Claude Code、Cursor、VS Code Copilot、OpenAI Codex 等20 多个平台支持。

它解决什么问题?

Rules 适合放简短的约束和规范,但当你需要教 AI 完成一个复杂的、多步骤的工作流程时,Rules 就力不从心了。比如:

  • • 如何将 Markdown 文章转换为微信公众号格式并发布?
  • • 如何按照团队规范进行代码审查?
  • • 如何生成符合品牌设计风格的封面图?

这些都需要详细的步骤说明、决策逻辑、甚至配套脚本——这正是 Skills 的用武之地。

关键特性:渐进式加载

Skills 最精妙的设计在于渐进式加载(Progressive Disclosure):

空闲时:仅加载名称和描述 → ~30-50 tokens激活时:加载完整指令 → 数千 tokens

这意味着你可以安装几十个 Skill,但只在需要时才消耗上下文窗口。相比把所有指令塞进 Rules(每次对话都全量加载),Skills 节省了 90% 以上的 token 开销

一个 Skill 长什么样?

---name: code-reviewdescription: 对代码变更进行全面审查,检查安全性、性能和可维护性version: 1.0.0user-invokable: true---## 审查流程1. **读取变更**:获取所有修改的文件2. **分层检查**: - 安全性:是否存在注入、XSS、敏感信息泄露 - 正确性:逻辑是否正确,边界条件是否处理 - 性能:是否有 N+1 查询、不必要的重渲染 - 可维护性:命名是否清晰,是否过度设计3. **输出报告**:按严重程度分级(Critical / High / Medium / Low)

用户可以通过/code-review斜杠命令手动调用,AI 也会在检测到相关任务时自动激活。

Skills 生态

Skills 已经形成了一个类似 npm 的生态系统:

  • 公共目录:skills.sh 提供可搜索的 Skill 索引
  • 安装工具npx skills add <owner/repo@skill>一键安装
  • 版本锁定skills-lock.json确保团队使用一致的版本
  • 用户定制:通过EXTEND.md文件覆盖默认配置

MCP:连接万物的通用协议

什么是 MCP?

Model Context Protocol(模型上下文协议)是 Anthropic 在 2024 年 11 月发布的开放标准,用于将 AI 助手与外部工具和数据源连接起来。

一句话概括:MCP 是 AI 的 USB-C 接口。

在 MCP 出现之前,让 AI 连接 GitHub 需要一套代码,连接数据库需要另一套,连接 Slack 又是一套——每个集成都是定制开发。MCP 将这一切标准化为一个协议:任何 MCP 兼容的客户端都能连接任何 MCP 兼容的服务器,无需定制胶水代码。

技术架构

MCP 采用客户端 - 服务器架构,通过三个核心原语工作:

┌─────────────────────────────┐│ AI 助手(Host) ││ ││ ┌───────────┐ ││ │ MCP Client │──────────── │──→ MCP Server: GitHub│ └───────────┘ ││ ┌───────────┐ ││ │ MCP Client │──────────── │──→ MCP Server: 数据库│ └───────────┘ ││ ┌───────────┐ ││ │ MCP Client │──────────── │──→ MCP Server: Notion│ └───────────┘ │└─────────────────────────────┘

三个核心原语:

原语作用类比
ToolsAI 可以调用的函数动词——「做什么」
ResourcesAI 可以读取的数据名词——「看什么」
Prompts预定义的交互模板模板——「怎么问」

生态现状

截至 2026 年初,MCP 生态已经相当成熟:

  • 97M+月度 SDK 下载量
  • 10,000+社区构建的 MCP 服务器
  • • 所有主流 AI 工具(Claude、ChatGPT、Gemini、Copilot、Cursor)均已原生支持
  • • 已捐赠给Linux 基金会,由 Anthropic、OpenAI、Google、Microsoft、AWS 共同治理

常见的 MCP 服务器包括:

服务器功能
GitHub MCP操作 PR、Issue、仓库
Playwright MCP浏览器自动化
Supabase MCP数据库操作
Notion MCP知识库管理
Context7 MCP实时查询库文档
Filesystem MCP文件系统读写

MCP vs API 调用:三个关键区别

你可能会问:这和直接调 API 有什么区别?

    1. 标准化:开发者只需实现一次 MCP 协议,所有 AI 工具都能用,而不是为每个 AI 工具分别对接
    1. 双向通信:MCP 不仅仅是 AI 调用工具,工具也可以主动向 AI 推送信息(如数据变更通知)
    1. 安全模型:MCP 内置了权限控制,用户可以精细地控制 AI 能访问什么、能做什么

Agents:自主行动的智能体

什么是 Agents?

如果把前面三个概念比作基础设施,那 Agents 就是真正「干活的人」。

Agent 是一个能够自主规划、执行、检查和调整的 AI 实例。它不只是回答问题——它会制定计划、拆分任务、调用工具、检查结果,如果发现问题还会自行修正,直到任务完成。

子智能体(Subagents)

在 Claude Code 中,主对话可以派生出专门的子智能体来并行处理任务

主对话(你在交互的 AI) ├── 子智能体 A:安全审查(独立上下文) ├── 子智能体 B:性能分析(独立上下文) └── 子智能体 C:代码风格检查(独立上下文)

每个子智能体:

  • • 拥有独立的上下文窗口,不会污染主对话
  • • 可以配置专属的工具集MCP 服务器
  • • 可以预加载特定 Skills
  • • 完成后只返回结果摘要给主对话

这就像医院里的分诊制度:主治医师负责统筹,具体的化验、影像、检查分别交给各科室专家去做,最终汇总结果再做诊断。

自定义 Agent

你可以创建自己的专属 Agent:

---name: security-reviewerdescription: 审查代码中的安全漏洞tools: Read, Grep, Glob, Bashmodel: opus---你是一名资深安全工程师。请审查代码中的以下问题:- 注入漏洞(SQL、XSS、命令注入)- 认证和授权缺陷- 代码中的密钥或凭据- 不安全的数据处理请提供具体的代码行引用和修复建议。

将这个文件放在.claude/agents/目录下,AI 就能在适当时机自动调用它。

Agent Teams(智能体团队)

更进一步,Claude Code 还支持多个独立的 AI 会话协同工作:

Team Lead(团队负责人) ├── 成员 A:负责前端重构 ├── 成员 B:负责 API 开发 └── 成员 C:负责测试编写

团队成员通过共享任务列表和消息传递来协调工作,就像一个真正的开发团队一样。


四者如何协同工作?

理解了每个概念之后,让我们看看它们是如何在一个真实场景中协同运作的。

场景:你对 AI 说「帮我实现用户注册功能,包含邮箱验证」

1. Rules 生效 → AI 读取 CLAUDE.md,知道项目用 Next.js + Prisma → AI 读取代码规范,知道要用 TypeScript strict 模式 → AI 读取提交规范,知道 commit 格式要求2. Skills 激活 → AI 自动加载 TDD Skill,决定先写测试 → AI 加载 Code Review Skill,准备写完后自审3. MCP 连接 → 通过 GitHub MCP 创建功能分支 → 通过数据库 MCP 检查现有 Schema → 通过 Playwright MCP 运行端到端测试4. Agents 分工 → 主 Agent 制定实施计划 → 子 Agent A:编写数据库迁移脚本 → 子 Agent B:实现 API 路由 → 子 Agent C:编写前端表单组件 → 子 Agent D:安全审查所有代码 → 结果汇总,主 Agent 提交代码

四者各司其职,缺一不可。


分层架构全景图

┌─────────────────────────────────────────────────┐│ 用户交互层 ││ 你输入指令,AI 回复结果 │├─────────────────────────────────────────────────┤│ Agents(执行层) ││ 自主规划、并行执行、检查结果、自动修正 │├─────────────────────────────────────────────────┤│ Skills(知识层) ││ 按需加载的专业知识、工作流程、操作指南 │├─────────────────────────────────────────────────┤│ Rules(约束层) ││ 始终生效的代码规范、项目配置、团队约定 │├─────────────────────────────────────────────────┤│ MCP(连接层) ││ 标准化的外部工具和数据源接口 │├─────────────────────────────────────────────────┤│ Hooks(自动化层) ││ 确定性的生命周期脚本,不依赖 AI 推理 │└─────────────────────────────────────────────────┘

你可能注意到了图中还有一个Hooks——它是在 AI 推理循环之外运行的确定性脚本,比如每次提交前自动运行 lint、每次启动时检查环境变量。Hooks 是「自动安检员」,不需要 AI 理解或判断,只要触发条件满足就执行。


横向对比:各工具的支持情况

能力Claude CodeCursorGitHub CopilotWindsurfKiro
RulesCLAUDE.md + rules/.cursor/rules/*.mdccopilot-instructions.md.windsurf/rules/Steering 文件
Skills原生支持支持 Agent Skills支持 Agent Skills待支持支持 Agent Skills
MCP原生首发已支持已支持已支持通过 Bedrock 支持
Agents子智能体 + 团队Agent ModeAgent ModeCascade自主 Agent
Hooks生命周期钩子Beta有限支持暂无Agent Hooks
跨平台标准AGENTS.mdAGENTS.mdAGENTS.mdAGENTS.mdAGENTS.md

可以看到,MCPAGENTS.md已成为事实上的行业标准,所有主流工具都在向它们靠拢。


趋势与展望

标准化融合

MCP、Agent Skills、AGENTS.md 都已进入 Linux 基金会旗下,碎片化的时代正在过去。

从助手到自主工程师

AI 编程工具的演进路径清晰可见——从 2022 年的行内补全(Copilot),到 2025 年的智能体会话(Claude Code),再到 2026 年的多日自主编程(Kiro)。

Skills 生态爆发

就像 npm 之于前端、Docker 之于容器化,Skills 正在成为AI 能力分发的标准单元

Token 效率成为核心关注

渐进式加载(Skills)、服务端数据过滤(MCP)、上下文隔离(Subagents)——整个行业都在想方设法让有限的上下文窗口发挥最大价值。


写在最后

Skills、MCP、Rules、Agents——这四个概念并不是相互竞争的替代品,而是一个精心设计的分层系统中各司其职的组件:

  • Rules告诉 AI「你必须遵守什么」
  • Skills告诉 AI「你应该怎么做」
  • MCP让 AI「能够触及什么」
  • Agents让 AI「自主完成什么」

理解这四个概念,不仅能帮助你更高效地使用当前的 AI 编程工具,更能让你看清这个领域的发展方向——从编写代码的助手,到管理代码的工程师,AI 正在一步步走来。

而你要做的,不是担心被替代,而是学会如何当好这支 AI 团队的「技术总监」。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/20 9:10:47

PageIndex技术全解析:基于推理的无向量RAG框架,重构长文档智能检索范式PageIndex 是一个创新的、无向量

随着大语言模型&#xff08;LLM&#xff09;的快速迭代&#xff0c;检索增强生成&#xff08;RAG&#xff09;已成为解决大模型幻觉、实现私有知识库落地的核心技术。然而&#xff0c;主流的向量检索式RAG始终面临切片上下文割裂、语义相似度与内容相关性脱节、结构化文档信息丢…

作者头像 李华
网站建设 2026/4/20 9:09:51

CRNN OCR文字识别镜像在发票处理中的应用实战

CRNN OCR文字识别镜像在发票处理中的应用实战 1. 项目背景与价值 发票处理是企业财务工作中最常见的场景之一。传统的人工录入方式存在效率低、错误率高、成本高等问题。以某中型企业为例&#xff0c;财务部门每月需要处理2000张各类发票&#xff0c;3名专职人员每天需要花费…

作者头像 李华
网站建设 2026/4/20 9:09:25

终极网盘直链下载神器:2025年免费解锁八大网盘全速下载完整指南

终极网盘直链下载神器&#xff1a;2025年免费解锁八大网盘全速下载完整指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 &#xff0c;支持 百度网盘 / 阿里云盘 / 中国移动云…

作者头像 李华
网站建设 2026/4/20 9:06:57

需求说不清楚,给 AI 十次机会也写不对

芯片工程师做系统设计时有个基本功&#xff1a;把模糊的业务需求转化成可执行的技术约束。客户说"这个接口要快"&#xff0c;这不是约束&#xff0c;这是期望。你得追问&#xff1a;延迟还是吞吐量&#xff1f;工艺节点多少&#xff1f;时钟频率&#xff1f;功耗预算…

作者头像 李华