Agent Skills 概念解析以及使用方式

Skills 能将 Token 消耗降低 75%, 它的核心价值在于「渐进式披露」和「确定性执行」——用 IO 换 Token。本文拆解 Skills 的三级加载机制，为你提供一套拒绝盲目引入复杂度的技术决策树

分类:

标签:

LLM

Claude Code

Agent

创建时间

2025-12-24

更新时间

2026-01-30

字数

4360

1. Agent Skills 到底是什么？

一句话定义：Agent Skills 是运行在 VM 环境中的"可执行能力包"，包含 指令（instructions）、脚本（code）、资源（resources） 三种内容，通过 Progressive Disclosure（渐进式披露） 机制按需加载。

为什么不是简单的"Context 注入"？

很多人（包括我之前）把 Agent Skills 理解成"把文档塞进 Context"的优化手段。这是错误的。

Agent Skills 的核心能力：

可执行代码：Skills 可以包含 Python/JavaScript 脚本，Claude 执行脚本时，代码本身不进入 Context，只有输出（stdout/stderr）进入。这让你可以把复杂的数据处理、验证逻辑封装成确定性的代码，而不是让 LLM 每次都现场生成。
文件系统访问：Skills 运行在有文件系统的 VM 中，可以读写文件、执行 bash 命令。
无限资源存储：因为文件不被读取就不消耗 Token，你可以在 Skill 里塞几十个 reference 文件，只在需要时读取。

3 行的编码规范	✅ 直接写进 Prompt	❌ 过度工程
500 行的最佳实践文档	❌ 太长，干扰注意力	✅ 封装成 Skill
需要执行确定性验证（如 JSON Schema 校验）	❌ LLM 不擅长	✅ 写成 Python 脚本放进 Skill
需要访问大量参考文档（如 API 文档、数据库 Schema）	❌ Token 溢出	✅ 放进 Skill，按需读取

维度	System Prompt	Agent Skill	MCP Server
本质	纯文本指令	VM 中的"能力包"（指令 + 代码 + 资源）	外部工具协议
运行环境	LLM Context	Claude VM（有文件系统、bash）	独立进程
加载方式	Always On	Progressive Disclosure	动态调用
代码执行	❌ 不支持	✅ 可执行脚本（代码不进 context）	✅ 外部工具调用
Token 成本	高（全部加载）	低（按需加载）	极低（只有输入输出）
数据源	静态文本	静态文件（本地）	动态系统（DB, API）
最佳场景	人设、基本规则	最佳实践 + 确定性验证	实时数据查询、复杂工具调用

需求	选择	理由
"代码必须用 UTF-8"	System Prompt	一句话的规则
"React 最佳实践（500 行文档）"	Agent Skill (Level 2)	大量指令，低频触发
"JSON Schema 验证"	Agent Skill (Level 3 Code)	确定性逻辑，用 Python 执行更可靠
"查询用户数据库"	MCP Server	需要实时访问外部 PostgreSQL

Skill 库	适用场景	安装优先级
Anthropic 官方	生成文档、学习 Skill 编写范式	高（文档处理必备）
Vercel	写 React/Next.js 代码、前端性能优化	高（前端开发者必装）
Supabase	设计 PostgreSQL Schema、优化 SQL 查询	中（后端 / 全栈开发者）

问题	原因	修复
`name` 包含大写字母	违反命名规范	改为小写：`my-skill`
`description` 过短	< 50 字符	详细说明"做什么"和"何时触发"
YAML frontmatter 格式错误	缺少 `---` 分隔符	确保开头和结尾都有 `---`
缺少 `SKILL.md`	必需文件	创建 `SKILL.md` 并添加 frontmatter
References 文件路径错误	在 SKILL.md 中引用不存在的文件	检查相对路径是否正确

特征	示例	是否适合 Skill
少于 50 行的简单规则	"代码用 UTF-8"	❌ 保留在 Prompt
成体系的文档（> 500 行）	React 最佳实践	✅ 迁移到 Skill
包含确定性验证逻辑	JSON Schema 校验	✅ 迁移到 Skill（写成脚本）
需要大量参考资料	API 文档、Schema 示例	✅ 迁移到 Skill

指标	目标	测量方法
Token 消耗	降低 > 50%	LLM Provider Dashboard
TTFT	降低 > 30%	浏览器 DevTools Network
准确率	不下降	人工抽查 10 次对话
脚本可靠性	> 95%	如果用了 Scripts，测试执行成功率

内容	方案
< 100 行的规则	System Prompt
> 500 行的最佳实践文档	Agent Skill (SKILL.md)
需要确定性验证（Schema 校验、格式转换）	Agent Skill (Scripts)
需要访问外部 DB/API	MCP Server

1. Agent Skills 到底是什么？

为什么不是简单的"Context 注入"？

什么时候必须用 Skills？

2. 核心机制：三级加载（Progressive Disclosure）

Level 1: Metadata（Always Loaded，启动时加载）

Level 2: SKILL.md Body（Loaded When Triggered，触发时加载）

Level 3: Bundled Resources（Loaded As Needed，按需加载）

3. 实测数据：Skills 到底省多少？

方案 A：全部塞进 System Prompt

方案 B：使用 Agent Skill

4. 技术选型：Skill vs Prompt vs MCP

决策树

5. 反模式：不要滥用 Skills

❌ 错误 1：把所有东西都做成 Skill

❌ 错误 2：高频触发的 Skill

❌ 错误 3：在 Skill 里存放动态数据

❌ 错误 4：万能 Skill

6. 现成工具：如何使用这些 Skill 库

6.1 Anthropic 官方 Skills (anthropics/skills)

6.2 Vercel (vercel-labs/agent-skills)

6.3 Supabase (supabase/agent-skills)

使用建议

7. Skill 模板：标准结构

最小可用 Skill

❌ 频繁更新的字段用 JSONB

输出格式

完整 Skill（带脚本和资源）

自动验证

字段要求

7.1 Skills 打包：从目录到 .skill 文件

官方打包脚本：package_skill.py

手动打包（无需脚本）

验证打包结果

常见错误

分发和安装

8. 安全建议：只用可信来源的 Skills

安全检查清单

9. 从 Prompt 迁移到 Skill：3 步行动

Step 1: 识别候选内容（30 分钟）

Step 2: 拆分原子化 Skill（1-2 小时）

Step 3: 验证效果（1 周）

10. 总结

核心观点

使用场景

6.1 Anthropic 官方 Skills (`anthropics/skills`)

6.2 Vercel (`vercel-labs/agent-skills`)

6.3 Supabase (`supabase/agent-skills`)