文章目录[隐藏]

🎐 卷首语
- 应该是全网最好的 Skills 中文指南与教程,全文 1.2w 字,包含了我对 Skills 的完整应用思考。
- 巧借通用 Agent 内核,只靠 Skills 设计,就能低成本创造具有通用 AI 智能上限的垂直 Agent 应用。
- 顺便给朋友宇森、付铖的 Mulerun 打个广,他们在做全球性的 Agent 开发与交易市场,即将支持 Creator 用 Skills 开发垂直 Agent,可被用户使用 or 被其他 AI 产品调用。
@ 一泽Eze
一个好 Skill 能发挥的智能效果,甚至能轻松等同、超越完整的 AI 产品。任何不懂技术的人,都能开发属于自己的 Skills。
比如我自己做的 Article-Copilot,一个 skill 就实现了从素材处理到正文写作的 Agent 应用;

又如 AI Partner Skill,让通用 Agent 深度学习你的记忆,塑造懂你的 AI 伴侣,给到个性回应。

在研读 Anthropic 官方技术博客,与持续 Agent Skill 实验之后,形成了这份全网最完整的 Skill 指南,包含:

- 1.最容易读懂的 Skills 概念与原理介绍
- 2.讨论 Skills 的真实价值、技术优势、对 AI 产品设计的影响
- 3.非常完整的 Skills 使用与开发教程
- 4.Skills 的场景识别,什么时候适合开发、使用 Skills?
从概念澄清、运作机制,到实践教程、应用价值,与你在本期分享。
文末会拉一个 Skill 中文社群,专项讨论与实践 Agent Skills,加入方式见底部。
首先,如何理解 Skill?
Anthropic 说:
Skills 是模块化的能力,扩展了 Agent 的功能。每个Skill 都打包了 LLM 指令、元数据、可选资源(脚本、模板等),Agent 会在需要时自动使用他们。

我有个更直观的解释:Skill 就像给 Agent 准备的工作交接 SOP 大礼包:
想象你要把一项工作交给新同事。若不准口口相传,只靠文档交接(而且你想一次性交接完成,以后不被打扰),
你会准备什么?
- 任务的执行 SOP 与必要背景知识(这件事大致怎么做)
- 工具的使用说明(用什么软件、怎么操作)
- 要用到的模板、素材(历史案例、格式规范)
- 可能遇到的问题、规范、解决方案(细节指引补充)
⬇️
Skill 的设计架构,几乎是交接大礼包的数字版本:

相对标准的 Skill 结构示例,实际案例中,只有 SKILL.md 是必需的,其他结构为可选项
在 Skill 中,指令文档用于灵活指导,代码用于可靠性调用,资源用于事实查找与参考。
当 Agent 运行某个 Skill 时,就会:
- 1.以 SKILL.md 为第一指引
- 2.结合任务情况,判断何时需要调用代码脚本(scripts)、翻阅参考文档(ref.)、使用素材资源(assets)
- 3.通过“规划-执行-观察”的交错式反馈循环,完成任务目标
当然,Skill 也可以用来扩展 Agent 的工具、MCP 使用边界,通过文档与脚本,也可以教会 Agent 连接并使用特定的外部工具、MCP 服务。
举个例子,这是 PPTX Skill 的文件目录:

- 整个文件夹就是一个完整的能力包,用来支持 AI 创建、编辑和分析 PowerPoint 演示文稿。
- 核心文件是 SKILL.md,包含技能的元数据和任务指导,告诉 agent 什么时候使用这个技能、如何按步骤处理任务。
特别的,独立子技能往往会被拆为子文档(如教 AI 把 html 导出为 pptx 流程的 html2pptx.md),以避免一次性加载过长的 skill 文档,节省上下文窗口
- Scripts/ 包含 Agent 可用的各类预先写好的程序脚本,比如 html 转 pptx 的一键程序脚本。这样 Agent 运行任务时就无需临时开发工具,直接调用,节省 tokens ,避免出错,提升速度
- 也有一些参考文档(此项目打包的不算规范,但根据 SKILL.md ,Agent 也能理解哪些文档可以参考),比如 ooxml.md,是对 ooxml 格式文件的解析指南
整个 Skill 以简明的形式,把技能指引文档、代码脚本、参考文档和可用资源组合,定向扩展了 Agent 完成 pptx 生成相关的工作能力。
前者通过 user query 直接指定调用;后者根据任务与元信息描述的相关性,LLM 自动匹配。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
评论已关闭...


这个思路挺实用的。
我前几天也尝试写Skill,卡了一半才搞定。
Skill文档太碎,找起来真麻烦。
听说Mulerun要搞Skill市场,感觉要炸了🔥