如何让你的Agent更快,支持更多上下文?Anthropic发布Skills:专为AI Agent系统打造的专业领域工具规范,MCP强大的补充,更低的门槛和资源消耗

随着大模型能力的越发强大,通用Agent系统已经开始在不同的领域进入生产环境。但是,通用Agent依然缺乏专业领域的经验、知识和工具。为此,Anthropic发布了 Claude Skills(以下简称“Skills”),这是一个旨在提升 Claude AI 在特定工作流程中表现的新功能。它允许用户通过自定义“技能”文件夹来扩展 Claude 的能力,使其更好地处理专业任务,如处理 Excel 表格、生成 PowerPoint 演示文稿或遵循公司品牌指南。


这个特性特别针对 AI 代理(agents),旨在将通用 AI 转化为领域专家,帮助用户自动化复杂工作。Skills 的核心理念是“可组合、可移植、高效”,它不是简单地增加提示词,而是通过结构化的资源包来注入程序性知识,从而让 Claude 在真实世界场景中更可靠。

[TOC]

Claude Skills的设计和技术实现

Skills 的实现核心是将专业的指令、脚本、资源等Agent需要的东西打包进特定的文件夹,基于文件夹结构和动态加载机制,结合Anthropic的工具生态(如代码执行工具),完成Skill的整合和引入。

Claude SKILL.md文件样例

简单来说,Skills就是把一整套“做事的方法”(说明文档+脚本+模板)装进一个带 SKILL.md 的文件夹,先把名字和用途放进系统提示,命中场景再按需读取正文与资源。

需要动手时就在受限的本地沙箱里执行脚本,只把结果塞回上下文——既省 token,又让流程可复用、可审计、可稳定复现。

整个过程可以分为创建、集成和执行三个层面。

1. Skills 的创建

在使用Skills之前我们需要创建Skills的文件夹目录,定义其元数据。

每个Skill是一个目录,核心文件是 SKILL.md以及相关的资源文件和结构。Skill的目录和文件结构如下:

  • SKILL.md的元数据(YAML格式):SKILL.md以 YAML 前置元数据开头(元数据部分),包括 name(技能名称)和 description(描述,用于快速评估相关性)。集成到提示词中。
  • SKILL.md的body(Markdown格式):SKILL.md其余部分(body)包含详细指令、参考文档(如 reference.md 用于通用指导,当Skill被触发之后会加载。
  • 绑定的文件(脚本、文本、数据、资源等):剩余的文件如forms.md 用于特定场景,以及可执行脚本(如 Python 代码,用于处理 PDF 表单提取)。这部分的数据大模型可以根据情况加载。

根据官方的建议,SKILL.md的元数据部分是总是加载到系统提示词中,建议100个tokens左右。SKILL.md的body部分是触发了才会加载到提示词中,不要超过5K。

2. 集成与动态加载

创建好的SKILL.md就可以使用了。Claude 在启动时仅预加载所有Skill的元数据到系统提示中,用于初始相关性评估。 当用户任务触发(如提到“填充 PDF”),Claude 使用工具(如 Bash)读取完整 SKILL.md,并动态加载相关文件或执行代码。只有必要部分被注入上下文窗口,这保持了速度和成本控制。

Skills 是可组合的——Claude 可以自动协调多个技能(如 Excel + PowerPoint),无需手动选择,并在思考链(chain of thought)中显示激活的技能。

3. 执行机制

Claude 扫描可用技能,匹配任务语义后加载最小化资源。例如,在生成 Word 文档时,它会执行脚本创建文件,而非纯文本生成。 这利用了文件系统工具和代码执行,确保输出可靠且可重复。

Skill的互相引用

总体上,Skills 的技术栈强调模块化和按需加载,解决了传统提示工程的局限(如上下文溢出),并通过可执行代码注入“程序性知识”。

Claude Skills 与 Model Context Protocol (MCP) 的对比

2024年11月底,Anthropic还发布了MCP用于大模型的工具调用(参考此前我们DataLearnerAI的博客:AI Agent进展再进一步!Anthropic发布大模型上下文连接访问协议MCP:让任何资源快速变成大模型的工具,突破大模型的能力边界!)。

Skills和MCP的目标都是在增强AI Agent能力,但它们在设计理念、实现方式和应用场景上存在显著差异。Skills可以被理解为MCP的互补工具,能在 MCP基础上处理更复杂的代理工作流。

我们可以用一个表格总结:

对比内容 Claude Skills Model Context Protocol (MCP)
核心机制 文件夹结构(例如 SKILL.md + 脚本/资源),动态加载元数据和子文件到上下文窗口。支持渐进式披露,避免令牌溢出。 开放协议,通过 MCP 服务器连接外部数据源(如文档、API),Claude 查询并注入内容到提示中。支持基于内容的工具集成。
加载方式 启动时预加载元数据,任务触发时使用工具(如 Bash/Code Execution)读取完整资源。只加载必要部分,支持可组合技能。 通过 API 或 Desktop app 连接 MCP 服务器,大模型发送查询请求,服务器返回上下文。支持实时同步,但依赖网络。
工具依赖 依赖 Code Execution Tool(beta),执行Python等脚本,实现确定性操作(如 PDF 处理)。 无需特定执行工具,但需构建 MCP 连接器(例如 Microsoft 365 连接器),聚焦数据检索而非代码执行
开发门槛 低门槛:使用 skill-creator 工具生成文件夹,支持 GitHub 共享。适用于个人/团队自定义。 中等门槛:开发者需实现 MCP 服务器和连接器,适合企业级集成。Anthropic 提供预制连接器。
安全性 强调审计脚本和来源,避免代码执行风险。 通过协议认证控制访问,防范数据泄露,但依赖服务器安全。

Skills和MCP都是推动AI Agent向实用化转型,但 Skills更注重效率提升和代码执行,MCP更侧重生态扩展。Skills 被一些开发者视为“比 MCP 更大的进步”,因为它直接降低了自定义成本。

总体上,Skills 更像“即插即用”的本地插件,优化了 LLM 的内部提示工程;MCP 则像“外部适配器”,扩展了大模型的生态边界。Skills 可以构建在 MCP 上,例如在 MCP 检索数据后,使用 Skills 脚本处理。

Claude Skills 的价值和问题分析

Skills的发布对AI Agent生态和企业应用产生了显著影响,既提升了实用性,也引发了新的挑战。

首先,Skills可以让大模型用更低的资源、更少的成本来扩展大模型的能力,主要包括:

  • 性能提升:使AI Agent更快、更便宜、更一致。例如,使用代码脚本处理任务比纯 LLM 生成节省令牌(成本降低),并提高准确性(如 PDF 表单填充的确定性)。这将通用代理转化为“领域专家”,适用于工作场景如数据分析或文档自动化。
  • 工作流优化:支持跨产品移植(Claude 应用、API、Claude Code),允许“一次构建,到处使用”。对于团队,企业用户可通过管理员启用组织级技能分发,提升协作效率。如果更多大模型优化这方面能力,那么它的价值更大。
  • 生态扩展:鼓励开发者构建和共享技能,推动 Skills 市场增长。未来计划包括简化创建工具、代理自主开发技能,以及企业级部署,进一步降低门槛。这可能重塑 AI 代理市场,使其更接近“即插即用”的工作助手。

然而,Skills也带来了一些问题,主要是安全方面。运行大模型执行代码可能引入漏洞,如果Skills来自不可信来源,可能导致数据泄露或恶意行为。用户需谨慎审核。

Skills总结

Claude Skills 代表 Anthropic 向实用 AI Agent迈出的重要一步,通过技术创新显著提升了效率和适应性。与 MCP 的对比突显了 Anthropic 的战略深度:Skills 提供内部增强,MCP 开启外部扩展。

Agent系统的设计单靠模型还是不够,生态、工程同样重要。

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码