Skills 真相：它在大模型中到底是怎么实现的？

为什么 Skills 突然火了

这段时间大家都在聊 Skills，但很多讨论停留在“怎么写 SKILL.md”。从工程视角看，更关键的问题是：Skills 在大模型里到底如何被执行。搞清这个问题，才能判断一个方案是“能上线”，还是“看起来很酷”。

无论是 Claude Code、Cursor 还是其他 IDE Agent，核心都绕不开工具调用。模型不直接执行系统操作，真实执行发生在宿主侧。

一句话：模型负责“决策与编排”，宿主负责“落地执行”。

抓包后你会发现，Skills 常常只是 tools 列表里的一个可调用项（例如 Skill）。它的主要职责不是直接回答问题，而是把模型引导到正确的知识和动作入口：

这是一种“先索引、后加载、再执行”的机制，而不是一次性把全部知识塞进上下文。

这解释了为什么高质量 Skill 会显著提升结果：它给了模型“去哪找答案”的稳定路径。

只要流程依赖“模型自己判断下一步读什么/调什么”，就会有概率偏航，这和硬编码工作流不同。

Skill 不是越碎越好。层级过深、引用过多，模型更容易在多轮后偏离目标。实践里建议“浅层目录 + 关键文档直达”。

Skills 不是黑科技，而是大模型时代的“知识索引 + 工具编排”工程方法。真正决定质量的，是你对工具边界、上下文预算、失败回退和执行可观测性的系统设计，而不是文档写得多花哨。