我最近几次聊 Skills，有一个越来越明确的判断：

匠人在晨光中把经验织成可分发的发光包裹

最近连续几次和朋友聊 Skill，脑子里越来越清晰的只有一个结论：模型之外的下一波红利，属于 Skill。

朋友围坐露台，暮色天空中一颗星格外明亮

更具体地说，是三个判断：

第一，Agent 不会抹平人的能力差距，反而会放大差距。第二，Skill 是目前唯一能系统性弥合 Agent 能力差距的东西。第三，Skill 的本质不是提示词，而是"能力商品"，它会把人的经验、品味和流程变成可分发、可复用、可迭代的商品。

如果你也在做 Agent、做 Skill 或者做 AI 产品，下面这些判断值得花十分钟读完。

一、Agent 不会抹平差距，反而在放大差距

大众对 Agent 的理解，至今还停留在"聊天框"：你输入一句话，它回一段文字；你再输入一句，它继续回。这个视角下，AI 好像天然会平权——不会写代码的能写代码，不会做 PPT 的能做 PPT，不会剪视频的能剪视频。

只要模型够强，所有人的能力差距就会被抹平。

这个判断我以前也信，现在越来越不信。

真正的 Agent 是一套系统：文档、规则、Memory、Loop、MCP、CLI、工具调用、权限、沙箱、上下文工程、定时任务、心跳、文件系统、代码执行和 Skill。头部用户已经在搭这套系统，普通用户还在问"这个聊天框为什么回答得不准"。

Agent：能理解目标、规划步骤、调用工具并持续执行任务的 AI 系统，不只是聊天机器人。

Memory：Agent 用来保存长期偏好、项目状态和历史决策的外部记忆，不等同于模型的训练记忆。

Loop：Agent 反复"思考—调工具—观察结果—再决定下一步"的执行循环。

这就造成了一个很大的认知割裂：头部用户在搭系统，普通用户在用聊天框。目标清晰、上下文好、品味和判断强的人，会被 Agent 放大；目标混乱、没有文档、没有判断的人，也会被 Agent 同步放大混乱。

用户会出现 K 型分化。去年还能靠产品设计、交互设计和用户教育把门槛压一压，今年我判断已经很难靠单纯的 UX 弥合。

二、Skill 是目前唯一能系统性弥合 Agent 能力差距的东西

既然普通用户短时间内搭不起 Agent 系统，那就不能让他们从零搭。正确做法是把头部用户已经验证过的工作流，打包成他们"看得懂、点一下就能用"的东西。

这个东西就是 Skill。

我对 Skill 的一句话定义是：

Skill 是把专家经验、工作流、品味和工具调用封装成可分发、可复用、可迭代的 Agent 能力单元。

注意几个关键词：专家经验、工作流、品味、工具调用。它不是一段话，不是 README，也不是传统意义上的 App。它更像 Agent 时代的"能力商品"。

用户不需要懂 MCP、CLI、workflow、Memory、Loop、模型选择、代码执行和上下文工程，只需要关心四件事：这个 Skill 解决什么问题、产出什么结果、怎么用、别人用得怎么样。

提示词本身很难成为产品：容易被复制、难以分发、没有版本管理、也缺少安装和调用语义。Skill 把提示词、规则、示例、工具调用、文件结构、脚本、依赖和使用说明打包起来，让它变成一个可以安装、调用、迭代和传播的能力包。

所以 Skill 和 Prompt 本质上不是对立关系，但 Skill 的调用效率更高，分发和理解成本更低，也能承载更多工程化内容。

更重要的是，很多任务不是一句提示词能解决的，而是一组稳定流程：读取材料、分析需求、选择模板、调用工具、生成产物、验证结果、修复问题、导出文件。Skill 把这套流程从一次性对话里抽出来，变成可以反复调用的工作流。

三、Skill 的核心价值，是把人的经验外化

判断一个 Skill 值不值得做，就看一件事：它有没有把人的经验外化。

PPT Skill 是最好的例子。它的流程不是"生成 PPT"这么简单：要读取文章或大纲、询问主题页数和配图、选择主题颜色和版式、生成 HTML PPT、自动后验检查常见问题、修正缺属性、未居中、溢出、图片裁切、节奏重复等问题，必要时调用图像模型生成配图，最后输出可演示、可分享的文件。

这套流程背后真正有价值的，是人的演示经验被外化了。

我做设计类 Skill 最深的体会是：真正有壁垒的部分是审美、版式判断、设计系统经验、模板选择、图片裁切规则、明暗遮罩规则、字体和颜色规则被固化进 Skill。这要求创作者同时懂三件事——传统专业知识、AI 的上下限、产品化思维。

传统专业知识决定你知道什么结果算好（设计、剪辑、写作、健身、法律、商业化投放，每个行业都有大量隐性判断）；AI 的上下限决定你知道模型什么能做、什么做不稳、什么必须工程化兜底；产品化思维决定你知道用户场景、使用门槛、反馈路径和稳定性要求。

案例一：PPT Skill，从一场分享沉淀出来

PPT Skill 最初不是"为了做一个 Skill"，是因为我真的要做一场分享。第一版成型后，我通过五六轮对话调整间距、字号、字体、颜色、配图、重复内容和 WebGL 背景。讲完之后发现大家最关心的不是分享本身，而是 PPT 怎么做，于是才把这套模板和流程沉淀成 Skill。

这是典型的"副产品变主产品"。

案例二：社交媒体卡片 Skill，从内容分发需求倒推出来

它来自非常具体的内容分发需求：3:4 竖版图文卡片，要适配小红书、公众号、Twitter 等不同场景。要处理 11 类内容、两套视觉系统、28 个版式骨架、真实图片加 Coding 排版，还要规避 AI 图限流、文字不锐利、平台风格不匹配等问题。

PPT 是演示，社交媒体卡片是分发。两者底层方法论一致，但目标场景完全不同。

案例三：Logo Generator Skill，拆层处理

它没有直接让图像模型一把梭生成 Logo，因为图片模型的文字、结构和可编辑性不稳定。它选择先生成 SVG Logo 变体，再生成展示图和 WebGL 背景，把 Logo 本体、展示场景和交互背景拆成不同层，分别用最适合的技术处理。

案例四：AI Desk Card，把 Skill 推到物理环境

它让 Agent 接管屏幕边缘的物理信息位：固件烧录、Wi-Fi 配置、信息推送、定时任务、Memory、Todo、日历、GitHub 展示、墨水屏刷新，全部封装成一套 Skill。

Agent 像指挥家统御墙上一排小型信息面板

这四个案例指向同一个结论：Skill 的核心，是"人把什么经验变成了可调用的能力"。

四、好 Skill 的架构：中心短，辐射厚

很多人以为 Skill 就是一个 SKILL.md 文件，这只对了一半。

SKILL.md：很多 Skill 的入口说明文件，告诉 Agent 什么时候加载、按什么流程执行、哪些坑不能踩。

好的 Skill 往往是一个目录。SKILL.md 只是入口，旁边还会有 scripts/、references/、assets/、模板、schema、配置文件、子 Skill 和特殊案例。复杂 Skill 不怕有复杂内容，怕的是把复杂内容一次性塞给模型。文件系统本身就是一种上下文工程。

上下文窗口：AI 一次能"看见"和处理的信息范围，文档、代码、聊天记录和工具说明都会占用它。

好 Skill 的信息架构应该是"中心短，辐射厚"：

SKILL.md 只放高信号流程和判断；
references/ 放重文档和领域材料，按条件读取；
scripts/ 放确定性逻辑，让 Agent 调用而不是重写；
assets/ 放模板、schema、示例、字体、主题和版式骨架；
配置文件或稳定数据目录放首次配置、偏好和历史记录。

这里有一个很关键的点：Skill 的 description 不是宣传语，而是路由触发器。好的 description 应该描述用户什么时候需要它，最好来自真实用户表达；坏的 description 只是解释"这个 Skill 做什么"。

比如一个 PPT Skill，不应该写"这个 Skill 可以生成漂亮 PPT"，而应该写"当用户需要把文章、大纲或演讲内容转成可演示 HTML PPT 时加载"。前者是广告，后者是 Agent 的判断条件。

这能解释为什么"把所有能力塞进一个大 Agent"不是好方向。大而全的 Harness 会把工具定义、协议细节和长文档塞满上下文，带来更高延迟、更高 token 成本和更多误用。

更稳的架构是 Thin Harness, Fat Skills：

Harness 保持薄，负责跑模型循环、读写文件、管理上下文、执行权限和安全边界；
Skill 变厚，承载流程、判断、领域知识、模板、脚本、资产、gotchas 和 eval；
确定性工具下沉给 CLI、scripts 或 API；
模型留在理解、判断、综合、取舍和表达这些更适合它的部分。

Harness：运行 Agent 的外层程序，负责模型循环、文件读写、上下文管理和安全边界。

Thin Harness, Fat Skills：让 Agent 底层运行环境保持轻，把具体流程、领域知识、模板、脚本和失败经验放进按需加载的 Skill 里。

五、Skill 质量要像代码质量一样维护

好 Skill 不是一次写完的，它需要维护，而且要像代码质量一样维护。

一个比较可靠的生命周期是这样的：

先用无 Skill 的 Agent 跑真实任务，找到它会错在哪里；
基于真实 query 写 eval，包括正例、反例和 forbidden load；
先调 description，确保该加载时加载、不该加载时不加载；
写主体时删除显而易见的内容，只保留会改变模型行为的判断；
把失败案例追加到 gotchas，而不是不断加长主流程；改 description 或路由边界时补 eval；
再做跨模型测试，看不同编排模型对 Skill 触发和执行的差异。

Eval：用一组真实或模拟任务测试 Skill 是否按预期触发、执行和交付结果。

Gotchas：从真实失败里总结出的"别这么做"清单，往往比正向说明更能提升 Skill 稳定性。

这里有一条很重要的原则：每个 Skill 都是一种税。它进入索引后，每个会话、每个用户都在为它的 name 和 description 付上下文成本；它被加载后，后续对话都在为主体内容付成本。

所以每一句都要问一句：没有这句，Agent 会不会做错？如果不会，就删。

gotchas 是最高价值内容，因为它们来自真实失败。正向原则往往模型已经知道，负面边界才是专家经验。"不要纯白纯黑""连续三页相同节奏是 P0 错误""文字不能压脸""AI 图只在无合适真实图时使用"，都属于 gotchas 或强约束。

这也解释了为什么完全自动生成 Skill 只能做初稿。模型可以帮你起草结构，但它无法凭空拥有你的失败样本、审美判断、行业边界和用户反馈。真正有价值的是人把经验注入进去，再通过 eval 和 gotchas 让它持续变厚。

六、设计 Skill 的本质：把品味变成约束

设计类 Skill 解决的从来不是"AI 会画图"这种假问题，它真正要解决的是：模型不稳定、图像限流、文字不锐利、排版不可控、风格一致性难判断。

我越来越觉得，设计 Skill 的核心是把专业品味变成模型可执行的约束。

模型默认会收敛到一些平庸模式：Tailwind 大色块、紫色渐变、emoji 堆砌、Inter 字体、发光、过度圆角、无意义动效、信息密度失控。这不是模型没有审美素材，而是没有稳定的取舍原则。

所以设计 Skill 里最有价值的，是主观但明确的约束：

不使用纯白和纯黑，降低刺眼和廉价感；
不让用户任意输入 hex，只提供经过验证的主题色板；
不用紫色多彩渐变、发光和大面积 blur 作为主视觉捷径；
动画只在必要时使用，且只动 transform 和 opacity；
图文卡片优先真实摄影和截图美化，AI 生图只是兜底；
版式骨架先被人工验证，AI 负责填充、组合和微调；
文字必须根据图像主体、明度和可读区域自适应落点、字色、遮罩和断行。

这些规则看起来限制自由，实际是在保护输出下限。设计类 Skill 的质量来自"替用户排除绝大多数会变丑的选项"。

PPT Skill 和社交媒体卡片 Skill 的共同方法，是把 AI 的任务从"自由设计"降级成"在高质量骨架里填充"：

PPT Skill 里，10 种页面布局、5 套主题色、字体三级分工、7:5 / 6:6 / 8:4 网格、hero 与 non-hero 的节奏交替，构成了一个稳定的演示系统。AI 不需要从零发明版式，只需要根据内容选择合适页面类型并填进去。
社交媒体卡片 Skill 进一步把场景校准到手机信息流：3:4 是主战场，1 秒决定停不停下。它不是把 PPT 截图成竖图，而是重新定义了图文品类、版式比例、断行规则和素材优先级。11 个内容品类、两套视觉系统、28 个版式骨架、截图美化、地图组件、真实图库和克制 AI 生图，共同构成了"内容平台视觉 Skill"。

设计师工位上，横向 PPT 布局与竖版信息流卡形成对比

Logo Generator Skill 也是同一逻辑：不直接让图像模型一把梭生成 Logo（因为图片模型的文字、结构和可编辑性不稳定），而是先生成 SVG 变体，再做展示图和 WebGL 背景，把 Logo 本体、展示场景、交互背景拆成不同层，分别用最适合的技术处理。

所以设计 Skill 的通用公式是：人工沉淀审美系统，模型理解内容和语义，代码负责稳定排版和导出，图像模型只处理适合它的视觉部分。这比单纯"让 AI 画一张图"更慢一点，但可控、可改、可复用，也更适合内容创作者长期使用。

七、用户不关心概念，只关心结果

对普通用户来说，Skill、MCP、CLI、Plugin 叫什么根本不重要。他们关心的是：这个功能能解决什么问题、适合什么场景、点一下能不能用、需要输入什么材料、结果长什么样、别人用得怎么样。

MCP：Model Context Protocol，可以理解为让 AI 以统一方式连接外部工具、数据源和服务的协议。

CLI：Command Line Interface，命令行工具；对 Agent 来说，它常常是比图形界面更稳定、更容易自动化的操作入口。

所以面向用户的产品层不应该堆术语。Codex 把很多东西统一叫插件，我觉得就是正确方向：弱化概念，强调功能。底层可以是 Skill、MCP、CLI 或原生 Plugin，用户只需要知道它能干什么。

但对产品和创作者来说，这些底层形态的区别又很重要：

Skill 适合承载相对垂直、可描述、可复用的工作，比如 PPT、社交媒体卡片、文章配图、写作润色、视频包装、简历优化、数据可视化、某个行业 SOP。
MCP 更适合 Agent 架构中的原子服务和上下文连接，比如地图、浏览器、网盘、设计稿、数据库、企业 API。
CLI 则是目前很现实的通用 Plugin 形态：命令行、代码、Skill 都可以封装进去，也不绑定单一 Agent 平台。

飞书 CLI 就是一个很好的例子。用户不用理解 200 多条命令，也不用知道背后是哪个 API。他只需要说"帮我把今天的智能纪要拉到笔记里"，Agent 背后可以搜索云文档、读取妙记、下载逐句转写、写入本地 Markdown、建立反向链接。

用户看到的是结果，Agent 用的是工具，Skill 封装的是流程。这也是 Skill、CLI 和 MCP 的关系不能只从技术概念上理解的原因。它们最终都要回答一个问题：怎么让普通用户用上头部用户已经验证过的能力。

八、Skill 生态不能做成仓库列表

如果一个 Skill 能被图文、案例、评价、使用数据、作者、应用场景反向链接起来，它就不只是一个工具，而是一个社区节点。

反向链接：从使用案例、文章、图文或项目页面反过来链接到某个 Skill，让人能看到它被谁用、怎么用、效果如何。

当前很多 Skill 展示的问题是：列表很长，像 GitHub 仓库名；图标都一样；没有结果展示；没有评价指标；多模态 Skill 也只用文本展示；用户不知道哪个适合自己。

推荐 10 个或 20 个精选 Skill，并讲清楚怎么用，远好过给用户几千个列表。每个 Skill 都应该像一个软件功能页：它解决什么问题、适合什么场景、需要输入什么、输出长什么样、典型提示词是什么、生成结果截图或视频、谁用过怎么评价、有哪些常见失败情况、如何安装和修改。

这本质上需要强运营，不是把名字列出来，而是一个一个挑、一个一个写介绍、展示结果，最好还有视频讲解。

至于分发渠道：

GitHub 是代码型 Skill 的天然托管地。Skill 往往包含代码，需要版本管理；GitHub 有生态位、版权声明和分发基础；AI 也熟悉 Git 和 GitHub 操作；开源还能覆盖所有 Agent 平台，不绑定单一产品。
小红书 适合做视觉内容和使用案例分发，优势是内容感知、视觉展示、用户审美和评论体系。PPT Skill 和社交媒体卡片 Skill 都已经在小红书之外的人群中传播，比如咖啡馆主理人、数码测评、活动策划、餐厅、三线城市分享场景。这说明 Skill 能跨出 AI 圈。
应用商店式 Skill 分发 也有潜力：更精准推荐、更低使用门槛、可能给创作者分成。

但对创作者来说，如果只在一个平台上架，就等于押注这个平台能做好产品、生态、分发和市场占领。更稳的策略可能是：GitHub 做基础分发和跨平台覆盖，平台 Skillhub / 应用商店做体验优化、运营推荐和商业转化。未来的 Skill 平台，本质上会同时是 App Store、GitHub、社区种草页、评价系统和 Agent 工具层。

九、普通用户真正卡在哪里

AI 圈外的人并非不能用 Skill。实际观察中，咖啡馆主理人、数码测评、活动策划、健身教练等都能用出好结果。真正卡点是交互心智。

很多人仍然用传统软件思维，以为一次生成就该完成：不习惯通过 chat 连续调整；不知道可以要求 AI 改颜色、改字、修溢出、换图；不知道如何提供上下文和素材；也不知道如何从自己的工作流中抽 Skill。

因此，Skill 产品不仅要提供安装，还要提供使用教育。

行业 Skill 会是一个很重要的方向。很多行业有非常好的经验和客户洞察：健身、法律、餐饮、活动策划、教育、商业化投放等。但行业专家不一定知道如何做 Skill，也担心分享后被盗。

这里的关键不是把 Skill 作为服务添加项。健身教练可以用 Agent 维护会员饮食、训练、有氧、提醒和反馈，提高客户粘性和服务效率；法律从业者可以把琐碎文本处理、条文审查、格式检查做成辅助 Skill，但核心判断仍由人完成；餐饮和活动行业可以用图文 Skill 把真实图片和故事包装成可传播内容。AI 不能替代线下履约，但可以提高获客、沟通、维护和复用效率。

这类行业用户只需要基础启蒙：带他做一次需求分析，落地成一个 Skill，他就知道边界在哪里。每个行业都有先锋用户，有创造力、有好奇心、想用 AI 获得竞争优势。先服务这些人。

导师在书房带一位行业先锋走完第一次 Skill 旅程

十、内容 Skill：文章、产品和案例互相喂养

从我已有的文章看，我正在形成一条很清晰的内容 Skill 路线：不是为某个抽象 AI 概念写文章，是先做出一个能用的 Skill，再把制作过程、设计判断和使用场景写成传播内容。

这类内容有几个特点：

PPT Skill 最初来自一次 AI 和组织分享，观众问得最多的是 PPT 怎么做，于是从一次交付沉淀成开源 Skill。这是副产品变主产品。
文章本身像说明书，但不是 README。它要讲清楚为什么这样设计、适合谁、边界在哪、真实效果如何，降低用户理解门槛。
产品演示本身就是内容资产。PPT 截图、图文卡片、Logo 展示图、Desk Card 场景图，都可以成为传播素材。
Skill 反过来也提升写作效率。社交卡片 Skill 可以把文章段落直接转成更适合小红书、公众号或 Twitter 的视觉卡片。

每篇文章都在扩展 Skill 的语义边界：PPT 是演示、Social Card 是内容分发、Logo 是项目品牌资产、Desk Card 是硬件和环境 UI、夜巡录则指向游戏 demo 工作流。这说明 Skill 不只是"工具产品"，也是内容创作者的表达基础设施。

过去文章和产品是分开的：先做产品，再写推广。现在 Skill、文章、案例、开源仓库、社交反馈会互相喂养。一个成熟路径可能是：用 Agent 完成一次真实任务，把过程沉淀成 Skill，用 Skill 产出的可视化结果写文章，文章带来用户和反馈，反馈补成 gotchas、模板和下一版 Skill，新版 Skill 再产生下一轮内容。

这就是个人产品在 Agent 时代的复利飞轮。

十一、Skill 的边界会继续扩大

过去"插件"通常意味着软件里的一个按钮。现在 Skill 的边界可以明显更大。

浏览器 Skill 会是消费者入口。Tabbit Browser 一类产品说明，Skill 可以进入浏览器场景，变成普通用户在网页、资料、脚本和自动化之间的入口。浏览器是大众最熟悉的工作环境，如果 Skill 能以"现成脚本 / 使用案例 / 一键执行"的方式出现，会比裸露 CLI 或 GitHub 仓库更容易被理解。

硬件 Skill 说明 AI 可以接管环境 UI。AI Desk Card 的价值在于它把 Agent 的能力延伸到了物理环境：安装固件、配置 Wi-Fi、写 cron、读取 Memory、选择 widget、刷新墨水屏，全流程由 AI 引导。用户不再面对 App 设置页，AI 本身就是设置页。

游戏 Skill 代表更长链路的创作流程。夜巡录开发手记里提到的"独立游戏 demo Skill"，从玩法母题、原型、素材采集、绿幕抠图、contact sheet、视频生成、音乐、Electron 打包、GitHub Actions 到 Release，封装的是一套跨程序员、美术、动画、作曲和运维的生产流水线。它的价值是把"做个原型"和"独立交付完整作品"之间的墙变薄。

这些案例指向同一个判断：Skill 的未来不会局限在聊天框里，它会扩展到浏览器、桌面、本地文件、硬件、内容平台、游戏引擎和真实工作环境。

十二、Skill 与 Gene：手写经验和自动进化的边界

还有一个值得保留但需要谨慎使用的对比：Agent Skill 与 GEP Gene。

Skill 更像人类预先沉淀的能力包：有明确创建者、明确边界、明确流程和版本。Gene / Capsule 这类概念强调运行中从成功经验里自动长出能力：带成功率、变异历史、适用上下文和自动修复机制。

Gene / Capsule：从 Agent 反复执行中的成功路径里沉淀出的可复用经验单元，强调自动演化而不是人工手写。

这两者不是简单替代关系，是不同的层级：

Skill 适合承载人的专家经验、审美、行业 SOP、工具不变式和明确交付标准；
Gene 适合从重复执行中捕捉成功路径，把临时试错变成可复用经验；
Capsule 类似把多个 Gene 组合成更长工作流。

从当前产品现实看，Skill 仍是更可落地的单位，因为它能被写、被审、被发布、被解释、被传播。但长期看，自动沉淀 Skill / Gene 化经验会成为方向：Agent 先用通用工具试错，成功后把路径写回 Skill 或生成新的子能力。

这也回应了"自动沉淀 Skill"的讨论。系统可以自动发现重复流程，但是否值得沉淀、如何命名、边界在哪里、哪些失败要写进 gotchas，仍然需要人的判断。真正理想的形态不是完全自动，也不是完全手写，而是人定义品味和边界，Agent 负责收集证据、提出改动、补充 eval 和维护长尾经验。

十三、盗用不是靠藏，防御方式是持续分发

Skill 很难靠闭源防盗。即便不开源，只要看到产出结果，试用几次，也可能被复刻。

所以防御方式不是"藏起来"，而是：开源覆盖更多平台、用影响力威慑过分盗用者、做自媒体让用户知道源头是谁、用持续迭代建立领先、用社区案例和评价体系形成品牌资产。

在产品壁垒降低的时代，个人产品如果没有渠道、资源和营销，就必须自己做宣发。以前自媒体是可选项，现在它是基础设施。

十四、平台真正该做什么

如果要做 Skill 平台，不能只押 Skill。用户下载独立端的理由，首先是 Agent 基础体验足够好：漂亮好用的客户端；多模型支持，尤其国产模型；文件、项目、Memory、CLI、MCP、Skill 管理；权限和安全沙箱；长程任务和状态延续；多设备流转，手机控制桌面，桌面反向控制手机；官方高质量插件开箱即用。

Workbody 的启发是，它没有做特别独特的东西，只是把该有的基础体验做齐了。很多国内产品连这一点还没做好。一些高频、必须、常见的能力应该内置并打磨好，不要让用户自己折腾安装。官方插件强，会形成壁垒。多设备、云端和本地互控，也会形成壁垒。

Skill 与本地环境强相关时，移动端需要遥控 PC。Skill 可跨端通用，但依赖本地文件、脚本、浏览器、CLI 的 Skill 在移动端很难直接跑。移动端适合轻量级从 0 到 1 创作，桌面端适合重任务和本地环境调用。

自动沉淀 Skill 是长期方向，但好 Skill 仍需要人。Dumate 等产品提出"自动沉淀 Skill"：从用户重复工作中自动总结流程。这个方向成立，但好 Skill 仍需要业务 SOP、品味、测试和迭代。自动生成可以做初版，真正能稳定交付的 Skill 需要打磨。

十五、一个完整的 Skill 生命周期

把前面的判断收束成一条路径，一个完整的 Skill 生命周期大概是这样的：

发现真实需求，从自己或行业用户的重复工作开始。
做一次高质量产物，不要先抽象，先用 Agent 解决真实任务。
抽象流程，识别可复用步骤、输入、输出、约束和工具。
工程化模板，把审美、版式、调用、验证和修复机制固化。
跨模型测试，好模型看上限，差模型保下限。
封装发布，GitHub 托管，配 README、示例和安装方式。
内容分发，用小红书、Twitter、公众号、视频展示结果。
收集反馈，从 issue、评论区、用户案例和平台数据里找真实问题。
筛选反馈，只吸收能提升泛化和稳定性的部分。

这条路看起来长，但本质很简单：每一次真实任务，都不只是在完成任务，而是在积累下一次能调用的能力资产。

结尾

Agent 时代最稀缺的，不是模型，而是可复用的能力组织方式。

Skill 之所以重要，是因为它第一次让人的经验、工作流和品味，有机会变成一种可以分发、调用、评价和持续迭代的商品。

黄昏集市中，经验、流程与品味被打包成可贩售的能力商品

这可能才是 Agent 生态里真正的大机会。