
最近连续几次和朋友聊 Skill,脑子里越来越清晰的只有一个结论:模型之外的下一波红利,属于 Skill。

更具体地说,是三个判断:
第一,Agent 不会抹平人的能力差距,反而会放大差距。 第二,Skill 是目前唯一能系统性弥合 Agent 能力差距的东西。 第三,Skill 的本质不是提示词,而是"能力商品",它会把人的经验、品味和流程变成可分发、可复用、可迭代的商品。
如果你也在做 Agent、做 Skill 或者做 AI 产品,下面这些判断值得花十分钟读完。
一、Agent 不会抹平差距,反而在放大差距
大众对 Agent 的理解,至今还停留在"聊天框":你输入一句话,它回一段文字;你再输入一句,它继续回。这个视角下,AI 好像天然会平权——不会写代码的能写代码,不会做 PPT 的能做 PPT,不会剪视频的能剪视频。
只要模型够强,所有人的能力差距就会被抹平。
这个判断我以前也信,现在越来越不信。
真正的 Agent 是一套系统:文档、规则、Memory、Loop、MCP、CLI、工具调用、权限、沙箱、上下文工程、定时任务、心跳、文件系统、代码执行和 Skill。头部用户已经在搭这套系统,普通用户还在问"这个聊天框为什么回答得不准"。
Agent:能理解目标、规划步骤、调用工具并持续执行任务的 AI 系统,不只是聊天机器人。
Memory:Agent 用来保存长期偏好、项目状态和历史决策的外部记忆,不等同于模型的训练记忆。
Loop:Agent 反复"思考—调工具—观察结果—再决定下一步"的执行循环。
这就造成了一个很大的认知割裂:头部用户在搭系统,普通用户在用聊天框。目标清晰、上下文好、品味和判断强的人,会被 Agent 放大;目标混乱、没有文档、没有判断的人,也会被 Agent 同步放大混乱。
用户会出现 K 型分化。去年还能靠产品设计、交互设计和用户教育把门槛压一压,今年我判断已经很难靠单纯的 UX 弥合。
二、Skill 是目前唯一能系统性弥合 Agent 能力差距的东西
既然普通用户短时间内搭不起 Agent 系统,那就不能让他们从零搭。正确做法是把头部用户已经验证过的工作流,打包成他们"看得懂、点一下就能用"的东西。
这个东西就是 Skill。
我对 Skill 的一句话定义是:
Skill 是把专家经验、工作流、品味和工具调用封装成可分发、可复用、可迭代的 Agent 能力单元。
注意几个关键词:专家经验、工作流、品味、工具调用。它不是一段话,不是 README,也不是传统意义上的 App。它更像 Agent 时代的"能力商品"。
用户不需要懂 MCP、CLI、workflow、Memory、Loop、模型选择、代码执行和上下文工程,只需要关心四件事:这个 Skill 解决什么问题、产出什么结果、怎么用、别人用得怎么样。
提示词本身很难成为产品:容易被复制、难以分发、没有版本管理、也缺少安装和调用语义。Skill 把提示词、规则、示例、工具调用、文件结构、脚本、依赖和使用说明打包起来,让它变成一个可以安装、调用、迭代和传播的能力包。
所以 Skill 和 Prompt 本质上不是对立关系,但 Skill 的调用效率更高,分发和理解成本更低,也能承载更多工程化内容。
更重要的是,很多任务不是一句提示词能解决的,而是一组稳定流程:读取材料、分析需求、选择模板、调用工具、生成产物、验证结果、修复问题、导出文件。Skill 把这套流程从一次性对话里抽出来,变成可以反复调用的工作流。
三、Skill 的核心价值,是把人的经验外化
判断一个 Skill 值不值得做,就看一件事:它有没有把人的经验外化。
PPT Skill 是最好的例子。它的流程不是"生成 PPT"这么简单:要读取文章或大纲、询问主题页数和配图、选择主题颜色和版式、生成 HTML PPT、自动后验检查常见问题、修正缺属性、未居中、溢出、图片裁切、节奏重复等问题,必要时调用图像模型生成配图,最后输出可演示、可分享的文件。
这套流程背后真正有价值的,是人的演示经验被外化了。
我做设计类 Skill 最深的体会是:真正有壁垒的部分是审美、版式判断、设计系统经验、模板选择、图片裁切规则、明暗遮罩规则、字体和颜色规则被固化进 Skill。这要求创作者同时懂三件事——传统专业知识、AI 的上下限、产品化思维。
传统专业知识决定你知道什么结果算好(设计、剪辑、写作、健身、法律、商业化投放,每个行业都有大量隐性判断);AI 的上下限决定你知道模型什么能做、什么做不稳、什么必须工程化兜底;产品化思维决定你知道用户场景、使用门槛、反馈路径和稳定性要求。
案例一:PPT Skill,从一场分享沉淀出来
PPT Skill 最初不是"为了做一个 Skill",是因为我真的要做一场分享。第一版成型后,我通过五六轮对话调整间距、字号、字体、颜色、配图、重复内容和 WebGL 背景。讲完之后发现大家最关心的不是分享本身,而是 PPT 怎么做,于是才把这套模板和流程沉淀成 Skill。
这是典型的"副产品变主产品"。
案例二:社交媒体卡片 Skill,从内容分发需求倒推出来
它来自非常具体的内容分发需求:3:4 竖版图文卡片,要适配小红书、公众号、Twitter 等不同场景。要处理 11 类内容、两套视觉系统、28 个版式骨架、真实图片加 Coding 排版,还要规避 AI 图限流、文字不锐利、平台风格不匹配等问题。
PPT 是演示,社交媒体卡片是分发。两者底层方法论一致,但目标场景完全不同。
案例三:Logo Generator Skill,拆层处理
它没有直接让图像模型一把梭生成 Logo,因为图片模型的文字、结构和可编辑性不稳定。它选择先生成 SVG Logo 变体,再生成展示图和 WebGL 背景,把 Logo 本体、展示场景和交互背景拆成不同层,分别用最适合的技术处理。
案例四:AI Desk Card,把 Skill 推到物理环境
它让 Agent 接管屏幕边缘的物理信息位:固件烧录、Wi-Fi 配置、信息推送、定时任务、Memory、Todo、日历、GitHub 展示、墨水屏刷新,全部封装成一套 Skill。

这四个案例指向同一个结论:Skill 的核心,是"人把什么经验变成了可调用的能力"。
四、好 Skill 的架构:中心短,辐射厚
很多人以为 Skill 就是一个 SKILL.md 文件,这只对了一半。
SKILL.md:很多 Skill 的入口说明文件,告诉 Agent 什么时候加载、按什么流程执行、哪些坑不能踩。
好的 Skill 往往是一个目录。SKILL.md 只是入口,旁边还会有 scripts/、references/、assets/、模板、schema、配置文件、子 Skill 和特殊案例。复杂 Skill 不怕有复杂内容,怕的是把复杂内容一次性塞给模型。文件系统本身就是一种上下文工程。
上下文窗口:AI 一次能"看见"和处理的信息范围,文档、代码、聊天记录和工具说明都会占用它。
好 Skill 的信息架构应该是"中心短,辐射厚":
SKILL.md只放高信号流程和判断;references/放重文档和领域材料,按条件读取;scripts/放确定性逻辑,让 Agent 调用而不是重写;assets/放模板、schema、示例、字体、主题和版式骨架;- 配置文件或稳定数据目录放首次配置、偏好和历史记录。
这里有一个很关键的点:Skill 的 description 不是宣传语,而是路由触发器。好的 description 应该描述用户什么时候需要它,最好来自真实用户表达;坏的 description 只是解释"这个 Skill 做什么"。
比如一个 PPT Skill,不应该写"这个 Skill 可以生成漂亮 PPT",而应该写"当用户需要把文章、大纲或演讲内容转成可演示 HTML PPT 时加载"。前者是广告,后者是 Agent 的判断条件。
这能解释为什么"把所有能力塞进一个大 Agent"不是好方向。大而全的 Harness 会把工具定义、协议细节和长文档塞满上下文,带来更高延迟、更高 token 成本和更多误用。
更稳的架构是 Thin Harness, Fat Skills:
- Harness 保持薄,负责跑模型循环、读写文件、管理上下文、执行权限和安全边界;
- Skill 变厚,承载流程、判断、领域知识、模板、脚本、资产、gotchas 和 eval;
- 确定性工具下沉给 CLI、scripts 或 API;
- 模型留在理解、判断、综合、取舍和表达这些更适合它的部分。
Harness:运行 Agent 的外层程序,负责模型循环、文件读写、上下文管理和安全边界。
Thin Harness, Fat Skills:让 Agent 底层运行环境保持轻,把具体流程、领域知识、模板、脚本和失败经验放进按需加载的 Skill 里。
五、Skill 质量要像代码质量一样维护
好 Skill 不是一次写完的,它需要维护,而且要像代码质量一样维护。
一个比较可靠的生命周期是这样的:
- 先用无 Skill 的 Agent 跑真实任务,找到它会错在哪里;
- 基于真实 query 写 eval,包括正例、反例和 forbidden load;
- 先调 description,确保该加载时加载、不该加载时不加载;
- 写主体时删除显而易见的内容,只保留会改变模型行为的判断;
- 把失败案例追加到 gotchas,而不是不断加长主流程;改 description 或路由边界时补 eval;
- 再做跨模型测试,看不同编排模型对 Skill 触发和执行的差异。
Eval:用一组真实或模拟任务测试 Skill 是否按预期触发、执行和交付结果。
Gotchas:从真实失败里总结出的"别这么做"清单,往往比正向说明更能提升 Skill 稳定性。
这里有一条很重要的原则:每个 Skill 都是一种税。它进入索引后,每个会话、每个用户都在为它的 name 和 description 付上下文成本;它被加载后,后续对话都在为主体内容付成本。
所以每一句都要问一句:没有这句,Agent 会不会做错?如果不会,就删。
gotchas 是最高价值内容,因为它们来自真实失败。正向原则往往模型已经知道,负面边界才是专家经验。"不要纯白纯黑""连续三页相同节奏是 P0 错误""文字不能压脸""AI 图只在无合适真实图时使用",都属于 gotchas 或强约束。
这也解释了为什么完全自动生成 Skill 只能做初稿。模型可以帮你起草结构,但它无法凭空拥有你的失败样本、审美判断、行业边界和用户反馈。真正有价值的是人把经验注入进去,再通过 eval 和 gotchas 让它持续变厚。
六、设计 Skill 的本质:把品味变成约束
设计类 Skill 解决的从来不是"AI 会画图"这种假问题,它真正要解决的是:模型不稳定、图像限流、文字不锐利、排版不可控、风格一致性难判断。
我越来越觉得,设计 Skill 的核心是把专业品味变成模型可执行的约束。
模型默认会收敛到一些平庸模式:Tailwind 大色块、紫色渐变、emoji 堆砌、Inter 字体、发光、过度圆角、无意义动效、信息密度失控。这不是模型没有审美素材,而是没有稳定的取舍原则。
所以设计 Skill 里最有价值的,是主观但明确的约束:
- 不使用纯白和纯黑,降低刺眼和廉价感;
- 不让用户任意输入 hex,只提供经过验证的主题色板;
- 不用紫色多彩渐变、发光和大面积 blur 作为主视觉捷径;
- 动画只在必要时使用,且只动 transform 和 opacity;
- 图文卡片优先真实摄影和截图美化,AI 生图只是兜底;
- 版式骨架先被人工验证,AI 负责填充、组合和微调;
- 文字必须根据图像主体、明度和可读区域自适应落点、字色、遮罩和断行。
这些规则看起来限制自由,实际是在保护输出下限。设计类 Skill 的质量来自"替用户排除绝大多数会变丑的选项"。
PPT Skill 和社交媒体卡片 Skill 的共同方法,是把 AI 的任务从"自由设计"降级成"在高质量骨架里填充":
- PPT Skill 里,10 种页面布局、5 套主题色、字体三级分工、7:5 / 6:6 / 8:4 网格、hero 与 non-hero 的节奏交替,构成了一个稳定的演示系统。AI 不需要从零发明版式,只需要根据内容选择合适页面类型并填进去。
- 社交媒体卡片 Skill 进一步把场景校准到手机信息流:3:4 是主战场,1 秒决定停不停下。它不是把 PPT 截图成竖图,而是重新定义了图文品类、版式比例、断行规则和素材优先级。11 个内容品类、两套视觉系统、28 个版式骨架、截图美化、地图组件、真实图库和克制 AI 生图,共同构成了"内容平台视觉 Skill"。

Logo Generator Skill 也是同一逻辑:不直接让图像模型一把梭生成 Logo(因为图片模型的文字、结构和可编辑性不稳定),而是先生成 SVG 变体,再做展示图和 WebGL 背景,把 Logo 本体、展示场景、交互背景拆成不同层,分别用最适合的技术处理。
所以设计 Skill 的通用公式是:人工沉淀审美系统,模型理解内容和语义,代码负责稳定排版和导出,图像模型只处理适合它的视觉部分。这比单纯"让 AI 画一张图"更慢一点,但可控、可改、可复用,也更适合内容创作者长期使用。
七、用户不关心概念,只关心结果
对普通用户来说,Skill、MCP、CLI、Plugin 叫什么根本不重要。他们关心的是:这个功能能解决什么问题、适合什么场景、点一下能不能用、需要输入什么材料、结果长什么样、别人用得怎么样。
MCP:Model Context Protocol,可以理解为让 AI 以统一方式连接外部工具、数据源和服务的协议。
CLI:Command Line Interface,命令行工具;对 Agent 来说,它常常是比图形界面更稳定、更容易自动化的操作入口。
所以面向用户的产品层不应该堆术语。Codex 把很多东西统一叫插件,我觉得就是正确方向:弱化概念,强调功能。底层可以是 Skill、MCP、CLI 或原生 Plugin,用户只需要知道它能干什么。
但对产品和创作者来说,这些底层形态的区别又很重要:
- Skill 适合承载相对垂直、可描述、可复用的工作,比如 PPT、社交媒体卡片、文章配图、写作润色、视频包装、简历优化、数据可视化、某个行业 SOP。
- MCP 更适合 Agent 架构中的原子服务和上下文连接,比如地图、浏览器、网盘、设计稿、数据库、企业 API。
- CLI 则是目前很现实的通用 Plugin 形态:命令行、代码、Skill 都可以封装进去,也不绑定单一 Agent 平台。
飞书 CLI 就是一个很好的例子。用户不用理解 200 多条命令,也不用知道背后是哪个 API。他只需要说"帮我把今天的智能纪要拉到笔记里",Agent 背后可以搜索云文档、读取妙记、下载逐句转写、写入本地 Markdown、建立反向链接。
用户看到的是结果,Agent 用的是工具,Skill 封装的是流程。这也是 Skill、CLI 和 MCP 的关系不能只从技术概念上理解的原因。它们最终都要回答一个问题:怎么让普通用户用上头部用户已经验证过的能力。
八、Skill 生态不能做成仓库列表
如果一个 Skill 能被图文、案例、评价、使用数据、作者、应用场景反向链接起来,它就不只是一个工具,而是一个社区节点。
反向链接:从使用案例、文章、图文或项目页面反过来链接到某个 Skill,让人能看到它被谁用、怎么用、效果如何。
当前很多 Skill 展示的问题是:列表很长,像 GitHub 仓库名;图标都一样;没有结果展示;没有评价指标;多模态 Skill 也只用文本展示;用户不知道哪个适合自己。
推荐 10 个或 20 个精选 Skill,并讲清楚怎么用,远好过给用户几千个列表。每个 Skill 都应该像一个软件功能页:它解决什么问题、适合什么场景、需要输入什么、输出长什么样、典型提示词是什么、生成结果截图或视频、谁用过怎么评价、有哪些常见失败情况、如何安装和修改。
这本质上需要强运营,不是把名字列出来,而是一个一个挑、一个一个写介绍、展示结果,最好还有视频讲解。
至于分发渠道:
- GitHub 是代码型 Skill 的天然托管地。Skill 往往包含代码,需要版本管理;GitHub 有生态位、版权声明和分发基础;AI 也熟悉 Git 和 GitHub 操作;开源还能覆盖所有 Agent 平台,不绑定单一产品。
- 小红书 适合做视觉内容和使用案例分发,优势是内容感知、视觉展示、用户审美和评论体系。PPT Skill 和社交媒体卡片 Skill 都已经在小红书之外的人群中传播,比如咖啡馆主理人、数码测评、活动策划、餐厅、三线城市分享场景。这说明 Skill 能跨出 AI 圈。
- 应用商店式 Skill 分发 也有潜力:更精准推荐、更低使用门槛、可能给创作者分成。
但对创作者来说,如果只在一个平台上架,就等于押注这个平台能做好产品、生态、分发和市场占领。更稳的策略可能是:GitHub 做基础分发和跨平台覆盖,平台 Skillhub / 应用商店做体验优化、运营推荐和商业转化。未来的 Skill 平台,本质上会同时是 App Store、GitHub、社区种草页、评价系统和 Agent 工具层。
九、普通用户真正卡在哪里
AI 圈外的人并非不能用 Skill。实际观察中,咖啡馆主理人、数码测评、活动策划、健身教练等都能用出好结果。真正卡点是交互心智。
很多人仍然用传统软件思维,以为一次生成就该完成:不习惯通过 chat 连续调整;不知道可以要求 AI 改颜色、改字、修溢出、换图;不知道如何提供上下文和素材;也不知道如何从自己的工作流中抽 Skill。
因此,Skill 产品不仅要提供安装,还要提供使用教育。
行业 Skill 会是一个很重要的方向。很多行业有非常好的经验和客户洞察:健身、法律、餐饮、活动策划、教育、商业化投放等。但行业专家不一定知道如何做 Skill,也担心分享后被盗。
这里的关键不是把 Skill 作为服务添加项。健身教练可以用 Agent 维护会员饮食、训练、有氧、提醒和反馈,提高客户粘性和服务效率;法律从业者可以把琐碎文本处理、条文审查、格式检查做成辅助 Skill,但核心判断仍由人完成;餐饮和活动行业可以用图文 Skill 把真实图片和故事包装成可传播内容。AI 不能替代线下履约,但可以提高获客、沟通、维护和复用效率。
这类行业用户只需要基础启蒙:带他做一次需求分析,落地成一个 Skill,他就知道边界在哪里。每个行业都有先锋用户,有创造力、有好奇心、想用 AI 获得竞争优势。先服务这些人。

十、内容 Skill:文章、产品和案例互相喂养
从我已有的文章看,我正在形成一条很清晰的内容 Skill 路线:不是为某个抽象 AI 概念写文章,是先做出一个能用的 Skill,再把制作过程、设计判断和使用场景写成传播内容。
这类内容有几个特点:
- PPT Skill 最初来自一次 AI 和组织分享,观众问得最多的是 PPT 怎么做,于是从一次交付沉淀成开源 Skill。这是副产品变主产品。
- 文章本身像说明书,但不是 README。它要讲清楚为什么这样设计、适合谁、边界在哪、真实效果如何,降低用户理解门槛。
- 产品演示本身就是内容资产。PPT 截图、图文卡片、Logo 展示图、Desk Card 场景图,都可以成为传播素材。
- Skill 反过来也提升写作效率。社交卡片 Skill 可以把文章段落直接转成更适合小红书、公众号或 Twitter 的视觉卡片。
每篇文章都在扩展 Skill 的语义边界:PPT 是演示、Social Card 是内容分发、Logo 是项目品牌资产、Desk Card 是硬件和环境 UI、夜巡录则指向游戏 demo 工作流。这说明 Skill 不只是"工具产品",也是内容创作者的表达基础设施。
过去文章和产品是分开的:先做产品,再写推广。现在 Skill、文章、案例、开源仓库、社交反馈会互相喂养。一个成熟路径可能是:用 Agent 完成一次真实任务,把过程沉淀成 Skill,用 Skill 产出的可视化结果写文章,文章带来用户和反馈,反馈补成 gotchas、模板和下一版 Skill,新版 Skill 再产生下一轮内容。
这就是个人产品在 Agent 时代的复利飞轮。
十一、Skill 的边界会继续扩大
过去"插件"通常意味着软件里的一个按钮。现在 Skill 的边界可以明显更大。
浏览器 Skill 会是消费者入口。Tabbit Browser 一类产品说明,Skill 可以进入浏览器场景,变成普通用户在网页、资料、脚本和自动化之间的入口。浏览器是大众最熟悉的工作环境,如果 Skill 能以"现成脚本 / 使用案例 / 一键执行"的方式出现,会比裸露 CLI 或 GitHub 仓库更容易被理解。
硬件 Skill 说明 AI 可以接管环境 UI。AI Desk Card 的价值在于它把 Agent 的能力延伸到了物理环境:安装固件、配置 Wi-Fi、写 cron、读取 Memory、选择 widget、刷新墨水屏,全流程由 AI 引导。用户不再面对 App 设置页,AI 本身就是设置页。
游戏 Skill 代表更长链路的创作流程。夜巡录开发手记里提到的"独立游戏 demo Skill",从玩法母题、原型、素材采集、绿幕抠图、contact sheet、视频生成、音乐、Electron 打包、GitHub Actions 到 Release,封装的是一套跨程序员、美术、动画、作曲和运维的生产流水线。它的价值是把"做个原型"和"独立交付完整作品"之间的墙变薄。
这些案例指向同一个判断:Skill 的未来不会局限在聊天框里,它会扩展到浏览器、桌面、本地文件、硬件、内容平台、游戏引擎和真实工作环境。
十二、Skill 与 Gene:手写经验和自动进化的边界
还有一个值得保留但需要谨慎使用的对比:Agent Skill 与 GEP Gene。
Skill 更像人类预先沉淀的能力包:有明确创建者、明确边界、明确流程和版本。Gene / Capsule 这类概念强调运行中从成功经验里自动长出能力:带成功率、变异历史、适用上下文和自动修复机制。
Gene / Capsule:从 Agent 反复执行中的成功路径里沉淀出的可复用经验单元,强调自动演化而不是人工手写。
这两者不是简单替代关系,是不同的层级:
- Skill 适合承载人的专家经验、审美、行业 SOP、工具不变式和明确交付标准;
- Gene 适合从重复执行中捕捉成功路径,把临时试错变成可复用经验;
- Capsule 类似把多个 Gene 组合成更长工作流。
从当前产品现实看,Skill 仍是更可落地的单位,因为它能被写、被审、被发布、被解释、被传播。但长期看,自动沉淀 Skill / Gene 化经验会成为方向:Agent 先用通用工具试错,成功后把路径写回 Skill 或生成新的子能力。
这也回应了"自动沉淀 Skill"的讨论。系统可以自动发现重复流程,但是否值得沉淀、如何命名、边界在哪里、哪些失败要写进 gotchas,仍然需要人的判断。真正理想的形态不是完全自动,也不是完全手写,而是人定义品味和边界,Agent 负责收集证据、提出改动、补充 eval 和维护长尾经验。
十三、盗用不是靠藏,防御方式是持续分发
Skill 很难靠闭源防盗。即便不开源,只要看到产出结果,试用几次,也可能被复刻。
所以防御方式不是"藏起来",而是:开源覆盖更多平台、用影响力威慑过分盗用者、做自媒体让用户知道源头是谁、用持续迭代建立领先、用社区案例和评价体系形成品牌资产。
在产品壁垒降低的时代,个人产品如果没有渠道、资源和营销,就必须自己做宣发。以前自媒体是可选项,现在它是基础设施。
十四、平台真正该做什么
如果要做 Skill 平台,不能只押 Skill。用户下载独立端的理由,首先是 Agent 基础体验足够好:漂亮好用的客户端;多模型支持,尤其国产模型;文件、项目、Memory、CLI、MCP、Skill 管理;权限和安全沙箱;长程任务和状态延续;多设备流转,手机控制桌面,桌面反向控制手机;官方高质量插件开箱即用。
Workbody 的启发是,它没有做特别独特的东西,只是把该有的基础体验做齐了。很多国内产品连这一点还没做好。一些高频、必须、常见的能力应该内置并打磨好,不要让用户自己折腾安装。官方插件强,会形成壁垒。多设备、云端和本地互控,也会形成壁垒。
Skill 与本地环境强相关时,移动端需要遥控 PC。Skill 可跨端通用,但依赖本地文件、脚本、浏览器、CLI 的 Skill 在移动端很难直接跑。移动端适合轻量级从 0 到 1 创作,桌面端适合重任务和本地环境调用。
自动沉淀 Skill 是长期方向,但好 Skill 仍需要人。Dumate 等产品提出"自动沉淀 Skill":从用户重复工作中自动总结流程。这个方向成立,但好 Skill 仍需要业务 SOP、品味、测试和迭代。自动生成可以做初版,真正能稳定交付的 Skill 需要打磨。
十五、一个完整的 Skill 生命周期
把前面的判断收束成一条路径,一个完整的 Skill 生命周期大概是这样的:
- 发现真实需求,从自己或行业用户的重复工作开始。
- 做一次高质量产物,不要先抽象,先用 Agent 解决真实任务。
- 抽象流程,识别可复用步骤、输入、输出、约束和工具。
- 工程化模板,把审美、版式、调用、验证和修复机制固化。
- 跨模型测试,好模型看上限,差模型保下限。
- 封装发布,GitHub 托管,配 README、示例和安装方式。
- 内容分发,用小红书、Twitter、公众号、视频展示结果。
- 收集反馈,从 issue、评论区、用户案例和平台数据里找真实问题。
- 筛选反馈,只吸收能提升泛化和稳定性的部分。
这条路看起来长,但本质很简单:每一次真实任务,都不只是在完成任务,而是在积累下一次能调用的能力资产。
结尾
Agent 时代最稀缺的,不是模型,而是可复用的能力组织方式。
Skill 之所以重要,是因为它第一次让人的经验、工作流和品味,有机会变成一种可以分发、调用、评价和持续迭代的商品。

这可能才是 Agent 生态里真正的大机会。