转AI agent开发之前,先尝试把自己的工作流程理顺

最近很多开发者开始转向 AI agent 方向。大家的路径也很熟悉:找一个框架,啃各种文档,看一堆视频,跑一遍官方 demo,背一堆八股文。 这让我想起很多人当年学编程的样子:照着代码敲,功能可以运行,但知识没有真正进入脑子。因为从头到尾并不知道这些代码究竟解决什么问题,只是在模仿结构。语法学了,抽象没有学;接口会用,但场景不清楚。 很多人以为自己在学一个新东西,最后发现其实只是换了一套 API。真正困难的部分并不是那些框架的使用,而是你有没有一个清晰的流程,真的让 agent 可以介入。

我们暂时不讨论模型训练,今天大多数所谓的 agent 开发,本质上并不神秘。它只是把原本就存在的工作流程重新组织了一遍,然后把 AI 插入到那些原来靠人完成的模糊判断、信息整理与表达生成的环节里。 问题在于,大多数人的工作流程本身就是模糊的。当流程是模糊的,agent 就无从发挥。
当流程是清晰的,哪怕不用复杂架构,AI 也已经开始产生价值。 最好的学习方法其实就是去观察自己,哪一些是你日常”不得不”去做的重复性工作是可以被agent接手的?譬如每天写日报,整理 issue,写 PR 描述,归纳会议内容,做代码 review,校验接口一致性。这些动作并不复杂,但它们反复出现,占据大量时间。这些地方,才是 AI 最自然的切入点。


我建议所有人都去使用Skill

Skill的本质就是通过构建一个workflow把一个重复动作,变成一个可被调度的能力单元。

我发现在思考怎么去创建一个skill的时候,就是你在做agent engineering的时候。大家一提到agent的时候,在说tool calling,mcp,memory, planning。Skill中其实就融合这些所有的思路。 我现在就是会把我整个工程中的很多小环节拆成一个一个的skill。 我喜欢用obsidian,我希望可以把所有的文档都集中在我的vault中。于是我创建了一个skill,可以把我特定文件名的文档(譬如 [Feature] [Bug] [Release v*]开头) 进行读取并且通过github的mcp创建对应的issue。而且因为obsidian是支持双链笔记的,我可以很容易在release的文档中去关联对应的bug和feature,也便于我后续跟踪。

我自己现在的项目中有很多submodules,所以每次创建worktree的时候都有些麻烦,于是我建立了一个create worktree的skill用来封装所有相关的git指令;同理,merge的时候也很麻烦,也有merge worktree的skill;当所有测试通过的时候,还有delete worktree的skill。

因为资金有限,所以我是好和坏的模型混合着用的。所以我建立了一个开发流程的skill,先由好的模型来进行需求分析,然后用便宜模型的subagents去搜索整个库,查询是否有可以复用的代码,架构等等;然后再用好的模型来进行分析和设计,并输出对应的测试和开发方案(测试一定要先行!);再用普通的模型根据方案进行开发,再用好的模型来review所有的代码和架构。我自己是非常不喜欢AI到处生成文档的,所以我会让它把所有中间文件都放到一个info的文件夹中(是git ignore的文件夹,因为我不想同步这些有的没的)。直到测试通过,我才会让它输出一个正式的文档,用于git提交的。

其实我还创建了很多用于我自己日常管理的skill,后续可以详细慢慢发。这篇只是给大家提供一个思路,没有具体的代码和教学,因为我觉得只有思考了,知道能用到哪里,才比较有意义。


善用skill-creator & github-to-skill

这么多的skill,我肯定不能一个一个去写,那么Claude code官方提供的skill-creator就是大救星了。它本身就是一个 skill,可以根据你梳理好的流程,帮你生成新的 skill。你可以把你整个流程和所需要的工具和方式说清楚,通过prompt的方式让它帮你生成一整个流程。一般的流程它都可以生成的非常好,有一些可能需要你自己去调试的,或者你可以自己增加一些代码作为tool让它调用的,你也可以非常容易地通过修改生成的SKILL.md文件来进行修改。

github-to-skill是一个可以帮你把github库的代码封装成一个skill。很多开源的小工具都可以用这种方式使用,并且还可以将这个封装的skill在你自己的skill流程中使用。


其实现在很多 agent 工具天然就支持 skill,让能力封装和调度变得越来越简单。但工具本身并不会自动产生结构。 AI 做事情并不难,难的是你是否知道它应该做什么、何时做、做完之后进入哪一个系统节点。难的是你是否能把自己的日常动作拆解清楚,并把它们抽象成可复用的能力。 在 AI 时代,这种架构梳理和抽象能力,远比多学几个工具更有价值。