eviso's thinking

AI时代的个人操作系统

CONTENTS

从Skill、Agent Loop到主体性,如何搭建自己的AI工具系统而不被工具反向驯化 · 2026-06-21


过去四十年,我们都在学习如何使用操作系统:Windows、macOS、iOS、Android。图标、窗口、文件夹、菜单——这套隐喻统治了几乎所有人机交互的历史。

但 2026 年的今天,另一种"操作系统"正在静默地崛起。它不是软件——是个人工作方式的重新架构。 它不存在于任何 App Store 里。它需要每个人自己构建。


一、新的层级:管理 AI 行为的操作系统

传统 OS 管理硬件资源——CPU、内存、磁盘。AI 时代出现了一个新物种:管理 AI 行为的操作系统。

Claude Code 的架构就是原型:CLAUDE.md → 上下文工程 → Skills → Tools/MCP → Hooks → Subagents。映射到传统 OS:CLAUDE.md = BIOS 配置,Skill = 应用程序,HANDOFF.md = 进程切换,Agent Loop = 进程调度器。

区别只有一个:传统 OS 管理的是计算资源。这套系统管理的是注意力与判断力。


二、Skill:可组合的工作单元

Skill 是什么?不是模板,不是提示词库——是封装了专业判断的可执行单元。

Kimberly 给出了最实用的判断标准:"如果你已经对 Claude 说过三次以上同样的要求,就可以考虑写成 Skill。" 这背后是经济学原理:重复摩擦成本的积累,是系统优化的信号。

一个 Skill 的基本结构极其简单:

---
name: pr-description
description: 当用户要求创建或总结 PR 时使用此技能
---

# PR 描述 Skill

## 格式
- What: ...
- Why: ...
- Changes: ...

name 是小写连字符。description 是触发条件——告诉 AI 什么时候该用,以及它能做什么。description 的质量直接决定 Skill 会不会被正确触发。太泛了,AI 不知道该触发;太窄了,又失去通用性。Kimberly 的建议:回答两个问题——这个 Skill 做什么?用户说什么时应该使用它?

三个设计原则:

可执行,不可感觉。 不要写"语气要专业"——那是主观感觉,AI 无法验证。写"使用主动语态,每段不超过三句"——这是行为标准,可以被检查。

渐进式披露。 一个 Skill 文件控制在 500 行以内。核心说明放在 SKILL.md,详细资料放到 references/,脚本放到 scripts/。AI 不需要每次都读全部内容——只在需要时才翻对应章节。

高内聚、低耦合。 和软件工程里的模块化思想一脉相承。一个 Skill 做一件事,描述清晰,边界明确。不重叠,不冲突。


三、三个阶段:从重说一遍到不说了

Skill 不是孤立的——它代表 AI 协作的第三阶段。

第一阶段:每次重新 prompt。 你说一次,它做一次。下一次又要从头教。这就像一个永远不记得你喜好的咖啡师——每天早上都要重复"少糖、燕麦奶、不要盖。"

第二阶段:CLAUDE.md 设定全局规则。 不用每次都重复了。咖啡师记住了"少糖燕麦奶不要盖。"但所有规则混在一起,不分场景。写代码和写文章,用的是同一张规则表。

第三阶段:Skill 把特定领域的规则封装成可自动触发的模块。 你不再需要想"这次用什么 prompt"——AI 根据任务自动选择合适的 Skill。就好像咖啡师看到你进门就知道:早上是燕麦拿铁,下午是冰美式,下雨天是热巧克力。不用说话。

当你积累到一定规模的 Skill——10个、20个、30个——你就有了自己的专属工具操作系统。 每次新会话,不是从零开始。是从你的系统开始。


四、Agent Loop:新的执行单元

如果说传统软件的执行单元是"函数",AI 时代的执行单元变成了Agent Loop——reason + act + observe,重复直到验证通过。

函数的执行是确定性的、可中断的。Agent Loop 是概率性的、持续运转的。用更直白的话:过去是"你告诉它做什么",现在是"你告诉它什么时候停。"

艾略特的实践总结是关键:"关键不是 repeat,是 observe——没有验证的 loop 只是更贵、更长时间的瞎忙。" AI 不知道什么时候算"够好"。这个判断必须由外部给出。这就是你的角色——你不是"使用 AI"的人,你是给 AI 的 loop 设置停止条件的人。

Skill 和 Agent Loop 的关系是互补的。Agent Loop 解决"过程"问题——怎么持续工作。Skill 解决"知识"问题——每个环节按什么标准执行。两者结合,才是完整的 AI 工作流。


五、主体性:谁在控制谁

但这里有一个尖锐的问题。Vibe OS 的 snowboat84 提出:"我怎么才能既用上 AI 的全部力量,又不在这股洪流里把'我'这个人弄丢?"

他的答案是:"我永远站在系统之外。系统是手脚和感官的延伸,帮我感知更多、执行更快,但它到不了大脑的位置,做不了最终拍板的主体。"

这句话是简洁的。但做起来难。因为有一个反直觉的事实:思考常常发生在执行里。

写代码撞 bug 会发现设计问题。写文章写不下去说明还没想清楚。执行本身就是思考的原材料。把执行全甩给 AI,等于把自己思考的原料也扔掉了。这是一场静默的异化——你觉得自己效率提高了,实际上是判断力在萎缩。

这就是为什么主体性不是"少用 AI"——是用 AI 放大判断力,不代替判断力。 区分的关键在于:AI 帮你收集信息、执行操作、验证结果——但最终拍板的那个动作,是你做的。你告诉它什么时候停。


六、新的操作系统需要新的用户

传统 OS 降低了使用电脑的门槛——图形界面让非技术人员也能操作。但 AI 时代的"操作系统"实际上提高了要求。 它要求用户有更强的判断力、更清晰的边界意识、更系统的元认知能力。

原因很简单:传统软件的行为是确定的,你可以通过"学习操作"来驾驭它。AI 的行为是概率性的——你无法通过"学习操作"来驾驭 AI,你只能通过定义目标、边界和停止条件来驾驭它。

AI 时代最重要的技能不是"使用 AI"——是**"定义问题。"** 知道自己要什么。什么时候算完成。什么绝对不能做。


七、从哪开始

不是一次性搭建完整系统。那是工程师的思维,不是使用者的思维。

第一步:注意重复。 你对 Claude 说了什么第三次?把它写成一个 Skill。不需要完美——先写,再用。Skill 是在使用中迭代的,不是在设计阶段完成的。

第二步:建立停止条件。 每次用 Agent Loop 时,在开始前定义"什么时候停"——不是"什么时候好",是"什么时候够了。"比如:"验证完这三个测试用例就停"、"改完这三个文件就停"、"写完这一节就停。"目标是边界,不是完美。

第三步:把判断留给自己。 AI 可以帮你收集数据、对比选项、生成草案。但"这个方案对不对"——是你的判断。"这篇文章想说什么"——是你的判断。"这段代码的架构合不合理"——是你的判断。你的判断力是这套操作系统的 BIOS——它决定了所有其他组件的行为边界。如果 BIOS 坏了,再快的 CPU 也没用。


结语:操作系统不是目的

Skill 系统不是目的。Agent Loop 不是目的。Claude Code 的六层架构不是目的。

目的是让 AI 成为手脚的延伸,不成为大脑的替代。 目的是用工具放大自己的判断力,不把判断力外包给工具。

真正的 AI 时代操作系统,是那套能让你同时保持最大效能和最高主体性的个人系统。

它不存在于任何 App Store 里。它需要你自己构建。从第一个重复三次的要求开始,从第一个"够了"的边界开始。


参考来源:Kimberly @king1818888「Claude Code Skill 学习与实践白皮书」,艾略特 @elliotchen100「Agent Loops 最高可用场景」,snowboat84「Vibe OS 哲学基础」