eviso's thinking

四件事告诉你:AI 行业正在从"做加法"切换到"做减法"

CONTENTS

2026 年 7 月的头三天,四个信号。单独看,各是一个新闻。放在一起,它们在画同一条曲线——AI 行业的集体动作正在从"做更多"变成"做更少"。 不是做不出来了。是发现做更多没有更好——这是 2026 年年中最值得被记录的结构性转折。


信号一:扎克伯格说了一句大实话

扎克伯格在 Q&A 中说:AI 智能体的开发速度"未如预期"。

这不是一个 Meta CEO 的示弱。这是一个行业共识的迟到表达。2025 年所有人都说"智能体元年"——Agent 是下一个大东西。但到了 2026 年中,能落地的 Agent 产品屈指可数。最成功的 Agent 产品是什么?Claude Code——一个帮程序员写代码的工具。不是帮你订机票、帮你买咖啡、帮你管理日程的"通用 Agent"。是一个垂直到不能再垂直的编程工具。

Agent 的通用化进程进入了瓶颈。不是因为模型不够聪明。是因为现实世界的任务链条太长、太碎、太依赖上下文——而模型在跨系统、跨工具、跨权限的复杂链路上,目前的表现远不如人类。

扎克伯格的"认怂"其实帮了整个行业一个忙——把预期从"Agent 马上能用"调回到"Agent 需要更长时间"。加法做了两年(更多的参数、更多的工具、更多的 Agent 框架)。现在是做减法的时候——更少但更深的场景、更少但更可靠的链路、更少但真正有用的 Agent。


信号二:GPT-5.6 不再追求"一个最强",而是做了三个

OpenAI 的一份论文揭示了 GPT-5.6 的内部策略——不是"一个最强模型",而是三个 Pro 变体,各有侧重。这个转向的背景是:GPT-5 的训练成本据估算超过5亿美元,GPT-5.5 的推理成本较 GPT-5 下降了约40%但仍远高于商业可行线。OpenAI 在 2025 年全年亏损约50亿美元,其中推理成本占比超过60%。当成本成为比 benchmark 更硬的约束,把一个模型拆成三个针对性的版本,就成了比"做一个更大的模型"更理性的选择。

2023-2025 年的逻辑:GPT-4 → GPT-4.5 → GPT-5 → GPT-5.5。每一次迭代都是"更大更强更好"。参数更多、benchmark 更高、价格更贵。这是一条做加法的路——模型越做越大,能处理的任务越来越多。

2026 年的 GPT-5.6 画了一条不同的线。三个变体——可能在推理速度、成本、特定领域能力上做了取舍。这意味着 OpenAI 内部已经承认了一个事实:通用大模型的边际收益在递减。再加参数、再加数据,不一定是最高效的方向。更高效的方向是为不同场景做优化版本——哪怕这意味着放弃"一个模型统治一切"的叙事。

做减法的代价是:故事没有以前好讲了。"最强模型"是一个清晰的故事。"三个专业变体"是一个复杂的故事。但复杂的代价比简单的谎言值钱。GPT-5.6 的策略转变是 AI 行业从"军备竞赛"转向"效率竞赛"的又一个信号。


信号三:当 FSD 死于"太保守"

得州特斯拉 FSD 致命车祸——司机嫌 FSD 太保守,切回人工驾驶,加速踏板踩死,撞死了一名 76 岁的居民。

这个故事最让人不适的地方在于——FSD 没有犯错。它严格遵守了交通规则。它是被人类的急躁杀死的。这不是一场"机器出错"的事故。是一场"人机交接"的事故。

AI 安全行业花了两年的时间和几十亿美元,试图让模型"不出错"。FSD 的这场事故暴露了一个被忽略的问题:AI 做出正确的决策——然后人类推翻了这个决策——然后出事了。这是谁的责任?

传统的 AI 安全框架是一个"加法"框架——更多的护栏、更严格的限制、更保守的行为边界。但 FSD 事故表明——加法的极限已经出现了。模型越保守,人类越想接管。人类越想接管,事故越可能发生。最安全的 AI 不是"最保守的 AI"——是"人类最不想接管的 AI"。而要做到这一点,需要的不是更多护栏——是在 AI 和人类之间建立更顺畅的交接机制、更透明的信心传达、更自然的控制切换。

这是减法——不是去掉安全措施,是去掉那个让人类烦躁到必须接管的"不自然感"。


信号四:Claude Code 删了 80% 的提示词,同时教会了 AI 自己跑循环

三条子消息合成一条。

第一,Anthropic 把 Claude Code 的系统提示词从 65,000 token 砍到 12,000。砍完之后——模型的表现没有下降,反而更好了。

第二,Claude Code 推出了 /goal 和 /loop 命令。开发者设定目标条件,AI 自己跑循环,直到达标或超时。核心操作单元从"一次对话"变成了"一个循环"。

第三,一个叫 Caveman 的社区插件爆火——它把 Claude Code 的废话用"原始人语"替代,评测显示减少了 65-75% 的输出 token。

三条子消息,同一个方向:AI 编程工具的成熟不是"变得更能说"——是"变得更安静、更便宜、更不需要你盯着"。

2024 年的 AI 编程是"加法"——更长的推理痕迹、更详细的解释、更多的 sub-agent 并行调用。Anthropic 甚至愿意为这种"看起来聪明"的感觉烧掉大量 token。但 2026 年的信号是——这种做加法的策略已经走到头了。

花旗银行限制员工使用高级 AI 工具。Adobe、Walmart 开始严格管控 AI 使用。Uber 给每个工程师每月设1500美元上限。据 InfoQ 报道,2026年上半年至少有 12 家财富 500 强企业出台了正式的 AI 成本管控政策,覆盖约 40 万名员工。企业端的反馈非常明确:AI 很好,但太贵了。Claude Code 在删提示词之前,每次对话平均消耗约 5-8 美元——一个工程师一天用 20 次,一个月就是 100-160 美元。删掉 80% 提示词后,单次对话成本预计下降40-60%。企业端的 AI 账单在 2025 年普遍超预算 3-5 倍。2026 年的主题是纠偏。

从做加法到做减法,不是 AI 变弱了。是 AI 终于开始回应现实世界的成本约束了——经历了两年不计代价的"军备竞赛"式扩张后,AI 行业正在进入一个更冷静、更务实的阶段。


这四件事的共同结构

信号一:Agent 要做减法——少做一点,做好一点。信号二:大模型要做减法——一个变三个,各有各的用。信号三:安全要做减法——不要堆护栏,要优化人机交互。信号四:产品要做减法——不要说那么多,把活干了就行。

这四件事不是巧合。它们的共同结构是:AI 行业过去两年是在回答"AI 能做什么"。现在开始回答"AI 应该在什么地方停下来"。 这不是一个技术迭代,是一次行业自我意识的集体觉醒——从膨胀到收敛,从全能幻想回到边界意识。

道、术、势三层看这个趋势。

在道的层面,这是一种行业哲学的根本转向。2023-2025 年的 AI 行业信仰是"更多就是更好"——更多参数、更多数据、更多功能、更多 Agent。2026 年正在形成的共识是——"更多"已经触达了边际收益的临界点。一个 65,000 token 的提示词比 12,000 token 的更差。一个"通用 Agent"不如一个垂直编程工具。一种永远让你想接管的保守 FSD 比一种让你敢放手的智能 FSD 更危险。德内拉·梅多斯在《系统之美》里管这种现象叫"增长的极限"——当一个系统越过了某个复杂度阈值,继续增加投入只会产生反效果。

在术的层面,做减法有非常具体的操作路径。Anthropic 砍提示词是一种。OpenAI 做多模型变体是一种。Caveman 插件用原始人语替代废话是一种。FSD 优化人机交接体验是一种。所有这些操作的共同特征:不是砍功能,是砍掉那些被用户感知为"阻力"的东西——过长的推理痕迹、过多的选项、过度保守的决策、过度礼貌的废话。 减法减去的是摩擦,不是能力。

在势的层面,2026 年下半年可能会出现一个"做减法"的行业加速期。不是因为终于有人想清楚了——是因为成本约束不再允许继续做加法。花旗限制访问、Adobe 管控使用、Uber 设每人每月 1500 美元上限——企业端已经比技术端更早感知到了"加法战略"的不可持续。当 CFO 开始看 AI 账单,做减法就从产品哲学变成了生存必需。

两个都是重要的问题。但第二个问题的答案,决定第一个问题的价值。如果 AI 什么都能做但什么都做得不够好、不够便宜、不够可靠——等于什么都没做。做减法不是退缩。是做更难的事情——在保留核心能力的同时,砍掉一切不必要的成本、不必要的复杂度、不必要的过度承诺。

2026 年下半年的 AI 行业主线,很可能不是"谁发布了更强的模型"——是"谁先找到了最小可行 AI 的公式"。最少的人、最少的 prompt、最少的 token——产出刚好够改变用户行为的价值。这个公式一旦被找到,AI 的扩散曲线才会真正开始爬升。