DeepSeek 正在两个方向上同时加速。上面是 DSpark 让 V4 推理再快 60-85%,下面是美国企业被 Anthropic 和 OpenAI 的账单逼到全面转向。两条线不是巧合——它们在同一个力学结构里运行。
上周末 DeepSeek 开源了 DSpark,一个投机解码框架。不是新模型,是在 DeepSeek-V4 权重上附加草稿模块的设计。生产环境下,V4-Flash 每用户生成速度较 MTP-1 基线提升 60-85%,V4-Pro 提升 57-78%。离线测试中接受长度比 Eagle3 高 26-31%,比自家 DFlash 高 16-18%。配套的 DeepSpec 训练代码用 MIT 许可。
这不是一个孤立的工程优化。DSpark 的发布时间——2026 年 6 月 27 日——恰好和美国企业开始“用脚投票”的节点重合。
旧金山公司 Lindy 的 CEO 弗洛·克里维洛说了一句话:“本月已将 100% 流量切换到 DeepSeek,预计未来几个月可节省数百万美元。”此前 Lindy 主要调用 Anthropic 的 Claude,每月 AI 账单超过员工工资。这不是个案。越来越多企业开始采用“模型路由”——按任务匹配模型,不再把最贵的前沿模型用于所有场景。部分客户已暂停 AI 投入,要求先证明 ROI。
技术加速和市场倒逼本质上是同一种力。理解这个结构,最有效的框架来自一个简单的问题:系统在压力下变得更脆弱还是更强?
塔勒布用“反脆弱”来描述那些从混乱中获益的系统。DeepSeek 的处境是教科书级的案例——芯片限制本意是削弱它,结果迫使它把推理效率推到了没有人到过的地方。DSpark 的设计出发点就是“不用更多算力,用更聪明的调度”。半自回归生成、并行骨干加轻量级顺序头——这些不是堆 GPU 能买到的优化,是约束条件下逼出来的。
这不是 X,是 Y。DeepSeek 的技术突破不是一场军备竞赛的加码,而是军备竞赛本身的成本逻辑开始反噬发起方。
竞争战略里有一条老规律:成本领先者的护城河在行业利润率收缩时最深。波特写了四十年的东西,现在被 AI 账单重新验证。当 Anthropic 和 OpenAI 还在参数规模和高价 API 上竞争时,DeepSeek 走了另一条路——不是做最强大的模型,是做“足够好用且便宜一个数量级”的模型。VibeThinker-3B 在同一周末证明了另一个方向:3B 参数能在数学推理上持平 DeepSeek V3.2 这种大 200-333 倍的模型。“参数压缩假说”的核心判断是——推理能力可压缩,广泛的世界知识不能。这条线如果成立,成本曲线的斜率会比所有人预想的更陡。
道、术、势三层看这件事:
道的层面,AI 行业正在从“能力竞赛”切换为“成本竞赛”。这不是一个产品迭代,是一个范式切换。
术的层面,DSpark 的投机解码不是 DeepSeek 的终点。SpaceX 同一天宣布今年将每月发布从头训练的新模型——军备竞赛的另一端还在加速。但每月一个新模型的承诺本身就是一种信号,它说明模型本身正在变成快消品。快消品的竞争,最终拼的是供应链效率和单位成本。
势的层面,美国企业从 Anthropic 切到 DeepSeek 不是技术判断,是财务判断。当 CFO 开始看 AI 账单,技术选型的天平就倾斜了。Lindy 的 100% 切换只是第一个公开案例,更多案例会在下个财报季浮出来。
但这不是一个“DeepSeek 赢了”的故事。
达利欧的框架提醒了一件事:任何趋势都嵌套在更大的周期里。DeepSeek 当前的成本优势是真实的,但它建立在开源社区的持续贡献和自身推理优化的工程深度上。这两个优势都不永久——开源可以被复现,工程优化可以被追赶。SpaceXAI 的入局意味着一个拥有火箭级算力预算的竞争者正在成型。Grok 4.5 基于 1.5T 参数的 V9 基座,已在 SpaceX 和 Tesla 内部私测,性能接近 Claude Opus。
真正的变量不是今天的市场份额,是谁的成本曲线下降得更快。这是一个速度问题,不是一个位置问题。
短期内,2026 下半年会有更多美国企业公开宣布切换或混用 DeepSeek。Anthropic 和 OpenAI 会面临要么降价要么证明溢价的压力。如果 Grok 4.5 如期在 SpaceX 每月发布节奏下持续迭代,竞争会在 2026 Q4 进入一个新阶段——三个成本结构完全不同的玩家(开源低成本、闭源高溢价、垂直整合零毛利)同时在场。
长期看,AI 模型的“商品化”速度可能超过所有人的预期。当 3B 模型能在推理任务上持平 600B 模型,当投机解码能让已有模型加速 85%,“最大模型”这个标签的市场价值在缩水。下一步竞争会从模型层上移到应用层和分发层。
DeepSeek 的双重加速不是一次技术发布加一个客户案例。它是一个信号:AI 行业的成本曲线开始自己说话了。而成本曲线的声音,比任何 benchmark 都响。