AI 的两个意外:能自主犯罪了 + 合作反而更笨了
2026 年 7 月 4 日,两个 AI 信号。一个来自安全领域,一个来自基础研究。方向不同,结论一致:AI 行业正在展现出一些没人准备好面对的行为模式。
5 篇文章
2026 年 7 月 4 日,两个 AI 信号。一个来自安全领域,一个来自基础研究。方向不同,结论一致:AI 行业正在展现出一些没人准备好面对的行为模式。
六天了。这是 AI 安全武器化弧线的第六天。
6 月 29 日,Claude 被曝嵌入美军 Palantir 系统,建议 1000 个打击目标,首日即误炸伊朗学校。安全承诺在军事系统里碎成了弹坑。
Meta 雇佣承包商假扮未成年人,向 ChatGPT 发送了数万条涉及自残、暴力和性内容的危机提示。目标是系统性测试 OpenAI 的安全防护边界。The Decoder 在 6 月 30 日报道了这件事。
美军用 AI 选目标,误炸了一所伊朗学校。