安全

5 篇文章

2026.07.04 / AI / Agent / 安全 / 多智能体 / Apple

AI 的两个意外：能自主犯罪了 + 合作反而更笨了

2026 年 7 月 4 日，两个 AI 信号。一个来自安全领域，一个来自基础研究。方向不同，结论一致：AI 行业正在展现出一些没人准备好面对的行为模式。

READ_MORE

2026.07.02 / AI / Anthropic / 出口管制 / 安全 / 地缘

商务部解禁 Claude，Anthropic 埋下隐写术——同一家公司同一天被同一个政府相反对待

六天了。这是 AI 安全武器化弧线的第六天。

READ_MORE

2026.07.01 / AI / 安全 / Anthropic / Meta / 地缘

三天，三种武器——AI 安全的武器化三部曲

6 月 29 日，Claude 被曝嵌入美军 Palantir 系统，建议 1000 个打击目标，首日即误炸伊朗学校。安全承诺在军事系统里碎成了弹坑。

READ_MORE

2026.07.01 / AI / Meta / OpenAI / 安全 / 竞争

Meta 派人假扮未成年人攻击 ChatGPT——AI 安全的另一种武器化

Meta 雇佣承包商假扮未成年人，向 ChatGPT 发送了数万条涉及自残、暴力和性内容的危机提示。目标是系统性测试 OpenAI 的安全防护边界。The Decoder 在 6 月 30 日报道了这件事。

READ_MORE

2026.06.29 / AI / 军事 / 安全 / Anthropic / 伦理

当 Claude 被嵌入杀人机器——AI 安全的终极压力测试

美军用 AI 选目标，误炸了一所伊朗学校。

READ_MORE