Claude Fable 的 72 小时:前沿 AI 进入停止权时代
Claude Fable 5 只公开跑了几天,就被叫停了。
2026 年 6 月 9 日,Anthropic 发布 Claude Fable 5 和 Claude Mythos 5。官方说法里,Fable 5 是一个带强安全保护的 Mythos-class 模型,可以面向普通用户开放;Mythos 5 则是同一底层模型,在部分高风险能力上给可信对象更高访问权。
6 月 12 日,事情突然反转。Anthropic 发布声明称,美国政府以国家安全权限发出出口管制指令,要求暂停任何 foreign national 访问 Fable 5 和 Mythos 5。为了合规,Anthropic 不得不对所有客户临时关闭这两个模型。
如果只把这件事看成一次产品事故,会低估它的意义。
这更像是前沿 AI 进入新阶段的标志:竞争不只看谁的模型更强,还要看谁有资格发布,谁可以访问,谁能监测风险,谁有权叫停,以及叫停以后如何恢复。
换句话说,前沿模型开始进入“停止权时代”。
不是普通发布事故
Fable 5 的发布,本来就是一次分层访问实验。
Anthropic 在发布文里强调,Fable 5 在软件工程、知识工作、视觉、长上下文和生命科学等任务上显著提升。但它也承认,这类能力有双用途风险。尤其在网络安全、生物化学和模型蒸馏等领域,如果没有额外保护,能力可能被滥用。
所以 Anthropic 给 Fable 5 加了 classifiers。敏感请求会被拦截,或 fallback 到下一档模型 Opus 4.8。Mythos 5 则面向更窄的可信访问对象,比如网络防御和关键基础设施相关组织。
这套设计背后的逻辑很清楚:同一个底层能力,不同对象、不同风险域、不同访问边界。
真正的冲突也出在这里。
Anthropic 认为自己已经做了足够多的 safeguard,并且政府掌握的所谓 jailbreak 只是 narrow、non-universal 的潜在绕过方式。Anthropic 在声明里说,目前政府给它的只是 potential narrow jailbreak 的口头证据,大致涉及让模型读取特定代码库并寻找软件缺陷;Anthropic 还认为,演示出的能力并不是 Mythos 独有,其他公开模型和日常防御场景也能覆盖类似任务。
美国政府的行为则说明另一种判断:当模型能力越过某个阈值,外部权力不一定接受公司的自我评估。
这就是这件事的本质。
公司说:我已经分层、监测、限权。
政府说:不够,现在停。
停止权是必要的,但不能是黑箱
高能力模型当然需要停止权。
一个模型如果能显著降低网络攻击、漏洞利用、生物研究或自动化行动的门槛,就不可能像普通 SaaS 一样只靠服务条款治理。它需要监测、限流、分级访问,也需要在风险失控时暂停。
问题不在于“政府有没有权力介入”。问题在于介入的技术标准、证据门槛和程序边界是否足够清楚。
Anthropic 自己也不否认政府应当能阻止不安全部署。它真正反对的是:如果一个 narrow potential jailbreak 就足以让已经商用的模型被召回,而政府又没有公开清晰的技术事实和程序,那么这个机制会变成事实上的许可制度。
这会改变整个行业。
模型发布不再只是公司内部安全评估加产品上线。它会变成一个多方博弈:公司、政府、云厂商、企业客户、安全研究者、公众和国际用户,都在争夺对同一个模型的解释权和停止权。
Axios 的报道进一步把这个结构说得更具体:Amazon 向政府分享了关于 Mythos 相关风险的报告,随后 White House 与 Anthropic 之间发生紧急沟通,最后演变成周五晚间的叫停。这个报道依赖消息源,还不能替代公开法律文件,但它提示了一个很现实的问题:前沿模型的安全争议,可能不再只发生在实验室和论文里,而会发生在云厂商、政府办公室和企业合同之间。
公众并不想只相信 AI 公司
同一周,Anthropic 还发布了第一期 Anthropic Public Record。
这份调查有一个非常关键的数据:只有 15% 的美国受访者信任 AI 公司自行决定 AI 如何开发和使用。71% 的受访者认为政府应该参与 AI development and regulation。
这不是 Fable 5 被叫停的直接原因,但它解释了为什么停止权会变得越来越重要。
公众对 AI 的态度并不是简单的“支持创新”或“反对 AI”。调查里,人们最期待 AI 治愈疾病、帮助残障人士、推动技术进步;同时最担心 job loss、cognitive dependency、misinformation。人们想要收益,也想要责任。
这就形成一个很难回避的结构:
- 公司希望尽快发布能力;
- 用户希望拿到最强工具;
- 企业希望把模型接进真实系统;
- 公众希望有人能追责;
- 政府希望在国家安全和社会风险上保留停止权。
Fable 5 的 72 小时,只是这个结构第一次以非常戏剧化的方式暴露出来。
企业落地让问题更尖锐
如果 Fable 5 只是一个聊天模型,这件事已经够大。
但 Anthropic 同时还在推进另一条线:把 Claude 带进受监管行业。
6 月 12 日,Anthropic 宣布与 Tata Consultancy Services 合作。TCS 将向 50,000 名自身员工提供 Claude,并为金融服务、医疗、公营部门、航空、电信等 regulated industries 构建 Claude-powered products。
这条新闻看起来是企业合作,但放在 Fable/Mythos 事件旁边,它变成了另一个信号。
前沿 AI 不再只是个人效率工具。它正在进入银行、医疗、公共服务、航空和电信这类需要审计、责任、权限和稳定性的系统。
越靠近核心系统,停止权越重要。
但停止权也越不能粗糙。
如果一个模型被深度嵌入企业流程,突然叫停就不只是产品不可用,而是客户流程、员工权限、合同交付、跨境协作和合规审计的问题。社区讨论里关于 foreign national 的争议,正是这个问题的早期表现:当访问边界按国籍、地点或身份切开,一个全球化 AI 公司和它的客户组织会立刻遇到运行层面的断裂。
所以企业以后看前沿模型,不能只问“它有多强”。
还要问五个更底层的问题:
第一,谁有权发布?
第二,谁能访问?
第三,谁负责监测?
第四,谁能叫停?
第五,叫停后谁能恢复,依据是什么?
这些问题回答不清,模型越强,企业越不敢把它放进真正不能出错的地方。
Anthropic 的风险叙事也被反噬
这件事还有一个微妙之处。
Anthropic 一直是最强调前沿 AI 风险的公司之一。它反复谈网络安全、生物风险、模型自我改进和高级能力的治理边界。Fable/Mythos 发布页本身也写了很多 safeguard、classifier、jailbreak、trusted access 和 30-day retention。
这些叙事有价值,因为它逼迫行业认真面对风险。
但它也会带来反作用。
当一家公司不断告诉公众和政府“我们的模型可能很强,也可能很危险”,政府最终真的按危险资产来处理它时,公司就不能假设对方会完全接受自己的发布节奏。
这不是说 Anthropic 不该透明。
恰恰相反,透明是必要的。但透明之后,需要有更稳定的共同评估机制。否则公司越诚实地描述风险,越容易被临时性行政动作打断;公司越少说风险,公众越不信任公司。
这就是前沿 AI 治理最难的地方。
以后看模型发布,要看停止机制
过去两年,模型发布新闻通常围绕 benchmark、价格、上下文长度、代码能力、图像能力、工具调用和 agent 能力展开。
Fable 5 之后,至少还要多看一层:
这个模型有没有可信的停止机制?
停止机制不是一句“我们重视安全”。它应该包括:
- 风险域分级;
- 用户和组织访问分级;
- 安全监测和日志边界;
- 独立测试和复核;
- 政府介入的证据门槛;
- 暂停后的申诉、修复和恢复路径;
- 对企业客户和国际用户的运行影响预案。
没有这些,发布权和停止权就会互相冲撞。
公司会觉得政府过度干预;政府会觉得公司过度自信;客户会觉得自己被迫承担中断风险;公众会继续不信任任何一方。
Fable 5 的 72 小时,不一定会成为长期禁令。Anthropic 也说自己正在努力恢复访问。
但这件事已经留下了一个清楚信号:
前沿 AI 的下一轮竞争,不只是能力竞争,而是制度竞争。
谁能把发布、访问、监测、叫停、恢复和责任归属做成可信系统,谁才有资格把最强模型带进真实世界。
参考
- Anthropic: Claude Fable 5 and Claude Mythos 5
- Anthropic: Statement on the US government directive to suspend access to Fable 5 and Mythos 5
- Anthropic: Results from the first Anthropic Public Record
- Anthropic: TCS and Anthropic partner to bring Claude to regulated industries
- Axios: How Amazon and the White House ended Anthropic’s Fable
- The Hacker News: U.S. Orders Anthropic to Suspend Fable 5 and Mythos 5 Access for Foreign Nationals