Claude Fable 5将于7月1日全球重新上线
6月30日,美国人工智能公司Anthropic宣布,其最新模型Claude Fable 5的出口管制已正式解除。该模型将于7月1日起向全球用户重新开放。
6月9日,Anthropic正式推出Claude Fable 5和Claude Mythos 5。其中Fable 5是面向普通用户的安全版本,搭载了公司史上最强的防护措施;而Mythos 5则仅限少数可信的Project Glasswing合作伙伴用于防御性网络安全研究。6月12日,美国政府因发现Fable 5存在潜在越狱漏洞而实施出口管制,要求限制外国国民访问。由于无法实时验证用户国籍,公司被迫暂停所有用户对两款模型的访问。
根据最新公告,Fable 5将于7月1日起在Claude Platform、Claude.ai、Claude Code和Claude Cowork等平台全球可用。对于Pro、Max、Team及部分Enterprise计划用户,在7月7日前可免费使用Fable 5(占每周限额的50%),之后需通过使用积分访问。公司还将尽快在AWS、Google Cloud和Microsoft Foundry等云平台恢复支持。同时,Mythos 5已恢复对部分美国组织的访问,Anthropic正继续与政府合作扩大Glasswing计划的覆盖范围。
为应对此前报告的越狱方法,Anthropic已训练了改进的安全分类器。新分类器能以超过99%的成功率阻挡相关行为,被阻挡的请求将自动回退到Claude Opus 4.8模型处理。公司承认,新分类器短期内可能导致部分常规编码和调试任务被误判,从而影响用户体验。他们承诺将持续优化分类器,减少误报,同时更好地区分恶意使用与合法请求。
Anthropic强调,Fable 5本身并未提供独特的进攻性网络能力,其防护采用“纵深防御”策略,包括训练拒绝危险请求、实时分类器拦截等多重机制。测试显示,许多较弱模型也能完成报告中提到的漏洞识别任务。此次事件也促使行业行动:Anthropic正与亚马逊、微软、谷歌等Glasswing合作伙伴共同制定行业共识框架,从能力增益、能力广度、武器化难度和可发现性四个维度评估越狱的严重程度。该框架旨在帮助开发者更安全地发布模型,并为政府提供一致的风险沟通标准。
此外,公司将进一步加强与美国政府的合作,包括模型预发布测试、信息共享和联合研究等。Anthropic在公告中感谢用户的耐心,并表示将致力于在确保安全的前提下,让先进AI能力惠及更多人。此次事件凸显了AI前沿模型在国家安全与商业部署之间的复杂平衡,随着更多高能力模型的推出,类似协商与标准制定预计将成为行业常态。
