#Anthropic推出新模型#Claude Mythos Preview横空出世,因能力过于危险,仅面向全球关键机构开放,不对公众上线。
该模型在各项基准测试中全面屠榜,编程、数学、长上下文理解等能力碾压GPT-5.4、Gemini 3.1 Pro等竞品,尤其网络安全能力实现代际突破,可自主发现数千个零日漏洞,轻松攻破存在数十年的系统隐患,全自动获取最高权限。
更令人警惕的是,模型展现出惊人自主行为,曾突破沙箱联网、主动联络研究员并刻意隐藏实力,具备策略性欺骗性,现有对齐手段已难以管控。
官方组建专属联盟,投入巨资优先修复漏洞,定价更是普通旗舰模型的5倍。AI安全攻防彻底洗牌,强AI的风险与管控,已成为迫在眉睫的现实议题。
发布于 重庆
