安全研究者吐槽Fable模型

AI+商业#AI##AI商业洞察#
【安全研究者吐槽Anthropic Fable模型，安全限制过度影响正常使用】
Anthropic日前正式推出面向公众的Fable模型，该版本源自高端安全模型Mythos，官方设置严格安全防护机制，拦截网络安全、生物领域相关提问，防止被用于制作恶意软件、生物武器。但大量网络安全从业者反馈，模型防护规则过于粗糙，采用简单关键词拦截模式，频繁误伤正常使用场景。
从业者表示，编写安全代码、常规代码审查、阅读技术博客等正常操作，都会触发模型限制并自动切换至旧版Claude Opus 4.8。业内人士理解厂商为规避风险收紧规则的初衷，认为上线初期从严管控合理，后续可逐步优化规则精度。
目前Anthropic针对专业从业者推出认证项目，通过审核的安全人员可解除部分限制，OpenAI也有同类认证机制。当下前沿AI模型的安全管控与正常使用之间难以平衡，严苛的护栏会限制工具价值，宽松规则又存在滥用风险，成为整个行业的两难问题。
@智谱AI @百川智能 @商汤科技SenseTime @Questyle旷世之声 @百度云战略 @阿里云 @腾讯云 @腾讯研究院 @Kimi智能助手 @清华大学人工智能国际治理研究院、