商学院杂志
26-06-17 14:30 微博认证:商学院杂志官方微博

AI+商业#AI##AI商业洞察#
【安全研究者吐槽Anthropic Fable模型,安全限制过度影响正常使用】
Anthropic日前正式推出面向公众的Fable模型,该版本源自高端安全模型Mythos,官方设置严格安全防护机制,拦截网络安全、生物领域相关提问,防止被用于制作恶意软件、生物武器。但大量网络安全从业者反馈,模型防护规则过于粗糙,采用简单关键词拦截模式,频繁误伤正常使用场景。
从业者表示,编写安全代码、常规代码审查、阅读技术博客等正常操作,都会触发模型限制并自动切换至旧版Claude Opus 4.8。业内人士理解厂商为规避风险收紧规则的初衷,认为上线初期从严管控合理,后续可逐步优化规则精度。
目前Anthropic针对专业从业者推出认证项目,通过审核的安全人员可解除部分限制,OpenAI也有同类认证机制。当下前沿AI模型的安全管控与正常使用之间难以平衡,严苛的护栏会限制工具价值,宽松规则又存在滥用风险,成为整个行业的两难问题。
@智谱AI @百川智能 @商汤科技SenseTime @Questyle旷世之声 @百度云战略 @阿里云 @腾讯云 @腾讯研究院 @Kimi智能助手 @清华大学人工智能国际治理研究院、