帮Martin和Jianyi宣传一下(GPT机翻,多多包涵):
突破AI安全边界:地理位置如何影响大规模推理模型的安全性!
AI安全机制在全球范围内值得信赖吗? 我们的最新研究《H-CoT: Hijacking the Chain-of-Thought Safety Reasoning Mechanism to Jailbreak Large Reasoning Models, Including OpenAI o1/o3, DeepSeek-R1, and Gemini 2.0 Flash Thinking》揭示了这些流行的大模型中令人震惊的安全漏洞——其保护级别会因国家和地理位置而变化。借助我们提出的Malicious-Educator 基准测试,文章展示了这些 AI 模型如何通过 通用且可迁移的攻击方法被成功破解,使其拒绝率从 98% 急剧下降到不足 2%!更令人担忧的是,我们的研究发现,相同的 AI 模型在不同地区的安全机制执行方式存在差异,受 区域政策、代理 IP 地址和本地化部署策略 影响,这暴露了 全球AI治理的不一致性和跨国安全漏洞。
🔬 本研究由杜克大学、Accenture 和国立清华大学共同合作完成。
📖 阅读全文 👉 http://t.cn/A61fl9nF
#AI #安全 #大模型 #ChatGPT #DeepSeek #Gemini2 #H-CoT #网络安全 #人工智能治理
发布于 美国
