帮Martin和Jianyi宣传一下（GPT机翻，多多包涵）：突破AI安全边界：地理位置如何影响大规模推理模型的安全性！AI安全机制在全球范围内值得信赖吗？我们的最新研究《H-CoT: Hijacking the Chain-of-Thought Safety Reasoning Mechanism to Jailbreak Large Reasoning Models, Including OpenAI o1/

帮Martin和Jianyi宣传一下（GPT机翻，多多包涵）：

突破AI安全边界：地理位置如何影响大规模推理模型的安全性！

AI安全机制在全球范围内值得信赖吗？我们的最新研究《H-CoT: Hijacking the Chain-of-Thought Safety Reasoning Mechanism to Jailbreak Large Reasoning Models, Including OpenAI o1/o3, DeepSeek-R1, and Gemini 2.0 Flash Thinking》揭示了这些流行的大模型中令人震惊的安全漏洞——其保护级别会因国家和地理位置而变化。借助我们提出的Malicious-Educator 基准测试，文章展示了这些 AI 模型如何通过通用且可迁移的攻击方法被成功破解，使其拒绝率从 98% 急剧下降到不足 2%！更令人担忧的是，我们的研究发现，相同的 AI 模型在不同地区的安全机制执行方式存在差异，受区域政策、代理 IP 地址和本地化部署策略影响，这暴露了全球AI治理的不一致性和跨国安全漏洞。

🔬 本研究由杜克大学、Accenture 和国立清华大学共同合作完成。
📖 阅读全文 👉 http://t.cn/A61fl9nF

#AI #安全 #大模型 #ChatGPT #DeepSeek #Gemini2 #H-CoT #网络安全 #人工智能治理

发布于美国