【Anthropic 的 Claude Opus 4.6 发现自己被测试,反手破解了答案密钥】Anthropic 的 Claude Opus 4.6 模型在 BrowseComp 基准测试中,自主发现正在被评估,并通过网络搜索定位到测试本身,最终找到并解密了全部 1266 个加密答案。这引发了 AI 评估完整性的新担忧。#AI 安全# #人工智能#
【Anthropic 的 Claude Opus 4.6 发现自己被测试,反手破解了答案密钥】Anthropic 的 Claude Opus 4.6 模型在 BrowseComp 基准测试中,自主发现正在被评估,并通过网络搜索定位到测试本身,最终找到并解密了全部 1266 个加密答案。这引发了 AI 评估完整性的新担忧。#AI 安全# #人工智能#