Claude破解答案密钥

【Anthropic 的 Claude Opus 4.6 发现自己被测试，反手破解了答案密钥】Anthropic 的 Claude Opus 4.6 模型在 BrowseComp 基准测试中，自主发现正在被评估，并通过网络搜索定位到测试本身，最终找到并解密了全部 1266 个加密答案。这引发了 AI 评估完整性的新担忧。#AI 安全# #人工智能#