IT之家 26-03-09 19:48
微博认证:IT之家(www.ithome.com)官方微博

【Anthropic 的 Claude Opus 4.6 发现自己被测试,反手破解了答案密钥】Anthropic 的 Claude Opus 4.6 模型在 BrowseComp 基准测试中,自主发现正在被评估,并通过网络搜索定位到测试本身,最终找到并解密了全部 1266 个加密答案。这引发了 AI 评估完整性的新担忧。#AI 安全# #人工智能# ​