宝玉xp 26-02-24 03:20
微博认证:前微软Asp.Net最有价值专家 2025微博年度新知博主 科技博主

Anthropic 发布调查报告,称发现 DeepSeek、月之暗面(Moonshot/Kimi)和 MiniMax 三家中国 AI 实验室,通过大规模"蒸馏攻击"非法提取 Claude 模型的能力来训练自家模型。

三家公司共创建了约 2.4 万个虚假账户,与 Claude 产生超过 1600 万次对话交互。

所谓"蒸馏",就是用强模型的输出来训练弱模型——相当于让学生抄优等生的作业来提高成绩。

这种方法本身是合法的训练技巧,各大 AI 公司也用它来制作自家模型的轻量版本,但未经授权对竞争对手的模型进行蒸馏则违反了服务条款。

三家公司的操作手法类似:通过代理服务绕过 Anthropic 对中国的访问限制,用大量虚假账户分散流量以躲避检测。

其中 MiniMax 规模最大,产生超过 1300 万次交互,主要提取编程和工具使用能力;月之暗面超过 340 万次,瞄准智能体推理和计算机视觉;DeepSeek 虽然量级最小(15 万次),但手法最值得关注——他们让 Claude 反向“复述”自己的推理过程来生成思维链训练数据,还让 Claude 生成政治敏感问题的"安全回答",疑似用于训练自家模型的审查回避能力。

Anthropic 表示已通过 IP 地址、请求元数据等信息将攻击溯源到具体实验室甚至具体研究人员,并称这一发现说明中国 AI 公司的快速进步并非完全靠自主创新,也在一定程度上依赖对美国模型能力的提取。

不过这件事也引来了嘲讽。马斯克在 X 上转发 Anthropic 的公告,评论道:“他们怎么敢偷 Anthropic 从人类程序员那里偷来的东西??”

讽刺 AI 公司指控别人蒸馏自家模型,自己当初训练模型时却大量使用了人类创作者的数据,颇有五十步笑百步的意味。

详情:http://t.cn/AXcUObtR

发布于 美国