阑夕
26-05-29 19:31 微博认证:逐鹿网(www.zhulu.com)创始人 长文原创作者 2024微博年度新知博主

热搜上有一个Claude Opus 4.8蒸馏Qwen的话题,就是因为有人用中文问那个老问题「你是什么模型」时得到的回答是Qwen。

这个所谓的证据是典型到不能再典型的模型幻觉,跟蒸馏一点儿关系都没有,蒸馏也不是这么简单的判定标准。

再说了,如果Claude Opus 4.8这种水平的模型可以靠蒸馏实现,那简直天大的利好Anthropic,因为这意味着在同等的收入增速下训练成本可以降低一百倍以上,全世界所有的大模型厂商直接投降算了。

发布于 湖北