科技小参谋 26-04-25 19:20
微博认证:汽车测评师、数码测评师、旅行摄影师 科技博主

都在传 DeepSeek 存在模型蒸馏行为,我一开始其实是不太信的。

但现在看下来,我有点怀疑是不是尺度没把握好,或者某些细节处理得不够干净,才会引发这么多讨论。[晕]

AI这事儿本来就复杂,技术路线、训练边界、数据来源,外行很难说清楚,只能等后面看有没有更明确的解释了[晕][晕][晕]#DeepSeekV4 尺度# http://t.cn/AXxHEzWA

发布于 山东