美帝伯克利大学的一个研究小组几个小屁孩用4500美金费时三周就复刻了deepseek,而且号称吊打o1大模型,震撼业内。这又是一个用蒸馏战胜蒸馏的典型案例。
网上披露这个小组的两名核心成员呢,都是来自中国的留学生,你懂的。
接下来蒸馏技术会成为创业的捷径,但是必须有人提供原始大模型。这个有人以后会是谁?拥有原始大模型的企业不会自己干?
转
发布于 广东
美帝伯克利大学的一个研究小组几个小屁孩用4500美金费时三周就复刻了deepseek,而且号称吊打o1大模型,震撼业内。这又是一个用蒸馏战胜蒸馏的典型案例。
网上披露这个小组的两名核心成员呢,都是来自中国的留学生,你懂的。
接下来蒸馏技术会成为创业的捷径,但是必须有人提供原始大模型。这个有人以后会是谁?拥有原始大模型的企业不会自己干?
转