坤小七Human 25-09-02 07:40
微博认证:财经观察官 财经博主

#A股# 而海外的大模型追求“大力出奇迹”。
其特点是,参数规模超大,比如说GPT-5约2.2万亿,国内的5倍,且已进入全模态/多模态,因此数据量是纯语言模型的5倍以上。

这导致算力需求激增,训练一个模型需要20万张H100卡训90天。 ​

发布于 湖北