#A股# 而海外的大模型追求“大力出奇迹”。
其特点是,参数规模超大,比如说GPT-5约2.2万亿,国内的5倍,且已进入全模态/多模态,因此数据量是纯语言模型的5倍以上。
这导致算力需求激增,训练一个模型需要20万张H100卡训90天。
发布于 湖北
#A股# 而海外的大模型追求“大力出奇迹”。
其特点是,参数规模超大,比如说GPT-5约2.2万亿,国内的5倍,且已进入全模态/多模态,因此数据量是纯语言模型的5倍以上。
这导致算力需求激增,训练一个模型需要20万张H100卡训90天。