蚁工厂 26-04-25 10:01
微博认证:科技博主

算力差距啊……[苦涩]
DeepSeek-V4-Pro 的预训练计算量可粗略估为约 1e25 FLOPs。若拿 OpenAI的 10 万台 GB200 ,哪怕只用约 15% 的平均有效利用率,完成等量计算只需要约 37 小时。

#AI创造营##How I AI# ​

发布于 山东