蚁工厂
26-06-26 08:53 微博认证:科技博主

前OpenAI大佬、现Thinking Machines Lab 联合创始人Lilian Weng(翁荔)终于又发技术博文了:Scaling Laws, Carefully
地址:lilianweng.github.io/posts/2026-06-24-scaling-laws/

“一篇超级迟来的(超过3年?)关于规模定律的文章。

算力成本高昂。规模定律是一种帮助我们在大规模运行之前,合理规划数据和模型大小之间最优算力分配的方法。

本文涵盖了规模定律的预测内容、计算最优分配的原理、为何Kaplan等人与Chinchilla存在分歧,以及数据限制与拟合细节如何使外推变得棘手。”
#How I AI#

发布于 山东