25-03-02 20:51 微博认证:清华大学教授,AMiner创始人 唐杰

最近很多人问DeepSeek(DS)对AI发展的影响,首先DeepSeek V3和R1是一个源自国内的非常优秀的工作;其次总体上大模型的发展Scaling Law本质未变,模型效果还是在于超大规模高质量数据训练,现在增加了对超大规模数据的推理Scaling;另外要坚决重视工程和技术基础设施建设,这样才能让一个优秀的工作经得起时间的考验。

DS对很多公司都可能有影响,包括:直接的所谓AI六小龙(尽管我觉得没啥龙,大家都是做事而已)、国央企、政府、小企业以及ISV、ASP。总体来说对大家可能都是好事, DS使得盘子更大,所有人都机会更多;智谱节后签约已经过亿,比去年同期增长了好几倍,API平台的付费DAU增长了30%,很快也将发布新模型。总体来说是所有人对AGI的认知上去了,更想投入大模型了。

国央企和政府的影响是所有人都想用AI,都想接入,但大家一致口径是“不是免费了吗?”哈哈,这也是,不知道怎么想的。

ISV和ASP是激活了,以前大家都比较观望,而且总想着是大模型公司帮他们弄,他们试试,现在激活了用户,他们自然激活了,天天打了鸡血一样。

3. 基础设施:DS对于做基础设施的也是个特别利好的事情,貌似所有的做云服务的公司都涨停、一片繁荣。尽管ds看起来好像节省了算力,但更重要的是激活了用户认知,让大家看到了AGI的希望,所有算力公司貌似都在拼命加仓,算力开始重新成为炙手可热的事情,前一个月还在为算力闲置而发愁的公司,现在却纷纷加大投入,继续疯狂建仓,仿佛算力就是通往未来的金钥匙。

4. 理论研究:DeepSeek的成功不仅激发了产业界的热情,也让学术界为之一振。它让大学和研究机构意识到了大模型基础理论和技术的重要性。各个大学纷纷加大投入,尤其是理论研究,看来理解AGI的本质就在眼前了。。。大家一起加油。AGI是一个马拉松,我们要调整好节奏,分配好体力,调整心态。

发布于 北京