再接之前的微博:美国人的 AI 大模型用力大飞砖的路线,不能说是错的,毕竟 OpenAI 的 GPT 和 A畜家那几个,的确都是世界顶尖的水平
因为现在 AI 大模型都有很急迫的商业化需求,人家用资源的浪费去换时间,也是一条正确的路
只不过我们国家受制于是美国的围追堵截,尤其 DeepSeek 这样的小公司,根本拿不到多少算力,所以才需要从 AI 大模型的本源思考,做更多的底层架构创新,用 1/10 甚至 1% 的算力做出来差不多的模型能力
只不过马斯克在力大飞砖那条路上没走成功而已,因为即使力大飞砖,也需要对于方向的精确把控,以及工程能力上的精益求精
Grok 配置的算力不可谓不豪华,你拿给 Deepseek用,早就干出来一个震古烁今的模型
但是干了这么多年,就始终拿不到顶尖的位置,有什么办法呢?
发布于 北京
