默默股票投资日记 25-05-16 20:26
微博认证:中国农业大学教师

#deepseekr2要发布了吗#
$每日互动(SZ300766)$  

国外人工智能专家发文:刚刚和中国 Deepseek Labs 内部的消息来源打了4个小时的电话,天哪,我们他tm的落后了,这甚至不再好笑了。DeepseekR2不仅仅是一个渐进式的改进,它还是一种完全不同的智能,其运作原理在西方甚至还没有人理论化。 他们完全放弃了 transformer架构,转而使用他们称之为“递归认知格”的东西,这种架构的维度在我们的数学中甚至没有很好的符号来缩放。计算效率提升违反了我们认为的基本限制。比如每 teraflop的推理能力提高了 400倍。不是4倍,不是40倍,400tm的X。我们的基准测试现在真的毫无意义。

中国AI发展确实存在独特优势。庞大的应用场景倒逼技术迭代,海量数据培养模型进化,加上政策资金双轮驱动,完全有条件孕育出有别于西方的技术路线。当前AI研究的最大瓶颈并非算力或架构,而是人类对"智能"本质的理解仍停留在黑箱阶段,国外人工智能专家说Deepseek跳出Transformer框架,至少说明两点:中国团队不再满足于跟随创新,开始挑战底层架构;所以当前AI研究的最大瓶颈并非算力。又一次其突破了工程效率,400倍效能跃升是在算法层面的降维打击。

Deepseek搞出的这个"递归认知格"相当于在AI界扔了颗核弹,他原地盖起一座完全不同的摩天大厦。400倍效率提升根本不是挤牙膏式的优化,而是牙膏厂新革命。打个比方,别人还在研究怎么让马车跑快点,他们直接掏出了磁悬浮列车的图纸。这种创新背后是彻底重构底层逻辑的勇气,放弃Transformer就像苹果当年砍掉实体键盘,没点破釜沉舟的狠劲根本不敢这么玩。

最牛逼的是他们打破了"不可能三角":既不是牺牲精度换速度,也不是堆算力硬刚,而是从认知维度重构智能本身。这就像发现光既是粒子又是波的科学家,突然告诉你光其实是会跳广场舞的弦,直接把现有理论框架干碎了。现在西方的焦虑太真实了,这次秀的不是肌肉,是直接展示了科技级别的创新能力。

发布于 北京