新智元
25-06-09 22:37 微博认证:新智元官方微博

最近,苹果公司发表了预印本论文,指出推理大模型存在重大缺陷。

昨天,Ruben Hassid发布了相关解读的X帖子,认为这是项突破性研究:苹果证明了Claude等AI推理模型,根本不会思考。这种解读在社交平台上广泛传播,浏览量已超过1000万,且仍在持续增长。

但这种解读翻车了!在Reddit和黑客新闻,网友纷纷表示论文争议太大。

GitHub高级工程师Sean Goedecke,对该论文持保留态度,尽管他也认为语言模型不是通往超级智能(ASI)的理想路径。

最直接的例证是:当用DeepSeek-V3测试时,模型直接拒绝了要执行上千步的谜题推演——这并非推理能力崩溃,反而说明模型具备对自身能力边界的认知!

http://t.cn/A6eoziuN