【清华学霸拒了马斯克,造出 2700 万参数的 "反内卷 AI",直接碾压大模型!】
#人工智能##ai兴趣创作计划#
卧槽!AI 圈炸了个大新闻!新加坡一家公司搞出个叫 HRM 的模型,参数才 2700 万,却把一堆动辄百亿、千亿参数的大模型按在地上摩擦 —— 复杂推理题直接干翻 o3-mini-high,连马斯克都挖不动的清华学霸带队,这波操作太秀了!
说它 "反内卷" 真不是吹的:
普通大模型解题靠 "思维链",一步错步步错,就像做题时必须边念叨边写,傻得很;
但 HRM 学了人脑的骚操作,搞 "隐性推理"—— 就像你在心里默默算题,不用念出来,还分了高低层模块分工:高层定策略,低层算细节,效率直接拉满!
实测数据离谱到离谱:
✅ 极限数独、高难度迷宫:先进思维链模型准确率 0%,HRM 训练 1000 样本就接近完美
✅ ARC-AGI 抽象推理测试:40.3% 得分远超 o3-mini-high(34.5%)和 Claude 3.7 Sonnet(21.2%)
关键是它根本不用海量数据喂,小而精得像 AI 界的特种兵!
背后团队更绝:
创始人王冠是清华学霸,之前做的 7B 开源模型 OpenChat 火到被马斯克盯上,结果人家直接拒了 XAI 的橄榄枝,转头创业搞大事
现在团队里全是 XAI、Deepmind、Google 出来的大佬,全是玩过 AlphaGo、Gemini 的狠角色
网友已经吵疯了:
"这太疯狂了!不玩 token 还能吊打 Claude 和 Gemini?"
"这论文要是实锤了,就是 AI 界的哲学革命 —— 效率终于能打赢蛮力了!"
更可怕的是它还贼便宜:训练专业数独能力才 2 个 GPU 小时,任务速度比传统模型快 100 倍!以后机器人、医疗诊断这些领域,怕是要变天...
现在问题来了:这波 "小模型逆袭",会不会让疯狂堆参数的 AI 大厂集体破防?
