美团开源大模型LongCat 在真实物理任务上接近 Opus 4.8 和 GPT 5.5 的水平 。
让 4 个模型写同样的三个 HTML5 Canvas 物理场景(加农炮轰砖墙、保龄球撞球瓶、龙卷风)
LongCat 的效果和顶级模型差不多。 http://t.cn/AXowcXGV
发布于 广东
美团开源大模型LongCat 在真实物理任务上接近 Opus 4.8 和 GPT 5.5 的水平 。
让 4 个模型写同样的三个 HTML5 Canvas 物理场景(加农炮轰砖墙、保龄球撞球瓶、龙卷风)
LongCat 的效果和顶级模型差不多。 http://t.cn/AXowcXGV