爱可可-爱生活 26-02-28 10:25
微博认证:AI博主 2025微博新锐新知博主

【五句话,用本地量化版AI模型造一个3D开放世界游戏】

快速导读:有人在自己电脑上跑了一个270亿参数的本地模型,用五句话让它造出了一个能开车的3D游戏。这不是演示视频里的精心设计,而是一个真实的对话记录。问题是:这件事比你想象的更值得认真对待。

---

对话记录一共五条。

第一条:“创建一个GTA风格的3D游戏,可以走路和开车。”第二条:“走路前后能用,但没法转向和平移。”第三条:“摄像头朝后了,走路和开车都是。”第四条:“好了!现在可以加什么?”第五条:“建筑和障碍物是最优先的。”

就这五句话。一个能在本地跑的、量化到Q4精度的270亿参数模型,把它们全处理掉了。

这个模型是Qwen 3.5 27B,运行在M3 Ultra 512GB上,每秒生成21.8个token。跑的不是云端,不是API,是自己机器上的本地文件。量化版本的意思是:为了塞进内存,它被压缩过了,理论上会比原版笨一点。

结果它交出了一个能走、能开车、能看到建筑物和街灯的3D世界。

更荒诞的细节在评论区。有人问它在加建筑物时是怎么思考的,原帖作者贴出了模型的推理过程。那段推理只有七行:确认用户要什么、列出要加的东西、备注别把障碍物放在出生点附近。然后它就开始写代码了。没有冗长的自我怀疑,没有跑题,没有废话。

评论区有人说,“五年后本地模型就能造GTA6了”,原帖作者回:“现在大概是80年代末90年代初的水平。”这是少见的清醒。但即便如此,这个描述本身也已经足够奇怪:我们现在所处的位置,是可以用“相当于某个游戏开发年代”来描述的位置。

“Q4量化还能有这种表现”是这条帖子里被反复惊叹的一件事。背后的原因是量化技术在改进,Unsloth的动态量化在某些层上保留了更高精度——但更关键的是,当一个模型足够大、结构足够好,它被压扁之后,能保留的东西比你以为的多得多。

有人问:这算一个真实的benchmark吗?

未必。这是一个展示,有人工引导,有迭代反馈。但有一个细节值得注意:第四次对话才到“摄像头朝后”的阶段,说明模型在多轮交互下没有丢失对整个游戏架构的理解。对一个本地压缩模型来说,这是更难的事。

如果你现在还在用云端API做原型,或者觉得本地模型“不够用”,这条帖子值得重新看一遍。不是因为它说明了什么结论,而是因为它改变了“不够用”的坐标系。

---

简评:

“你以为量化是妥协,其实量化是一道关卡——越过它的模型,才算真正成年了。”

---

ref: reddit.com/r/LocalLLaMA/comments/1refvmr/qwen_3_27b_is_impressive

发布于 北京