谷歌开源扩散模型

DiffusionGemma｜Google开源扩散模型

大新闻！Google刚刚开源了一个叫DiffusionGemma的模型，直接把AI生成文本的方式给颠覆了！

谷歌称，DiffusionGemma定位为面向研究者和开发者的实验性模型，整体输出质量低于标准Gemma 4，生产环境仍建议使用后者。该模型的速度优势主要体现于本地及低并发推理场景，在高并发云端部署中优势有限。

别的AI是一个字一个字往外蹦（像打字机），它是一下子铺开一整段，像印刷机一样整版整版地出！
速度直接原地起飞，快了整整4倍！🔥

快4倍是什么概念？
在单张顶级的NVIDIA H100显卡上，它能跑到每秒1000个Token以上！
就算是在咱普通玩家能摸到的RTX 5090上，也能达到每秒700+ Token。
这速度，基本告别转圈加载了

咋做到的？秘诀就两个字：并行。
传统AI只能从左到右看，但DiffusionGemma像一个天才画家，直接铺开一张有256个Token的“画布”，然后多轮“去噪”，整段文字同时浮现，边画边改，效率超高！
这就叫“双向注意力”，能实时自我纠错，比如让它做数独，成功率从0直接飙到80%！

谷歌很实在，直接说了：追求极致质量，首选标准Gemma 4；但这匹新“赛马”是为本地、实时、速度敏感的场景而生的。
关键它还开源！采用允许商用的Apache 2.0协议，权重已经可以在Hugging Face下载了。
一个能改变AI应用格局的新物种来了！你准备好了吗？

資料來源 http://t.cn/AXS7UXHU

发布于中国台湾