DiffusionGemma|Google开源扩散模型
大新闻!Google刚刚开源了一个叫DiffusionGemma的模型,直接把AI生成文本的方式给颠覆了!
谷歌称,DiffusionGemma定位为面向研究者和开发者的实验性模型,整体输出质量低于标准Gemma 4,生产环境仍建议使用后者。该模型的速度优势主要体现于本地及低并发推理场景,在高并发云端部署中优势有限。
别的AI是一个字一个字往外蹦(像打字机),它是一下子铺开一整段,像印刷机一样整版整版地出!
速度直接原地起飞,快了整整4倍!🔥
快4倍是什么概念?
在单张顶级的NVIDIA H100显卡上,它能跑到每秒1000个Token以上!
就算是在咱普通玩家能摸到的RTX 5090上,也能达到每秒700+ Token。
这速度,基本告别转圈加载了
咋做到的?秘诀就两个字:并行。
传统AI只能从左到右看,但DiffusionGemma像一个天才画家,直接铺开一张有256个Token的“画布”,然后多轮“去噪”,整段文字同时浮现,边画边改,效率超高!
这就叫“双向注意力”,能实时自我纠错,比如让它做数独,成功率从0直接飙到80%!
谷歌很实在,直接说了:追求极致质量,首选标准Gemma 4;但这匹新“赛马”是为本地、实时、速度敏感的场景而生的。
关键它还开源!采用允许商用的Apache 2.0协议,权重已经可以在Hugging Face下载了。
一个能改变AI应用格局的新物种来了!你准备好了吗?
資料來源 http://t.cn/AXS7UXHU
发布于 中国台湾
