麻省理工科技评论 26-04-03 10:33
微博认证:《麻省理工科技评论》杂志官方微博

#谷歌发布gemma4开源大模型# 【谷歌重磅发布Gemma 4开放权重模型,开源协议升级,生态场景全覆盖】

当地时间 4 月 2 日,谷歌 #DeepMind# 正式发布 #Gemma4# ,这是一个全新的开放权重模型系列。谷歌还做出了一个关键决定:采用 Apache 2.0 许可证,彻底放弃了之前备受争议的限制性条款。作为外部人士的 Hugging Face 联合创始人兼 CEO Clément Delangue 评价称:“Gemma 4 以 Apache 2.0 许可证发布是一个重要的里程碑。”

这意味着企业可以自由部署、修改和商用,不用担心谷歌哪天改规则。在谷歌迄今为止所有的模型中,Gemma 4 是目前最强大的开放权重模型系列,继承了前沿多模态、长上下文和高级推理能力,被谷歌官方称之为是“在逐字节比较下性能最强的”开放模型(Byte for byte, the most capable open models),填补了本地前沿智能的空白,与追求极致性能的 Gemini 云端模型共同构成了完整生态。

Gemma 4 一口气发布了四个版本,覆盖了从手机到工作站的全部场景。

工作站这边有两个大模型:一个是 310 亿参数的稠密模型,追求最高输出质量;另一个是 260 亿参数的混合专家模型,它里面有 128 个小型专家,每次推理只激活其中一小部分,实际只跑 38 亿参数,跑起来时速度更快,适合对于速度要求较高的场景。两个大模型都支持图像输入,上下文窗口达到 25.6 万 tokens,可以一次性处理一整份长文档或一个代码仓库。

边缘设备这边有两个小模型,叫 E2B 和 E4B。E2B 实际上有 51 亿参数,但是通过一种叫做每层嵌入的技术,在运行时只发挥 23 亿参数的计算量,效率和速度跟小模型一样,但其智能水平远超同尺寸模型;E4B 同理,80 亿参数能够跑出 45 亿参数的效果。这两个小模型还特别增加了音频输入能力,可以直接做语音识别和翻译,全部在设备本地运行,不需要联网。

戳链接查看详情:http://t.cn/AXITQSq1