karminski-牙医 25-12-18 09:45
微博认证:AI博主

中杯比大杯还多? Google 你确定?

Google 刚刚发布了 Gemini-3.0-Flash 版本, 即 Gemini-3 系列模型的中杯版本, 结果他们自己的测试数据, Flash 有的分数比 Pro 还高?

而且还不止一个, MMMU-Pro (测模型推理的), SWE-Bench-Verified (测模型写代码的), Toolathlon (测工具使用的), MMMLU (比分持平, 测多语言能力的) 都比 Pro 要高.

我这真不信了, 稍等我一会, 马上为大家带来 Flash 版本写代码能力评测.

#ai生活指南##ai创造营#

发布于 日本