中杯比大杯还多? Google 你确定?
Google 刚刚发布了 Gemini-3.0-Flash 版本, 即 Gemini-3 系列模型的中杯版本, 结果他们自己的测试数据, Flash 有的分数比 Pro 还高?
而且还不止一个, MMMU-Pro (测模型推理的), SWE-Bench-Verified (测模型写代码的), Toolathlon (测工具使用的), MMMLU (比分持平, 测多语言能力的) 都比 Pro 要高.
我这真不信了, 稍等我一会, 马上为大家带来 Flash 版本写代码能力评测.
#ai生活指南##ai创造营#
发布于 日本
