唐杰THU
23-12-24 08:24 微博认证:清华大学教授,AMiner创始人 唐杰

Google的Gemini Report,60多页,要卷的人看一下。Gemini: A Family of Highly Capable Multimodal Models。http://t.cn/A6lN39Wd

这篇论文介绍了一种名为Gemini的新型多模态模型家族,该家族在图像、音频、视频和文本理解方面表现出卓越的能力。Gemini家族包括Ultra、Pro和Nano三种尺寸,适用于从复杂推理任务到设备内存受限用例的应用程序。在广泛的一组基准测试中,我们最强大的Gemini Ultra模型在32个基准测试中的30个上推进了最先进水平——值得注意的是,首次在广受研究的考试基准MMLU上实现了人类专家性能,并在我们检查的20个多模态基准测试中改善了最先进水平。我们认为,Gemini模型在跨模态推理和语言理解方面的新能力将使各种用例成为可能,我们讨论了将它们负责任地部署到用户的方法。--by chatglm

发布于 北京