这很盒里吧
26-05-11 22:18 微博认证:AI博主

来看看谷歌即将发布的视频模型 Gemini Omni 的表现。

提示词:一位教授正在传统黑板上书写三角恒等式的数学证明,并讲解他当前正在书写的等式步骤。

文本渲染和逻辑思考能力很强,但音频的人机感也很明显,口型对得很一般。

感觉 YouTube 应该是给谷歌的训练帮了大忙,这画面非常像 YT 上的公开课视频。 http://t.cn/AXiU9t3w

发布于 上海