来看看谷歌即将发布的视频模型 Gemini Omni 的表现。
提示词:一位教授正在传统黑板上书写三角恒等式的数学证明,并讲解他当前正在书写的等式步骤。
文本渲染和逻辑思考能力很强,但音频的人机感也很明显,口型对得很一般。
感觉 YouTube 应该是给谷歌的训练帮了大忙,这画面非常像 YT 上的公开课视频。 http://t.cn/AXiU9t3w
发布于 上海
来看看谷歌即将发布的视频模型 Gemini Omni 的表现。
提示词:一位教授正在传统黑板上书写三角恒等式的数学证明,并讲解他当前正在书写的等式步骤。
文本渲染和逻辑思考能力很强,但音频的人机感也很明显,口型对得很一般。
感觉 YouTube 应该是给谷歌的训练帮了大忙,这画面非常像 YT 上的公开课视频。 http://t.cn/AXiU9t3w