i陆三金 24-12-17 15:35
微博认证:AI博主

谷歌的 Whisk 太强了,利用了Gemini 的识图能力,叠加 Imagen 3 的生图能力,然后在产品上降低写提示词的门槛,只需要提供几张参考图(主题的参考、场景的参考、风格的参考),配合简单的提示词,就能给你出一张接近你需求的图。

每张图出来后,你都能看到背后长串的提示词,那是模型根据你的需求自动描述的。而你的工作好像只是在玩合成类游戏,然后看看有没有合成出来什么金卡,有没有惊喜。

谷歌也是好起来了,不知不觉就玩了一下午,真好玩。

链接:https://labs.google/fx/zh/tools/whisk,快去玩。

发布于 北京