【谷歌发布Nano Banana Pro,非常攒劲】
据APPSO公众号,昨天,Google在Vertex AI平台正式上线Nano Banana Pro(官方名为Gemini 3 Pro Image)预览版。这款新一代图像生成模型被定位为“推理模型”,在生成图像前会进行内部推理,从而显著提升图像质量、事实准确性以及多语言长文本的渲染能力。
Gemini 3 Pro Image支持最高64K输入token与32K输出token,分辨率可达4K,并具备多轮次对话式编辑、多图像合成(最多14张输入图像合成1张输出图像)等功能。同时,该模型集成了Google搜索能力,为图像生成提供更精确、最新的知识支持。
官方介绍指出,Gemini 3 Pro Image特别适用于复杂的多轮次图像生成与编辑、需要高事实准确性的创意工作、多语言环境下的长文本渲染,以及依赖最新知识的图像创作场景。
图2-图4 阿知放了几张APPSO设计的图,大家可以看看新Nano的生图表现。至于这个发布时间节点,你说是谷歌故意错开与Gemini 3 Pro档期也行,理解为还击隔壁GPT-5.1也没问题。真正重要的,其实是这几家AI厂商“占据”了AI输出端的几条大道——代码、文字、图像、视频与音频。
代码方面,各家其实差不多只有跑分上的区别,没有哪个模型断档领先,属于都能用,都能帮助裁员。
文字生成能力方面,GPT和Gork算各有所长,前者处理作业,后者更能突破上限/下限,看用户需求和偏好吧。
图像,谷歌家的Nano系列,比GPT、Grok效果好一些,无论是泛用性还是专业性。
视频,只有OpenAI家的Sora 2。如果大家的茧房不那么厚的话,在抖音和B站上,可能会刷到一些Sora 2生成的整活视频或抽象广告,比如代表性的“哈基米南北绿豆”系列。
音频,Suno应该是独一份的存在,不知道大家有没有刷到过各种版本的《大东北我的家乡》,很多都是博主拿Suno跑的。
AI助力商业化我还没咋看到,但用来搞抽象确实非常先进[揣手]#如何玩转NanoBananaPro#
