如何使用目前最主流的 AI 文字、图像和视频模型制作逼真的视频?AI Master 介绍了通过 GPT-5、Nano Banana 和 Veo 3 制作 AI 视频的成熟工作流,以及过程中用到的各种高级技巧。
整个流程很简单
先用 GPT-5(或其他 LLM)帮你把想法转成清楚具体的文字提示词,再把这些提示词丢进 Nano Banana 生成高质量图片,最后用 Veo 3 把图片变成会说话的短视频。工具本身大多都有免费档,操作门槛也很低。
第一步 用 GPT-5 写出高质量提示词
就是把你想要的画面、风格、氛围,用简单明了的语言讲出来。比如,别只说 “在森林里的人”,需要具体到 “一个黄昏时分穿蓝外套的青年,站在森林里,阳光透过树梢,画面温暖柔和”。最好再写上光线、镜头角度、情绪,越详细越好。写好了提示词,可以让 GPT-5 帮你变换几个版本,比如不同角度、表情、动作,后面做视频时会方便很多。
第二步 在 Nano Banana 生成图片
有了提示词,把它复制进 Nano Banana,很快就能生成专业级的图片。上传照片时,注意选用清晰、光线均匀、正面的脸部照,别戴帽子墨镜,表情自然一点。如果生成效果不理想,可以随时改提示词再来一遍。图片可以多做几组,比如正视镜头、侧脸、不同姿势,为视频剪辑准备更多素材。画幅比例最好按需求设好,横屏 16:9 适合普通视频,竖屏 9:16 适合短视频平台。
第三步:用 Veo 3 把图片变成视频
在 Veo 3 上传你刚做好的图片,然后粘贴你想让 “它” 说的话。每条视频最长 8 秒,所以脚本写得简明,意思完整。你可以指定说话的语气、情绪和口音,比如 “自信地讲解、用美式口音”,甚至还能指定嗓音风格。Veo 3 支持不同的说话风格,会让嘴型和面部表情更自然。先用 “快速模式” 测试,满意后用 “质量模式” 出成片,可以省下不少额度。
【实用小贴士】
1. 视频分段做,每段8秒,后期拼接就能做成长片。
2. 多用不同角度、不同表情的图片,内容更生动。
3. 构图别太紧,头肩留点空间,动画会更自然。
4. 生成后记得及时下载,免费视频有时效。
5. 遇到配额和次数限制,多开几个账号轮流用,省钱又方便。
6. 保存效果好的提示词和素材,后面可以直接复用。
7. 嘴型和声音不同步,通常是原图表情和文字内容不搭。背景复杂容易出动画瑕疵,尽量选干净的图。偶尔没声音,重试即可。
#AI视频制作##GPT-5##NanoBanana##Veo3##AI创造营##AI生活指南# http://t.cn/AX7sDmnj
发布于 上海
