豆包AI生图与视频功能详解

AI人工智能学习笔记3：
豆包AI生图与视频功能详解

一、豆包模型汇总
豆包不仅仅是一个聊天机器人，它背后集成了多个强大的AI模型，用于处理不同的任务：
- doubao-seed-2.0：主要用于文本对话和思考。
- doubao-seedance-2.0：专门用于视频生成。
- doubao-seedream-4.0：专门用于图片生成（本次课程重点）。

二、图片生成 (Image Generation)

1. 简单方式（直接对话）
- 操作：打开豆包，直接点击底部的“按住说话”或输入文字。
- 指令示例：“生成一张美丽的河边风景照片。”
- 结果：AI会根据描述直接生成图片。

2. 复杂/专业方式（AI创作）
- 入口：点击底部导航栏的【AI创作】 -> 选择【豆包P图】或【图片生成】。
- 功能：这里提供了更精细的控制选项。

三、豆包P图 (AI Photo Editing) - 重点功能

这是课程演示的核心部分，展示了如何对已有照片进行“整容式”修改。

1. 操作流程
- 上传一张原图（课程中以一位老奶奶的照片为例）。
- 选择下方的预设标签或输入自定义指令。

2. 强大的编辑标签库
豆包提供了分类详细的预设指令，点击即可应用：
- 光线调整：逆光、逆光发丝、阳光光斑、自然光、日落光、霓虹灯等。
- 换背景：海边日落、茂密森林、草原、时代广场、城市背景、背景虚化。
- 换衣服：国风汉服、藏族服饰、旗袍、休闲西装、碎花裙、时尚皮衣、韩式校服、学士服等。
- 人像风格：古装美人、富士胶片、日系清新、港风、美式牛仔、低像素、复古风。
- 镜头视角：大景深、全景、长焦、微距、鱼眼、水下摄影、鸟瞰、仰视、特写。
- 滤镜：优化色彩、增加亮度/饱和度、橘调增色、拍立得风格、去灰、去雾、黑白、黄金时刻。

3. 组合指令实操案例
- 案例：将老奶奶的照片进行大幅度修改。
- 指令：选择【水下摄影】 + 【换成韩式校服】。
- 结果：AI生成了老奶奶穿着水手服在水下的照片，实现了“换装+换环境”的同步操作。

4. 局部消除 (Magic Eraser)
- 操作：点击【消除】 -> 涂抹想要去除的区域（如照片中的花朵）。
- 结果：AI会自动填充背景，去除杂物。

四、图片动起来 (Image to Video)

这一部分讲解了如何让静态照片变成动态视频。

1. 操作入口
- 点击【AI创作】 -> 【照片动起来】。
- 上传一张静态图片。

2. 模型选择 (重要)
- Seedance 2.0 Fast：全能视频，速度快。
- Seedance 1.5 Pro：有声视频（重点！可以生成带声音的视频）。
- Seedance 1.0 Pro/Fast：较旧版本模型。

3. 实操案例
- 案例A（动作生成）：
- 指令：“让这个老太太向树方向走，然后回头微笑。”
- 结果：生成了符合动作描述的视频。
- 案例B（物体互动）：
- 指令：“让图片的小鸟飞起来，孩子高兴的拍手叫。”
- 注意：使用1.5 Pro模型可以生成声音，但需注意肖像保护（2.0版本暂不支持上传真实人脸作为参考，需使用分身出镜或卡通化）。
- 案例C（风格转换）：
- 指令：“参照图片的人物风格，五官形象不要做任何改变，将其变成Q版形象。”
- 结果：生成了保留特征的卡通Q版形象。

五、总结与提示
- 多模态融合：可以将多张图片融合（例如：图1的衣服 + 图2的帽子 + 图3的人物）。
- 额度限制：视频生成会消耗“视频生成额度”，生成需要时间（约1-3分钟）。
- 肖像保护：涉及真人面部时，部分高级模型可能会触发保护机制，建议使用分身出镜功能。
#人工智能##deepseek##华为# http://t.cn/z8AjtUB

发布于北京