激洪感悟 26-04-16 08:07

AI人工智能学习笔记3:
豆包AI生图与视频功能详解

一、 豆包模型汇总
豆包不仅仅是一个聊天机器人,它背后集成了多个强大的AI模型,用于处理不同的任务:
- doubao-seed-2.0:主要用于文本对话和思考。
- doubao-seedance-2.0:专门用于视频生成。
- doubao-seedream-4.0:专门用于图片生成(本次课程重点)。

二、 图片生成 (Image Generation)

1. 简单方式(直接对话)
- 操作:打开豆包,直接点击底部的“按住说话”或输入文字。
- 指令示例:“生成一张美丽的河边风景照片。”
- 结果:AI会根据描述直接生成图片。

2. 复杂/专业方式(AI创作)
- 入口:点击底部导航栏的【AI创作】 -> 选择【豆包P图】或【图片生成】。
- 功能:这里提供了更精细的控制选项。

三、 豆包P图 (AI Photo Editing) - 重点功能

这是课程演示的核心部分,展示了如何对已有照片进行“整容式”修改。

1. 操作流程
- 上传一张原图(课程中以一位老奶奶的照片为例)。
- 选择下方的预设标签或输入自定义指令。

2. 强大的编辑标签库
豆包提供了分类详细的预设指令,点击即可应用:
- 光线调整:逆光、逆光发丝、阳光光斑、自然光、日落光、霓虹灯等。
- 换背景:海边日落、茂密森林、草原、时代广场、城市背景、背景虚化。
- 换衣服:国风汉服、藏族服饰、旗袍、休闲西装、碎花裙、时尚皮衣、韩式校服、学士服等。
- 人像风格:古装美人、富士胶片、日系清新、港风、美式牛仔、低像素、复古风。
- 镜头视角:大景深、全景、长焦、微距、鱼眼、水下摄影、鸟瞰、仰视、特写。
- 滤镜:优化色彩、增加亮度/饱和度、橘调增色、拍立得风格、去灰、去雾、黑白、黄金时刻。

3. 组合指令实操案例
- 案例:将老奶奶的照片进行大幅度修改。
- 指令:选择【水下摄影】 + 【换成韩式校服】。
- 结果:AI生成了老奶奶穿着水手服在水下的照片,实现了“换装+换环境”的同步操作。

4. 局部消除 (Magic Eraser)
- 操作:点击【消除】 -> 涂抹想要去除的区域(如照片中的花朵)。
- 结果:AI会自动填充背景,去除杂物。

四、 图片动起来 (Image to Video)

这一部分讲解了如何让静态照片变成动态视频。

1. 操作入口
- 点击【AI创作】 -> 【照片动起来】。
- 上传一张静态图片。

2. 模型选择 (重要)
- Seedance 2.0 Fast:全能视频,速度快。
- Seedance 1.5 Pro:有声视频(重点!可以生成带声音的视频)。
- Seedance 1.0 Pro/Fast:较旧版本模型。

3. 实操案例
- 案例A(动作生成):
- 指令:“让这个老太太向树方向走,然后回头微笑。”
- 结果:生成了符合动作描述的视频。
- 案例B(物体互动):
- 指令:“让图片的小鸟飞起来,孩子高兴的拍手叫。”
- 注意:使用1.5 Pro模型可以生成声音,但需注意肖像保护(2.0版本暂不支持上传真实人脸作为参考,需使用分身出镜或卡通化)。
- 案例C(风格转换):
- 指令:“参照图片的人物风格,五官形象不要做任何改变,将其变成Q版形象。”
- 结果:生成了保留特征的卡通Q版形象。

五、 总结与提示
- 多模态融合:可以将多张图片融合(例如:图1的衣服 + 图2的帽子 + 图3的人物)。
- 额度限制:视频生成会消耗“视频生成额度”,生成需要时间(约1-3分钟)。
- 肖像保护:涉及真人面部时,部分高级模型可能会触发保护机制,建议使用分身出镜功能。
#人工智能##deepseek##华为# http://t.cn/z8AjtUB

发布于 北京