宝玉xp 25-09-10 21:07
微博认证:前微软Asp.Net最有价值专家 2025微博年度新知博主 科技博主

AI 画图不是玩具,而是可以变成效率工具 | 豆包 Seedream 4.0 效率场景挖掘

这两天在豆包测试了新的豆包 Seedream 4.0,画图能力确实名不虚传,既有 GPT-4o 画图的那种对指令的深度意图理解,又有 nano banana 那种对角色一致性的高度特征保持,还可以精准的用指令对图片进行编辑,最重要是对中文的支持比 GPT-4o 和 nano banana 都好太多了。

在测试中重新发掘出了不少有趣的场景,更重要是它不止像把照片变成手办那样好玩,而是你能把它变成效率工具,在很多场景中帮到你,帮你提升效率。

场景一:制作封面图(图1、图2)
场景二:翻译图片文字(图3、图4)
场景三:PPT 配图(图5)
场景四:生成故事书画本(图8、图9)
其他场景:生成证件照、换发型(图10、图11)

完整内容我发到了公众号:http://t.cn/AXPd385q

如何写好 AI 画图提示词?

我在 GPT-4o 画图时期,花了不少时间研究画图提示词,将近 30 条提示词被收录在各种 Awesome 的画图提示词 Repo 中,我的经验总结下来就是这么几条:

1. 大白话先行

提示词其实不必过于追求提示词技巧,把需求表达清楚最重要。你看我前面的案例,大部分都是大白话,就是想要什么很直白的表达出来,以现在模型的能力,一般可以画出来的

2. 照葫芦画瓢

平时看到别人分享的,就测试一下,还可以二次修改发掘一些新的玩法;另外参考图也是很重要的“葫芦”,很多时候看到一个好的效果,作为参考图发过去,比提示词还管用。

3. 让 AI 当老师

让 AI 帮自己写,AI 很擅长写提示词,我的很多提示词就是 AI 帮我写的,我会先给 AI 说清楚我的需求,然后让 AI 帮我生成提示词,再去用 AI 生成的提示词生成,通常会得到很好的效果。
(图12)

比如一个有意思的案例是昨天看到归藏分享的头像 Prompt,是需要垫图的,比较麻烦。于是我把垫图的图片发给 AI,让 AI 帮我生成一段提示词,根据 AI 生成的提示词,就可以直接得到原来类似的效果,而不需要垫图。

图15

4. 分步描述

很多复杂的需求,一步到位是很难完成的,可以拆分成几个步骤,把复杂任务变成简单小任务就会好很多。比如我前面的 PPT 的提示词,就是分成几个阶段来执行,而不是一开始就生成图片,这样对于 AI 来说就会容易些,另外一些中间生成的结果也很有价值,比如可以基于 AI 中间生成的内容去再生成新的内容,可以用 AI 生成的提示词单独去生成图片。

5. 做中学、多抽卡

不管什么事,都还是多练习,如果亲手画了几十上百张图片,后面再画就会比较得心应手了,都有哪些画风,什么样的关键词可能会有什么效果,什么样的模型的优缺点是什么样的都会心中有数,这些还都是要练。

另外 AI 画图也是一种随机性比较大的事情,免不了要多抽卡,同样的提示词多生成几次,保不准就有一次很好的结果。

发布于 美国