这两天我迷上了让豆包按指令作图,给家人生成了一些堪比专业写真的美图,他们都很满意。
但一开始做的也不行,是逐步摸索到门道的。
我们都知道AI是工具,需要把需求跟它讲清楚。但是怎么讲呢,从哪些方面讲呢?
比如想做古风樱花汉服写真,如果只是给AI一张自己的照片,说用这张照片中的人物生成10张古风樱花汉服写真。那么最后生成的效果图会非常随机,因为给出的指令很含糊,想象空间很大,AI就会按自己的理解随便做。也不排除生成的图中有精美的,但很多细节可能都不是你想要的,比如发型,它很可能就用原图中的人物发型,与古风汉服写真并不相称。
如果想要生成的图尽量真实,就需要把人物神态、妆容、发型、服饰、动作以及拍摄背景环境、氛围风格等各方面的细节描述出来,作为指令,提供给AI。需求提的越精准、越全面,作出来的图越精细、越符合预期。
所以指令写作是关键(可能令我着迷的就是这个过程)。实际操作中,可以先找出自己喜欢的图片,然后发给豆包,让它从上述方面进行描述。在此基础上,自己再根据具体需求对描述进行修改,指令就生成了。
再把自己的正面清晰五官照片给豆包,把指令复制过去,让它生成10张照片,就会生成这个场景下各种动作的写真图片了。基本上用这个方法做出来的图,与你喜欢的图的风格相差不大。
由此可以看出,不管是人还是AI,想要做出好东西,都需要细致入微的观察能力、逻辑严密的思考能力、准确全面的表达能力。当然AI还具备远超人类的强大的搜索和计算能力。即便是生成一个作图指令,这些能力都缺一不可。
附上我做的图之一,以及这个效果图的指令。大家可以自己玩一玩儿。[嘻嘻]
发布于 北京
