黄健楸 26-02-08 20:03
微博认证:AI博主

即梦可灵新版本,视频模型又炸裂了吗?

AI生成视频确实不错了,如果当玩具的话。

什么玩具?比方说弄段子、二创、个别特效,甚至不严肃的宣传片……离现实越远越好,人物越少越好,越跳脱越好……

拿“亚洲女博主跳KPop舞”为例,视频一对比就能看出区别:
1️⃣可灵3面向专业人士,质量好但贵,指引也少。不计优惠,十秒十块钱,生成等十分钟,视频质量很好,对应视频见:http://t.cn/AX5T7Tll
2️⃣即梦seedream2面向大众,小云雀app可免费体验三次。不计优惠,十秒六毛六,生成等五分钟,视频见:http://t.cn/AX5QnTqN

至于国内外模型,相同架构下,国内视频模型水平,至少跟国外齐平,在产品上可以说超越。如果想初步对比生成质量的话,你可以对比一下视频1、视频2,国内外两个模型,在相同指令、首尾帧下分别生成的五秒视频。

短视频流行品类、中文、东亚脸型是国内的长板,可惜我几乎不看短视频、也不看剧,目前仅用动漫来体验视频生成,好在,这反倒能比较真实反应模型本身能力,在“新领域”。

结论是,跟上个月的体验没有区别(图四)。

如果真想去设计一段完整故事,还是那样尴尬,更别说“出新”。模型到底能不能做,你要试过才知道——试用费自己出,时间也一去不返。

过几个月又来一个“炸裂”模型,你又怎么办?

具体操作上,提前准备好图五这种设计图,用处不是很大。可灵好一点,能帮你定义主体(图六、图七)。

要是涉及分镜就更复杂了,比方说图八这几个分镜。之前的做法是,分别生成图片,然后首尾帧生成视频,那就等着抽几天卡吧。

可灵有分镜功能,但没有什么文档给我参考,至少我没找到。可能等我把积分花完了,大概就明白怎么用了。

国内即梦倒是有飞书文档(图九)。bytedance.larkoffice.com/wiki/Rx8pwmbXjirkvukCnCQcAtH1nSd 🔗

有趣的是,某个国内模型在生成动漫的时候,就算用的中文指令,生成的语音类似日语(如视频三)。

普遍风评,可灵3效果比即梦seedance2要好,但是更贵(十秒十元)。小云雀上的seedance2目前单价极其便宜(十秒0.68元),还有试用次数跟积分。

我个人觉得,扩散模型就这样了。得看看“世界模型”能不能走得更远,比方说谷歌的genie3。

现阶段,追赶观念,比追赶工具重要。可以看看上面说的即梦3文档。视频平台上也有不少关于分镜的教程。 #HOW I AI#

发布于 广东