过去半年,AI 天生视频一贯处在断断续续推进的状态。

号称海内首个自研视比年夜模型的 Vidu,以及后续字节、腾讯等多家国产厂商推出视频天生模型,都在时时时引发外界的关注。

最长3分钟快手的视频大年夜模型成色几何 休闲娱乐

近日,又一国产视比年夜模型加入战局,快手“可灵”视频天生大模型官网正式上线。

21日,快手可灵大模型发布重磅更新:正式开放图生视频功能,支持将静态图像转化为5秒钟视频,用户可通过提示词文本掌握图像中物体的运动;同时推出视频续写功能,支持对天生视频一键续写和连续多次续写,最长可天生约3分钟视频。

相较此前各家放出的视比年夜模型以展示视频为主,本次亮相的可灵大模型不但效果对标Sora,且已在快手旗下的快影App开放邀测体验。

据快手方面先容,可灵大模型为快手AI团队自研,采取Sora相似的技能路线,结合多项自研技能创新,其天生的视频分辨率达1080p,时长最高可达2分钟(帧率30fps),支持自由的宽高比。

此外,官方还流传宣传,可灵大模型能够天生大幅度的合理运动,并使其符合客不雅观运动规律。

在官方给出的视频范例中,一位宇航员在月球上奔跑,随着镜头逐步抬升,宇航员的步态和影子都能保持合理恰当。

险些同时,美图宣告将在7月尾上线新品MOKI,该产品基于美图奇想大模型的视频天生能力,可帮助用户天生AI短片。

然而, 也有不雅观点认为,比较一拥而上的大措辞模式,视比年夜模型更慢热,且少了巨子的身影。

为什么会如此?

大厂们不感兴趣吗?

同时,在上一轮大措辞模型竞争中,快手和美图的存在感较低。

而在视比年夜模型赛道,这两家企业最大的上风又是什么?

对此,北京商报魏蔚和书乐进行了一番互换,本猴以为:

还在冲刺“高考”的大厂,不会直接攻击“博士后”。

做视频,不是一堆图组成PPT,大厂不急于这一块发力,且实用性不强,只是一个肌肉展示。

毕竟,视频天生不是将一堆AI绘图连在一起变成动画片。

除了考虑形象同等、符合描述、光影分割、分镜表现等更多细节外,还有对剧情的理解能力、再创造能力。

这些都须要对视频构造、内容解析、拍摄技巧和叙事手腕等多个垂直领域进行深度学习。

其难度远不是谈天、绘画或专精于下棋之类靠数据堆积和用户纠错来完成的。

纵然是影视领域的大师也常有败笔,让还处在“高考阶段”的人工智能出片,其难度可想而知。

但快手和美团,则须要秀肌肉,哪怕只是一个秀。

快手也好,美图也罢,在视比年夜模型赛道上,最大的上风只是他们拥有让人工智能深度学习的丰富“学习资料”。

依赖这些“学习资料”,可以规避一定的版权问题,并且通过多年在视频领域的内容积累、垂直细分和标签标注,都让大模型能够更好地“检索”知识,也让其在算法设计上多少有一定的视频专业素养。

但也仅此而已,在技能上依然短缺在人工智能算法上的原始积累。

此外,视比年夜模型纵然成熟,也很难在影视领域有大的打破。

无论是短剧、广告还是长视频或电影,只管都会内卷“大片殊效”。

但受众终极被吸引的还是内容(从编剧到运镜,以及演员演技)。

这些才是大规模商业变现的关键。

愚以为,视比年夜模型或许更随意马虎在动画领域找到一些商机。

作者 张书乐,公民网、公民邮电报专栏作者,中经传媒智库专家,资深家当评论人

#头条创作寻衅赛##快手##视比年夜模型#