颠覆性王炸!一句话生成一分钟视频,网友:整个行业都要消亡了( 二 )


业内普遍认为,Sora能力的提升,主要来自高质量的数据集 , 以及准确的语言理解能力 。OpenAI 没有透露训练视频的大小、来源,只声称训练的是公开有版权的视频 。前述从业者认为,Sora无疑有巨大的数据量,因此能够支持多大的调用量,视频加载和渲染有多少延迟,都将是后续挑战 。“真正投入使用会是什么样?能不能达到官方演示的效果?”还是一个未知数 。

Sora还难以呈现复杂的物理变化规律
OpenAI已经公开承认了一些Sora存在的缺陷:它可能难以呈现复杂的物理变化规律,无法理解因果关系,混淆空间细节 。
例如在演示视频中 , “五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失 。

颠覆性王炸!一句话生成一分钟视频,网友:整个行业都要消亡了

文章插图
再如一位寿星向生日蛋糕上的蜡烛吹气,但蜡烛没有任何变化;或者篮球直接穿透了篮筐,而不是从篮筐中进球 。
颠覆性王炸!一句话生成一分钟视频,网友:整个行业都要消亡了

文章插图
值得注意的是,Sora目前定性为初期研究成果,不面向公众使用,因为公司担心深度伪造视频的滥用问题 。现在只有一部分视觉艺术家、设计师和电影制作人有内部试用机会 。此外 , OpenAI 还在与第三方安全测试人员共享该模型,进行红队测试 。
在安全问题上,Sora已经包含了一个过滤器,阻止暴力、色情、仇恨,以及特定人物的视频输出 。公司还将借鉴去年在DALL-E 3 上实验的图像探测器 , 把C2PA技术标准——一种内容追溯方式,也可以理解为内容水印——嵌入到Sora的输出视频中,以鉴别视频是否为AI深度伪造视频 。
SFC
本期编辑 黎雨桐 实习生 赵凤铃




推荐阅读