Sora将改写什么 _Sora

在ChatGPT问世一年多后，AI target=_blank class=infotextkey>OpenAI公司近期再次出招，推出文生视频大模型Sora 。根据简单的文本指令，Sora就能生成一段60秒的视频，其中包含多角度镜头切换，呈现相当丰富的细节，等等。OpenAI官网发布了多个视频示例，逼真的画面令人很难区分它们是由实拍而得，还是由AI生成。
Sora的现身一时间引发热议。部分业内人士称其“比想象中来得更快” ，是“人工智能领域的一次突破”；也有一些网友紧张了起来，比如有人担心，有了Sora的加持，影视、传媒、广告等文化产业将受冲击，进而产生了“饭碗焦虑” 。
不禁要问，Sora究竟是什么？如果普遍使用的话，它将给文化产业及其从业者带来什么？

文章插图
一
Sora并不是文生视频领域的第一个“吃螃蟹者” 。此前，Runway、Pika等公司也曾推出文生视频模型。那么，“后来者”Sora为啥能“居上”？
“大片质感” 。有人评价，由Sora生成的视频，无论是光影色彩的转变，还是镜头移动，甚至细微到纹理结构变化，都呈现出较高质感。它还能模拟现实世界的物理规律，像“一杯咖啡中，两艘海盗船展开了激烈的战斗”这段视频，不仅呈现了咖啡的流体动力学和逼真的光影渲染，还运用了光线追踪和移轴摄影技术等，技能强大。
“时长感人” 。此前，谷歌、Runway等推出的大模型，每次生成的视频最多只能达到10多秒的时长。而Sora则将视频长度拉长到了60秒，这一突破意味着，由其生成的视频信息承载力更强、内容更丰富，达到了很多短视频平台的内容发布要求。
“匹配自如” 。Sora不仅能让文字迅速成片，而且能根据情况生成与各种设备匹配的画面，宽屏视频、竖屏视频以及其他比例的视频，都能得到匹配。这也使得Sora能适应不同设备，满足各类用户的观看需求。
此外，据分析， Sora在细节处理、语言理解能力、视频扩展功能等方面的表现也较为显眼，这些也正是“后来者”Sora能够突出重围的原因。
二
需要看到，作为生成式AI模型的一颗“新星”，Sora并不算完美，仍存在一些不成熟之处，比如逻辑性还有待提升，在更精细内容的调控方面有待加强。但它的出现，已经给大众带来了一定的想象空间。
对文化产业而言，“新物种”Sora如果能够进一步被使用，或许能带来不一般的能量。比如，在内容供给端，有业内人士就认为， Sora会像当年的智能手机一样，降低内容创作者门槛，从而使内容供给更加丰富。
对影视产业来说， Sora似乎已经可以“承包”部分摄影、导演、剪辑等任务，那么当它进一步升级后，影响的或许将不只是短视频。尽管Sora发布的视频示例中，时间最长的只有60秒，但按照AI大模型等技术日新月异的迭代速度，生产出优质的AI长视频似乎指日可待。当然，这一角色，除了Sora，也可以是其他的大模型。

文章插图
这一技术也可以应用到广告业领域。像OpenAI发布的一个视频示例就呈现了这样的画面， “一辆老式SUV行驶在盘山公路上，扬起的灰尘在温暖的阳光下清晰可见，路两边的丘陵上种满了红杉树” 。可以想象，未来的汽车广告、美食广告、景点宣传视频等一些不需要特别复杂情节的广告视频，或许就能够借助它来完成。
此外，于新闻传媒业而言，诸如Sora这样的视频生成器的使用，也会对目前的新闻生产方式和流程等产生一定的重构性作用。
当然，文生视频大模型的出现也令人喜忧参半。比如一些文化产业相关从业者就开始担心，Sora是否可能抢了自己的“饭碗” 。目前网络上相关讨论当中，这是主要话题之一。
还有一些网友担忧，在未来，假新闻是否会因此而更泛滥？此前就有人曾利用ChatGPT将搜集到的一些素材修改编辑后，当成新闻报道发布在互联网上，编造假新闻牟利。此外，这种逼真的视频生成技术还可能被用于制作“深度伪造”视频，一旦被犯罪分子利用，将带来较大风险。