在ChatGPT问世一年多后,AI target=_blank class=infotextkey>OpenAI公司近期再次出招 , 推出文生视频大模型Sora 。根据简单的文本指令,Sora就能生成一段60秒的视频 , 其中包含多角度镜头切换 , 呈现相当丰富的细节 , 等等 。OpenAI官网发布了多个视频示例,逼真的画面令人很难区分它们是由实拍而得,还是由AI生成 。
Sora的现身一时间引发热议 。部分业内人士称其“比想象中来得更快” , 是“人工智能领域的一次突破”;也有一些网友紧张了起来,比如有人担心,有了Sora的加持,影视、传媒、广告等文化产业将受冲击,进而产生了“饭碗焦虑” 。
不禁要问,Sora究竟是什么?如果普遍使用的话,它将给文化产业及其从业者带来什么?
文章插图
一
Sora并不是文生视频领域的第一个“吃螃蟹者” 。此前,Runway、Pika等公司也曾推出文生视频模型 。那么,“后来者”Sora为啥能“居上”?
“大片质感” 。有人评价,由Sora生成的视频,无论是光影色彩的转变 , 还是镜头移动 , 甚至细微到纹理结构变化,都呈现出较高质感 。它还能模拟现实世界的物理规律,像“一杯咖啡中,两艘海盗船展开了激烈的战斗”这段视频 , 不仅呈现了咖啡的流体动力学和逼真的光影渲染,还运用了光线追踪和移轴摄影技术等,技能强大 。
“时长感人” 。此前,谷歌、Runway等推出的大模型 , 每次生成的视频最多只能达到10多秒的时长 。而Sora则将视频长度拉长到了60秒,这一突破意味着,由其生成的视频信息承载力更强、内容更丰富,达到了很多短视频平台的内容发布要求 。
“匹配自如” 。Sora不仅能让文字迅速成片,而且能根据情况生成与各种设备匹配的画面 , 宽屏视频、竖屏视频以及其他比例的视频,都能得到匹配 。这也使得Sora能适应不同设备,满足各类用户的观看需求 。
此外,据分析 , Sora在细节处理、语言理解能力、视频扩展功能等方面的表现也较为显眼,这些也正是“后来者”Sora能够突出重围的原因 。
二
需要看到,作为生成式AI模型的一颗“新星”,Sora并不算完美 , 仍存在一些不成熟之处,比如逻辑性还有待提升,在更精细内容的调控方面有待加强 。但它的出现 , 已经给大众带来了一定的想象空间 。
对文化产业而言,“新物种”Sora如果能够进一步被使用,或许能带来不一般的能量 。比如 , 在内容供给端,有业内人士就认为 , Sora会像当年的智能手机一样,降低内容创作者门槛,从而使内容供给更加丰富 。
对影视产业来说 , Sora似乎已经可以“承包”部分摄影、导演、剪辑等任务,那么当它进一步升级后,影响的或许将不只是短视频 。尽管Sora发布的视频示例中,时间最长的只有60秒,但按照AI大模型等技术日新月异的迭代速度,生产出优质的AI长视频似乎指日可待 。当然 , 这一角色,除了Sora,也可以是其他的大模型 。
文章插图
这一技术也可以应用到广告业领域 。像OpenAI发布的一个视频示例就呈现了这样的画面 , “一辆老式SUV行驶在盘山公路上,扬起的灰尘在温暖的阳光下清晰可见,路两边的丘陵上种满了红杉树” 。可以想象,未来的汽车广告、美食广告、景点宣传视频等一些不需要特别复杂情节的广告视频,或许就能够借助它来完成 。
此外,于新闻传媒业而言 , 诸如Sora这样的视频生成器的使用,也会对目前的新闻生产方式和流程等产生一定的重构性作用 。
当然,文生视频大模型的出现也令人喜忧参半 。比如一些文化产业相关从业者就开始担心,Sora是否可能抢了自己的“饭碗” 。目前网络上相关讨论当中,这是主要话题之一 。
还有一些网友担忧 , 在未来,假新闻是否会因此而更泛滥?此前就有人曾利用ChatGPT将搜集到的一些素材修改编辑后 , 当成新闻报道发布在互联网上,编造假新闻牟利 。此外,这种逼真的视频生成技术还可能被用于制作“深度伪造”视频,一旦被犯罪分子利用,将带来较大风险 。
推荐阅读
- 揭秘Sora技术路线:核心成员来自伯克利,基础论文曾被CVPR拒稿
- Sora炸裂科技圈:真神还是焦虑制造机
- 人人都能看懂的Sora技术报告
- “AI手机”崭露头角,将超越传统智能手机
- 《飞驰人生2》逆袭,个人票房破328亿,沈腾将超吴京拿下影史第一
- cdr应该咋的才可以将文字进行复制
- 胡波6.6安装方法
- PS应该咋滴才可以将参考线隐藏起来
- 杨幂《生万物》将拍,男主“花落”欧豪,配角都是实力派,要火?
- ps怎么第二次调整矩形圆角,ps怎么才可以将矩形变成圆角