Sora惊艳出世,AI能否给人类带来新的“视界”?( 四 )


ICT观察负责人叶丹丹表示,Sora的出现在AI领域可以说是划时代的标志,将视频制作方式注入了新的可能,但开放之路还有很远 。
Sora将文本和图像生成工具的特点结合在一起 , 形成“diffusion transformer model”,通过从随机噪点开始,迭代到符合输入关键词的图像 , 再将这样的图像组成视频 , 而关键点就是视频每帧的连贯性和一致性,通过Open AI 发布的样片,Sora做到了 。
如果在资源充足的情况下,Sora得以开放且以合适的价格进行行业应用,那就可以更便捷地将人类想法可视化 。
但参考ChatGpt的发展路径,无论是从本身所需数据、算力和算法还是潜在的社会及伦理风险,Sora的行业应用之路还有很远 。训练数据的稀缺、算力供给不足以及算法不完善都将成为Sora迭代的关键问题;而社会接受度、版权风险、及生成视频的合规性也将影响Sora的应用进度 。
Sora让大众看到了技术的新可能,新可能就会有新冲击、新挑战,但技术发展一直在路上 。
零态LT主笔吴狄表示,GPT3的问世,让人们将AGI的实现将从80年缩短到50年 。2022年GPT4发布后,这个时间被进一步缩短到8年 。如今 , 甚至有人坚信2025年将会是AGI元年 。一位在1994年以神经网络作为硕士论文的研究人员表示 , 面对AI指数级进化的速度,他只能勉强做到头脑清醒 。进化来的太快,绝大部分人还没来得及去消化它 , 包括OpenAI自己 。
相比传统技术 , AI挤占创业公司空间的威胁尤其明显 , 典型的例子就是Jasper,一款GPT3套壳写作AI产品,最终死于ChatGPT之手 。以至于OpenAI开发者大会后,一个段子激发了很多人的共鸣:“奥特曼毁了我300万美元的初创公司,却只给了我300点ChatGPT积分” 。
冲击来得太快,结论却来得太早 。但不管怎么说 , 在Sora没有实装之前 , 所有的猜测最终都有可能是错误的 , 就像大家预测AGI实现的时间一样 。图灵奖获得者Yan LeCun就表示,Sora的模式注定了它终将无法实现自己的野心 。那么,Sora是否真的能够成功?如果是,成功后的Sora将会是什么样子?它又能带来什么样的新启发、杀死多少“Jasper”?
大力财经创始人魏力认为,Sora的降临无疑是一场革命 。Sora 作为首个文生视频大模型,可能攻克了自然语言处理、计算机视觉和深度学习等难点 , 使视频生成更真实、自然 。科技圈大佬对其关注,因为它可能缩短 AGI 实现时间,对未来科技发展有深远影响,并将在影视制作,动漫游戏和纪录片,以及广告营销等行业带来变革 。未来的这些行业人才 , 将要大规模淘汰和流失,会进入到其他行业 。这些行业需提升创意和技术水平,也可探索人机结合与 AI 合作 。
Sora 带来新机遇如智能视频制作,但也引发风险如虚假内容传播 , 法律和版权问题 。
【Sora惊艳出世,AI能否给人类带来新的“视界”?】关于OpenAI将AI的“触手”升维,这将带来哪些新的市场机遇又会制造哪些风险 。
壹DU财经主编刘亦可表示,Sora是OpenAI发布的首个AI视频生成模型 , 在视觉领域实现了与大语言模型类似的突破 。
在技术上,Sora突破了5至15秒的限制,将这一时长提升到60秒,并且场景切换、特写等均满足文本需求 。还支持视频到视频的编辑,拼接完全不同的视频使之合二为一、前后连贯 。
另外,Sora突破AI视频单镜头限制,可以生成多个镜头 , 且各个镜头具有角色和视觉风格的一致性 。Sora是扩散+Transformer的视觉大模型,并且产生了涌现现象 。它通过收集、清洗数据对现实世界有更深刻的理解、互动和模拟能力,生成的视频更加逼真 。
此外,Sora的运行速度比之前的模型快30%,准确率高达95%,并采用了全新的算法,实现了AI与人类的无缝对接 。
从目前Sora展现的能力来看,它对内容创作、广告娱乐和影视制作行业的冲击是首当其冲的 。它让非专业人员,都有可能成为短视频创作者,这势必会产生新业态 。但对于带有剧情的长篇故事视频,除了多镜头、连贯性等要求,还需要创新场景、准确和具有节奏的叙事、镜头语言等等 。
短时间来看Sora不可能彻底替代人或者说让专业人员失业,反倒有可能让影视人创造出更多元丰富的作品 。Sora的出现,更多是扮演辅助工具的角色,帮助人类提高效率,提高生产力 。
目前来看,Sora等AI文生视频产品有望在电影、短视频、游戏等领域较大改变创作者的工作方式 , 降低创作成本,提升生产效率 。另一个角度来看,Sora爆火与使用也会引发对内容真实性的验证、版权问题、以及伦理等问题 。各行各业纷纷涌入 , 其中的不规范行为与炒作也是值得注意的 。


推荐阅读