Sora惊艳出世,AI能否给人类带来新的“视界”?( 二 )


诸如在电视或网络上看到的品牌商一则短短几分钟的视频,传统广告公司报价在百万元级别 。后者也需要投入不菲的成本和时间才得以实现 。未来,利用Sora或将大大压降其品牌商支出 。对于广告商而言,或许意味着商业模式的重新洗牌 。
因此,外界对于Sora有着极高的赞誉 。
即便如此 , 令人震撼的Sora也有不小缺陷 。虽然Sora对于现实世界理解有相当程度的提升 , 但本质依旧是基于海量数据的训练与计算,而不是其本身就对世界有理解 , 更远没有达到人类大脑的想象力 。
因此,Sora生成的视频还有很多局限性,甚至包括一些事实性的错误,更无法理解需要想象力的因果律 。诸如,人咬了一口饼干没有咬痕;人在跑步机跑步的方向错乱;玻璃杯摔在地上只是一方变形 。
最近几天 , 有拥簇者惊呼,Sora吊打Runway、Pika , 已经成为“通用世界模型” 。很显然 , 这过于神话Sora了,它离AGI(通用人工智能)、世界模型还有很远很远的路要走 。
所谓“现实世界不存在了”,也绝不是现在 。人工智能的浩瀚前景,谁也没法否认 , 但当下需要保持头脑清醒 。
关于Sora将给哪些行业带来冲击?这些行业又该如何面对这些挑战 。
科技金融说创始人邵萍表示,Sora大模型的出现,从技术领域来看确实是一大亮点, 它标志着人工智能发展再度迈上一大台阶 。对于各行各业 , 特别是金融、教育、医疗、自动驾驶等领域来说,无疑将带来巨大的影响,但追捧的同时仍要理性看待 。
作为一款人工智能视频模型,Sora在于能够通过简单的文本命令创建出高度逼真、包含复杂背景和多角度镜头的视频 。不可否认 , 这是继文本、图像之后 ,  AI技术拓展到视频领域的又一次重大突破 。未来也有可能引领一场更具看点的科技革新 , 最为直观的体现就是或对短视频制作、影视行业以及视觉交互界面应用产生较为显著的影响 。但是若说Sora的出现 , “一些行业将不复存在、现实世界将不存在”确实夸大其谈了 。此外,目前Sora还处于初期探索阶段,后期对于安全性以及垃圾内容的把控性等方面仍待考察 。
盘古智库高级研究员江瀚表示,随着科技的飞速发展,人工智能(AI)已经成为了当今世界最为热门的话题之一 。其中,OpenAI的ChatGPT和Sora等模型的出现,更是颠覆了人们的认知 。
首先,Sora的出现无疑是另一大里程碑 。ChatGPT作为OpenAI研发的里程碑式语言模型,其强大的自然语言处理能力和对上下文理解的深度,在推出后迅速引发了全球范围内的广泛关注和热议 。ChatGPT不仅能够流畅对话、解答问题,还能生成具有逻辑性和创造性的文本内容,这一突破性进展让人们看到了人工智能在认知智能领域取得的重大飞跃 。
紧随ChatGPT之后 , OpenAI又推出了视频生成模型Sora,该模型更是将AI技术推到了一个全新的视觉维度 。Sora凭借其创新的文本到视频转换能力,使得AI从理解和生成文本跃升至创作高清视频内容的新高度 。通过理解用户输入的文字描述,Sora可以自动生成包括复杂场景、多角色动态交互在内的长达一分钟的流畅高清视频,这标志着OpenAI在跨模态学习与生成方面取得了重大突破 。
其次,Sora的最大突破还是在于理解人类语言并且通感成为视频 。Sora模型的核心优势体现在它能够理解人类语言输入 , 并基于这种理解进行视频内容的创造性生成 。通过深度学习和跨模态技术,Sora能够将文本描述中的抽象概念、情境、甚至是情感色彩映射到视觉表达上 , 生成与描述相匹配且具有一定连贯性的视频片段 。
尽管目前生成的视频可能在细节处理、物理真实感或者复杂交互场景等方面还存在不完善之处 , 但其突破性在于首次实现了从文本到高质量视频内容的有效转化,这为内容创作者提供了一种全新的工具,大大提升了创意表达的效率和可能性 。此外,Sora的应用价值也体现在教育、娱乐、广告设计等众多领域中,它有可能重塑这些行业的生产方式,并为未来更加智能化的内容创作打下坚实基础 。
第三,视频的变革可能远超过文字的变革,而且速度会更快 。在当前的互联网时代,视频已经成为人们获取信息、娱乐休闲的主要方式之一 。每天都有大量的视频内容被上传到网络上,涵盖了新闻、教育、娱乐、广告等各个领域 。这些丰富的视频资源为大模型的学习提供了宝贵的素材 。


推荐阅读