Sora惊艳出世,AI能否给人类带来新的“视界”?( 三 )


通过对这些视频进行深度学习和分析 , 大模型可以不断地提取和总结视频中的视觉元素、场景转换、叙事结构等规律,从而提高自身的生成能力 。同时 , 大模型还可以利用这些视频资源进行自我迭代和优化,不断提升自身的性能和效率 。
唐辰同学主理人唐辰表示,Sora值得更多的赞誉 , 但过度神话大可不必 。贩卖焦虑的不是Sora,喊出“现实不存在”,就两类人,一类是AI门徒,一类是正在卖课割韭菜 。应该向前者致敬 , 而后者典型如李一舟,正卖付费课程从你口袋掏钱 。
对于普通人 , 人工智能是一套辅助工具 。想靠着买课听来的信息赚钱,只会是竹篮打水一场空 。真正带来压迫感的,或许是Sora不可思议的进化速度 。例如,Gen-2是2023年6月发布的产品,距离Sora的发布不过8个月 。支撑OpenAI以如此速度迭代的是“疯狂烧钱”,也是“大力出奇迹”的驱动力 。
首席商业评论创始人卫明表示,Sora的目标不仅是搞视频,更是为了向AGI方向突破 。
Sora生成的视频为何可以那么逼真?因为Sora不仅理解了语言指令 , 而且理解了语言中事物在真实世界中的物理规则 。
譬如,出现的人,建筑,在不同角度观看会呈现视线中应该出现的部分 。譬如,物体在真实世界中的重力,速度 。还有比较关键的,不同物体在真实世界中的关系,如何互相影响 。譬如一个骑车的人穿越树林,光线穿透的不同情况等等 。
这些原来在电脑动画中能实现是依靠人类提供的算法 , 并且需要用人来调配,也不能简单复制 。
而如今,Sora似乎已经学会并理解了这些关系 。当ChatGPT,DALL-E,Sora等拼图组合在一起,可以理解语言,理解世界的物理规律,并通过语言描述,能生成任何事物,如果再配上摄像头不断观察世界,获取真实世界的素材,是不是就已经能生成一个全新的物种了?
如果再提升逻辑推理能力,那基本上就是AGI了 。
AGI最终关乎的是权力分配 。根据这次上海二中女教师事件的社媒传播来看 , AI实际上已经在极大影响着事实和真相了 。
这就会决定最终解释权,也会决定其他权力的分配 。
目前的AI还没到AGI的程度,如果未来有了AGI,它就可以像人一样,但能力比人强,随意生成一段虚构的故事,效果和真人一样,那么大家该相信谁?
所以,未来的AGI,或者超级AGI,可能会影响人类的组织关系和权力分配,这是一件有风险的事情 。
蓝媒汇联创兼运营总监岳轻表示,实际上Sora的振奋人心,是从某种角度上,让人认知到AI的商业化/普适化落地的现实 。
从区块链到VRMR,实际上这两年互联网并不缺乏新技术 , 但是所有的新技术都给人一种原本应该存在于PPT上,但是用目前的硬件科技水平愣造出来的感觉——它的原理、应用案例等都让吃瓜群众觉得不明觉厉,但实际上并没有卵用 。
实际上AI原本也应该是这样,但OpenAI走了一条不同寻常的“邪路”,它把传统认知中AI需要的“情感理解模块”,转用大数据和算法实现了一定标准上的完美替代,使得它在大幅度降低研发标准的同时,更贴近人们的日常生活 。
从搜索引擎、图文替代创作等,走到当下互联网内容向最大的板块“视频”,OpenAI的每一步突破,都是基于吃瓜群众切身体会和应用上的 。这也使得吃瓜群众更能理解OpenAI的原理、机制、成果以及它所能带来的颠覆式的未来 。
可以说人工智能这个概念应该感谢OpenAI,研究它的公司和机构有很多,但只有OpenAI一家找到了一条最适合它的发展路径 。
IT知识局主理人焦云鹏表示 , 当“文心一言”们还在考虑如何迭代升级时,OpenAI再次引领了大模型的潮流 。Sora的出现,无疑让人们看到了更多的可能性,但它肯定不是终点,但却可以称得上是一个里程碑 。借用周鸿祎的话来说,Sora加速了AGI的实现 。
Sora刚发布时,大家都觉得这对于广告及影视制作行业是极大的冲击 。但实际真的是这样吗?其实不然 。从ChatGPT发布到国内众多大模型推出 , 似乎没有多大的改变,因为这些应用场景,更多的还是在消费级领域,通过大模型输出的成果也经不起商业推敲 。如果说真的有影响,那可能真的是提高了一部分广告创意从业者的效率,但依然没有达到取而代之的程度 。
另一方面,除了广告创意类的内容外 , 比如新闻领域、时政民生领域等,诸如Sora这样的工具要发挥作用似乎还要经过漫长的过程 , 比如法律法规的建立、不同国家制度的适配等等 。最后要说的一点是,大模型的潜力不应该只存在于消费级,诸如在工业级、企业级场景中,还有更为广阔的空间 。


推荐阅读