Sora炸裂科技圈:真神还是焦虑制造机


Sora炸裂科技圈:真神还是焦虑制造机

文章插图
作者|吴狄
出品|零态LT(LingTAI_LT)
周鸿祎又口出狂言了 。
他说,“AGI(通用人工智能)的实现将从10年缩短到1年” , 而背后的原因,仅仅是因为一个1分钟的短视频 。
注意看,这个女人叫小美,她正向我们走来 。虽然身处日本某条热闹的大街,小美却总是不停地回头张望,似乎在暗示观众镜头之外隐藏了不为人知的秘密 。
Sora炸裂科技圈:真神还是焦虑制造机

文章插图
▲图:主角出场
镜头拉近 , 可以清晰看到小美修长的脖子和优美的下颌线 , 让整个画面充满了令人无法抗拒的神秘和美感 。
Sora炸裂科技圈:真神还是焦虑制造机

文章插图
▲图:细节展示
实际上,整个短视频中,从街景到行人,包括小美,在现实中根本不存在 。这是OpenAI最新产品Sora制作的演示视频,而正是这个视频,让周鸿祎做出了AGI发展将会10倍提速的预言 。
传统方式制作这样一段1分钟的视频成本非常高 。除了需要选址,选演员,提前进行分镜构图,架设机位外等,想要碰上如此理想的天气,还需要赌一赌运气 。落日转瞬即逝,一旦失误就只能第二天重头来过 。
拍摄完成后 , 是非常耗时的后期制作 。不仅要调整画面色调,还要仔细核对画面中是否有瑕疵,比如眼镜反射的画面会不会导致穿帮、路人中是否出现不协调元素等等 。
但Sora出马 , 全部流程就是(字面意义上的)一句话的事 。
Sora官网上公布了十几段“制作”精良的高清演示短片 ,  从现实人物到3D动画 , 所有短片都是通过一句话生成的 。
Sora炸裂科技圈:真神还是焦虑制造机

文章插图
▲图:Sora展示视频
看过这些短片后 , 我科技圈的朋友集体表示“炸裂”;大众圈的朋友表示“AI都到了这种程度了吗”;而摄影圈的朋友表示,尽管还是能看出和人类摄影师有一点点差距,但依然被Sora的效果震撼了,进而纷纷开始和我讨论起失业以后,除了送外卖还可以从事什么工作 。
但如果我们抛开网上铺天盖地、对Sora近乎玄幻的赞誉,跳出官网演示视频的魅惑就会发现,Sora本质上是生成式AI在视频领域的一个应用,一个diffusion transformer模型 。
而官方宣传的Sora所有功能 , 例如通过文字或者图片生成高清短视频 , 在此基础上进行扩展生成一段更长的视频等,其实很多公司都在做 。比较知名的产品包括已经商用的Runway,免费的Pika,以及还在完善阶段的google Lumiere、Meta Make-A-Video,还有一些知名度稍低的产品如Leonardo,FinalFrame等等 。
这里就有一个很大的疑问:凭什么出圈的又是Sora,它真有网上说的那么神吗?
凭借更逼真的效果
OpenAI再次出圈
1月24日,谷歌研究人员公布了一段Lumiere的演示视频 。画质非常高清 , 且真实 。
Sora炸裂科技圈:真神还是焦虑制造机

文章插图
▲图:由Lumiere生成的游泳海龟视频
Lumiere除了可以生成真实图片外,还可以实现一键换装、根据图片和提示词生成动态视频等功能 。
Sora炸裂科技圈:真神还是焦虑制造机

文章插图
▲图:一键换装
Sora炸裂科技圈:真神还是焦虑制造机

文章插图
▲图:通过图片生成视频
2月15日,刚刚过完情人节的谷歌在疯狂星期四又重磅推出了下一代AI产品Gemini 1.5 。在此前的演示视频中 , Gemini已经展现了其在图像识别和多轮对话中的逆天能力 。
演示视频中 , 演示人员画了一个类似鸭子的轮廓让Gemini辨认 , Gemini表示它觉得像个鸟 。
Sora炸裂科技圈:真神还是焦虑制造机

文章插图
▲图:Gemini演示
但是当演示人员画上了波浪后,Gemini表示通过长脖子长嘴又会游泳这几个依据,判断这是只鸭子 。
Sora炸裂科技圈:真神还是焦虑制造机

文章插图
▲图:Gemini演示
随后演示人员拿了个玩具小鸭子问Gemini这个东西是什么材质做的,Gemini表示看起来可能是橡胶也可能是塑料 。而当演示人员捏响橡胶鸭子后,Gemini立刻判断出是用柔软的橡胶做成的 。
Sora炸裂科技圈:真神还是焦虑制造机


推荐阅读