图片|文本转图片的危险算法“达利”降临:“造假”程度绝了( 二 )


文章图片

歪脸的马斯克
但短短2年,第二代达利就取得了惊人的进步,而这取决于算法模型的重新设计,因为初代版本或多或少是GPT-3的一种扩展 。
当然,新版本也有不少问题 。
譬如,输入“把艾菲尔铁塔送上月球”后,出现的图像仅仅是一张“夜晚下的埃菲尔铁塔” 。所以,OpenAI的科学家们还在输入更多数据改进它 。另外,仔细观察这些生成的图像,你会发现一些“弱点”:
像很多刚“出生”的算法模型一样,达利在描绘“手脚”等细节上仍然非常吃力 。很明显,宇航员的手脚,以及猫的爪子都有一点不自然 。
图片|文本转图片的危险算法“达利”降临:“造假”程度绝了
文章图片

输入文字:骑着马的宇航员 。很明显手脚细节有问题
但无论如何,达利都是个值得让我们赞一声“牛逼”的技术进步 。甚至于,由于这波能力表现突出,它引发的恐慌,不亚于此前文字生成模型GPT3带来的文字造假争议 。
亚利桑那州立大学计算机科学教授苏巴拉奥的话直言不讳:“你可以用它来做好事,但你肯定可以用它来做更加疯狂的事情,包括深度伪造的照片和视频 。”
没错,虽然工程师展示出的这些作品,看起来艺术创造水平非凡,但与所有人工智能系统的典型特征相同,它一定会从训练自己的大量数据属性中继承某种“偏见” 。
譬如,当你输入“律师”,系统结果都是这样的:
图片|文本转图片的危险算法“达利”降临:“造假”程度绝了
文章图片

所有律师都是男性,且大多看起来是白人
算法的性别与人种偏见问题,自诞生之日便在欧美地区争议多年,迄今都无法解决,甚至有愈演愈烈之势 。这也是导致包括亚马逊、谷歌等公司无法大规模部署人脸识别系统的关键原因之一 。
另外,试想一下,当初在“换头”算法盛行,外网网友喜欢把特朗普等领导人的头像移植到某个搞笑电视剧里,引发捧腹大笑;而达利的出现,是否有能力让我们不费吹灰之力,便可以做到任意输出大量政治造假照片 。
甚至于,当输入“某某吸毒、打架斗殴”这类显然足以陷害他人,改变他人命运的关键词,如果都会出现毫无违和感的图像,那么会带来什么后果?
与工程师对技术的痴迷不同,纽约时报的读者们对达利算法的评价极为犀利,思考深度不可小觑,甚至可以说直击人类的灵魂:
人们将不得不对他们在网上看到的几乎所有东西持怀疑态度 。
这个系统的出现,会让“天平”向一个更加奇异与危险的世界倾斜 。
人类还没有在哲学上发展到能够负责任地使用技术的程度 。就像加密货币一样,骗子似乎也总是被技术那“厌恶人类”的一面所吸引 。
我很高兴这个工具没有被公开 。如果这件事公开了,(我)最明智的做法是完全脱离网络和电视,避免与那些想告诉你自己在网络上看到什么东西的人有任何接触 。 如果未来全息影像成为主流,那么我们将为子孙后代创造一个反乌托邦式的地狱 。
正如社交媒体与技术革命一样,硅谷的能力远远超过人们的批判性思维 。我们现在生活在一个教育被忽视了几十年的世界里,人们分析事物的能力已经让位于“应用公式” 。
与此同时,硅谷技术的发展正在提供不可抗拒的便利 。因为我们很多人都忙于生存,所以我们支持这种便利,甚至没有时间来反思它的影响 。因此,我们现在不再是挥舞锤子的人,而是大多数的钉子 。
图片|文本转图片的危险算法“达利”降临:“造假”程度绝了
文章图片

输入“空乘工作者”,出现的都是女性乘务员形象
我认为,关于人工智能的普及已经足有七八年,而大众之如今仍然会心生恐惧,是因为体验过被监控和数据之网牢牢困住的感觉后,即便惊喜于达利系统的强大创造力,也早就超越了“事不关己、高高挂起”的心态:
不知道这些曾经的笑话,什么时候会落到自己头上 。
正是鉴于西方社会这种对达利又惊又恐的态度,OpenAI已经反复公开强调,这绝对不是一个产品,自己仅仅是想了解算法的能力与局限性 。
他们保证会严格控制达利的使用权,只会向一小部分经过严格审查的测试人员开放;未来只会在艺术家工具层面做一些有限制的尝试 。


推荐阅读