英伟达|英伟达又一次突破想象力：一句话实时P图在线试玩( 二 ) 英伟达又一次突破想象力：一

文章图片
那么，生成这一系列风景照的GauGAN2，背后究竟用了什么原理？
它与OpenAI今年发布的DALL·E和CLIP，又究竟有什么区别？
与DALL·E有什么不同？
2019年，英伟达GauGAN2的“前身”GauGAN正式开源。
当时的它，还只拥有其中一个能力，就是将涂鸦直接变成风景画，就像「神笔马良」一样，还推出了对应的软件Canvas：

文章图片
当然，这时GauGAN已经能随意改变画面风格了，从白天黑夜到春夏秋冬的气质都能稳稳“拿捏”：

文章图片
据英伟达介绍，GauGAN采用了一种基于空间适应标准化（SPADE）算法。
SPADE算法不仅使用随机的输入图像，还采用了一种被称作“分割图”的图像。在分割图中，每一个像素都会被归类，来生成更接近于真实的图像，这种模式被称作“图对图翻译” 。

文章图片
△GauGAN的技能点（狗头）
现在，英伟达将GauGAN升级成了GauGAN2，后者一共采用了1000万张高质量的图片、在英伟达Selene超算上进行训练，这台超算在Green500排行榜上排到世界第二。
生成这些风景画的效果和“手法”，是不是感觉有点熟悉？
没错，大多数人看到GauGAN2的第一眼，可能都会觉得它和OpenAI的DALL·E+CLIP有点像。
今年年初，OpenAI用DALL·E和CLIP两个模型，做了个“图像版”GPT-3，同样能用一句话生成图片。

文章图片
不过，这两个模型生成的内容其实不太一样。
GauGAN2专注于生成风景照，DALL·E+CLIP则更多地生成具体的物体，例如一把椅子或者一个闹钟等。

文章图片
这与它们的原理差异也有关系，GauGAN2更加注重“单词与视觉效果”之间的关系，例如“冬天”这种模糊的状态词给照片带来的效果；DALL·E+CLIP则更注重“文字-图像”这种有明确对应关系的物体效果。
据英伟达介绍，GauGAN2不同于“文本-图像”和“分割图像-图像”一类的模型，它所能产生的照片种类更多，质量也会更高。
不过，偶尔也会出现点bug…
比如给出“沙滩（beach）”一词后，有些生成的画面中出现了语言无法描述的事物。

文章图片
对此，英伟达表示，他们在训练中“完全没有用到任何人像照片” 。（所以可能是偶然？）
但这样一来，网友想要的“瑞克摇（Rick roll）”和“鬼畜视频生成”，GauGAN2大概也是没办法实现了。

文章图片
但是能生成仿佛梦境中才能见到的画面，也吸引了不少人来试玩。
这不，有人就晒出了自己生成的抽象画大作，并表示自己非常喜欢这个模型：

文章图片
还有人表示，GauGAN2给出了一些建筑设计的新idea啊。

文章图片
也有网友觉得这种能够自动生成景观的功能，未来Adobe可能也会用上。
或许就是下一个画手利器？

文章图片
最后，GauGAN2在浏览器上就能试玩，欢迎大家留言讨论自己的体验感受~
GauGAN2试玩Demo地址：http://gaugan.org/gaugan2/

英伟达|英伟达又一次突破想象力：一句话实时P图在线试玩( 二 )

推荐阅读

豹猫■甘肃发现5只猛兽，远看像豹近看像猫，幼崽10天才睁眼20天就断奶

橙子娱乐C|给张子枫发微信被拉黑，人不红有多可怜？给陈伟霆打电话无人接

钱江晚报|宁波高三学霸男孩，被担架抬进高考考场！妈妈深夜写下一篇长文，看哭了

网红雪梨被曝当小三，直接被正室捉奸在床，现场不堪视频曝光

大小姐的荣耀世界■赵云诸葛亮对话令人心跳，孙悟空再也不皮了，王者荣耀：英雄喝醉后本性流露

昆虫科学家开发机器人摄像系统，可实时追踪在空中飞行的昆虫

WHOO后护肤品▲后的护肤品孕妇可以用吗

北青网综合|天降铁球砸死女婴，四川船山法院判整栋楼每户赔3千

北京警方：查处散布恐慌类谣言32起其中一女网民被刑事拘留

新华网|航海日里学知识

衣服上沾上墙涂料怎么办?

电脑最基本的办公软件推荐电脑管理软件哪个更好

心理健康|晚上10点就困了，早上三、四点醒来，是不是衰老的迹象？

暴涨近300% 这只可转债刷新历史！中签赚近3000元这一打新品种彻底火了

健康码可以定位吗健康码可以定位吗

裤子|社死！尴尬！陈学冬称裤子裂了一天没人提醒

ubuntu16.04 unity桌面设置攻略

小雄美食平台|把剪刀放入大米真的太实用了，一年省下好几百，学到赚到，才知道

什么叫红茶有那些,红茶茶渣能干什么

如何减少青春痘(怎样让痘痘一夜消失)

英伟达|英伟达又一次突破想象力：一句话实时P图 在线试玩( 二 )

推荐阅读

英伟达|英伟达又一次突破想象力：一句话实时P图在线试玩( 二 )