|谷歌开放AI怪兽制造机,快来打造你的数码宝贝世界吧
本文插图
作者 | 青暮
艺术创作通常不仅对艺术创造力要求极高 , 也需要高超的技巧 , 要磨练出这样的技巧需要花费大量的时间和精力 。
我们对具备高超技巧的艺术作品自然充满敬意 , 欣赏这类作品也能带来极大满足感 。
本文插图
但艺术作品的灵魂还是在于创造力 , 有时候表现手法比绘画技巧更加重要 。 让作品优秀到忽略画风 , 也是一种伟大的能力 。
本文插图
然而 , 如果工具能够更加智能一些 , 不仅仅是充当工具 , 更像是扮演着助手的角色 , 是不是更能让艺术家释放自己的创造天分呢?
今天 , 谷歌就给我们带来了这样的惊喜 。 他们开放了一个机器学习模型的Demo , 其功能简单来说就是“你画轮廓 , 我补细节” 。
本文插图
正如上图所示 , 只需要根据部位选择画笔颜色 , 比如淡紫色代表翅膀、红色代表头部 , 勾勒出轮廓后 , 点击一下“转换” , 就创造出真实的怪兽了 。
本文插图
看 , 这只AI生成的怪兽光影细节逼真、立体感满满 , 只是 , 看起来不够可怕?
本文插图
没关系 , 我们再给它添加点棱角 , 也就是几笔几画的事情 。
【|谷歌开放AI怪兽制造机,快来打造你的数码宝贝世界吧】
本文插图
这样是不是威猛多了?
这款怪兽生成器名为Chimera Painter , Chimera即奇美拉 , 是希腊神话中狮首、羊身、蛇尾的神兽 , 也就是具有不同物种特征的拼接生物 。
拼接是很古老的艺术创作手法 , 比如先秦奇书《山海经》中的奇珍异兽基本都是各种真实生物的拼接产物 。
本文插图
山海经版人鱼
谷歌取这名字的暗示是 , 你可以按照自己的想法自由拼接不同的生物体 , 打造自己的怪兽 。
但问题在于 , 手残党可能连基本特征都画不出来...且慢 , 作者还是很贴心的 , 他们为用户提供了四种不同的原型 。 即使不能大刀阔斧地从头创造怪兽 , 也能精雕细琢去“美化”原型 。
本文插图
Chimera Painter用户界面(地址:https://storage.googleapis.com/chimera-painter/index.html)
用户可以选择一个参考生物 , 然后调整生物部分的形状、类型或位置 , 从而可以快速探索并创建大量图像 。 此外 , 这个Demo还允许上传本地图像 。
Chimera Painter背后的模型架构即我们熟悉的生成对抗网络(GAN) , 并且是条件GAN , 用颜色块代表生物体部件的语义 。 从模型效果角度 , 可以看成是语义分割网络的逆变体 , 但训练方法不同 。
实际上 , 英伟达也曾经开发出类似的模型GauGAN(CVPR 2019 oral) , 它可以将分割图转换为风景图 , Chimera Painter可以看成是GauGAN的怪兽版本 。
本文插图
为了训练GAN , 谷歌创建了全彩色图像的数据集 , 其中包含了由3D生物模型转换的单一物种生物轮廓 。 生物轮廓线描绘了生物的形状和大小 , 并提供了个体身体部位的分割图信息 。
模型经过训练后 , 接下来的任务是根据艺术家提供的轮廓生成多物种的嵌合体 。 最后 , 将性能最好的模型合并到Chimera Painter中 。
下图展示了使用模型生成的一些示例 , 包括单物种生物(下排 , 海马、螃蟹、豪猪)以及更复杂的多物种嵌合体(下排 , 蚂蚁+豪猪、钝口螈+鲸鱼、飞蛾+螃蟹) 。
本文插图
游戏卡牌界面的设计充满着童年回忆的气息 , 但菜鸟小编只能小打小闹一番 , 有基础的玩家可能已经开始构建自己的数码宝贝世界了 。
通过结构学习创造生物
人类对生物身体解剖结构比如眼睛、手指、耳朵等的感知是很敏感的 , 但GAN通常很难对生成内容的结构有很好的语义理解 。
在GAN的随机采样图像中 , 我们经常能看到如下图中所示的混合体 , 其结构并不鲜明 , 这样的案例一般认为是失败的 。
本文插图
由于嵌合体生物的幻想特性 , 为了美学需要 , 生成这些生物需要一类全新的数据集 , 它必须是非摄影的、幻想的风格 , 还具有其它独特的特征 , 例如戏剧性的视角、构图和照明 。
于是 , 谷歌请了艺术家来构建数据集 。 比如对于下图中的鬣狗 , 艺术家会先使用虚幻引擎构建3D模型 , 然后分别用彩色纹理(左)和语义分割图(右)叠加到3D模型上 , 然后 , 使用虚幻引擎将3D生物模型放置在简单的3D场景中 , 这样一个数据对就完成了 。
本文插图
接下来 , 谷歌使用自动化脚本改变3D生物模型的姿态、视角、缩放尺寸 , 从而对数据集进行增强 。 使用这种方法 , 谷歌为每个3D生物模型生成了10000+张图像对 , 与手动创建(每张图像大约20分钟)相比 , 节省了数百万小时的时间 。
由于自动生成的图像存在一定程度的失真 , 谷歌还结合了艺术家的反馈对生成效果进行了改进 。 此外 , 感知损失也是一个重要因素 , 下图是使用不同的感知损失权重的GAN生成的示例 。
本文插图
上图中的某些变化是由于数据集中每种生物包含多种纹理(例如 , 红色或灰色的蝙蝠)而造成的 。
然而 , 除颜色以外 , 还有许多特征的差异与感知损失的变化直接相关 。 尤其是 , 谷歌发现某些值可以带来更鲜明的表面纹理特征 , 使生成的生物看起来更真实 。
本文插图
怎么样 , 心动了吗?祝看官玩的开心~
参考资料:
https://ai.googleblog.com/2020/11/using-gans-to-create-fantastical.html
本文插图
本文插图
推荐阅读
- 昆虫|近亿年前的虫珀里藏只“小怪兽”!中国科学家发现昆虫新物种
- 量子技术|清华教授攻克难题,量子技术取得突破,美国谷歌被弯道超车
- 新冠疫苗|全民免费!全面开放!关于新冠疫苗接种,浙江两地官宣…
- 中国天眼|中国天眼已发现300多颗脉冲星 4月将向全球科学家开放
- 开放获取|开放获取还是订阅?你有你的选择,《自然》统统支持
- 谷歌|谷歌开源AI模型“搜索引擎”,NLP、CV都能用
- 法耶·沙尔波|谷歌“街景”伦敦上空均拍到成队UFO
- 夏普|长白山天池怪兽真的存在吗,与美国夏普朗湖水怪极其相似
- 中国天眼|探访“中国天眼”大脑:10%观测时间将对全球科学界开放
- 异世界|SCP-354 不断长大的血池 向我们扔异世界怪兽玩