【机器之心】人脸合成效果媲美StyleGAN,而它是个自编码器( 二 )
本文插图
图 2:StyleALAE 架构 。 StyleALAE 编码器中的实例归一化(IN)层用来提取多尺度风格信息 , 并通过可学习的多重线性映射(multilinear map)将它们组合成为一个潜在代码 w 。
实现
ALAE 的算法训练过程参见下图:
本文插图
ALAE 效果如何?
该研究在多个数据集上评估了 ALAE 的性能 , 实验代码和数据参见 GitHub 地址 。
在 MNIST 上的性能
研究者使用 MNIST 数据集训练 ALAE , 并使用特征表示来执行分类、重建和分析解耦能力的任务 。
本文插图
表 2:不同方法在 MNIST 分类任务上的性能 。
本文插图
图 3:MNIST 重建效果 。
StyleALAE 学习风格表征的能力
研究者在 FFHQ、LSUN 和 CelebA-HQ 数据集上评估 StyleALAE 的性能 。
本文插图
表 3:不同方法在 FFHQ 和 LSUN 数据集上的 FID 分数 。
本文插图
表 4:不同方法的感知路径长度(PPL) , 表示表征解耦程度 。
本文插图
图 5:FFHQ 重建结果 。 StyleALAE 对未见过的图像的 1024×1024 重建结果 。
本文插图
图 6:StyleALAE 的 FFHQ 生成结果(1024 × 1024 分辨率) 。
本文插图
图 9:StyleALAE 的风格混合效果 。 「coarse styles」从 Source 图像中复制了高级特征 , 如姿势、大致发型和脸型 , 从 Destination 图像中复制了所有颜色(眸色、发色和光照);「middle styles」从 Source 图像中复制了较小型的面部特征例如发式、眼睛睁/闭 , 从 Destination 图像中复制了脸型;「fine styles」从 Source 图像中复制了颜色和微结构 。
本文插图
图 8:不同方法在 CelebA-HQ 数据集上的重建结果 。 第一行是真实图像;第二行:StyleALAE;第三行:Balanced PIONEER;第四行:PIONEER 。
从图中可以看出 , StyleALAE 的生成结果更加清晰 , 失真度也最低 。
推荐阅读
- 带你吃瓜做个无情的尖叫机器啊啊——任嘉伦《琵琶行》造型大片抢先看,200505
- 军人驿站国际观察俄土科技差距显露无疑,美称此战可载入史册,叙利亚爆发机器人大战
- 松鼠军评俄土科技差距显露无疑,美称此战载入史册,叙利亚爆发机器人大战
- 埃尔法哥哥还可以做扫地机器人啊,自动驾驶不做了
- 界面新闻MIT:美国制造业每多1个机器人,平均取代3.3名工人
- 读懂新金融营销、城市、机器人、养牛养鱼……新型科技公司的十八般武艺
- 掘金界金融安防市场规模或超千亿,关注3股,首个人脸识别国际标准发布
- 极客公园机器人大爆发的时代来了?风口上的优必选说要「保持冷静」
- 15个最流行的GitHub机器学习项目
- 上观新闻疫情不改发展进程 协同创新推动“智造”加速跑,“机器人”核心部件实现自主研发