【机器之心】人脸合成效果媲美StyleGAN,而它是个自编码器( 二 )


本文插图
图 2:StyleALAE 架构 。 StyleALAE 编码器中的实例归一化(IN)层用来提取多尺度风格信息 , 并通过可学习的多重线性映射(multilinear map)将它们组合成为一个潜在代码 w 。
实现
ALAE 的算法训练过程参见下图:
【机器之心】人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图
ALAE 效果如何?
该研究在多个数据集上评估了 ALAE 的性能 , 实验代码和数据参见 GitHub 地址 。
在 MNIST 上的性能
研究者使用 MNIST 数据集训练 ALAE , 并使用特征表示来执行分类、重建和分析解耦能力的任务 。
【机器之心】人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图
表 2:不同方法在 MNIST 分类任务上的性能 。
【机器之心】人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图
图 3:MNIST 重建效果 。
StyleALAE 学习风格表征的能力
研究者在 FFHQ、LSUN 和 CelebA-HQ 数据集上评估 StyleALAE 的性能 。
【机器之心】人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图
表 3:不同方法在 FFHQ 和 LSUN 数据集上的 FID 分数 。
【机器之心】人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图
表 4:不同方法的感知路径长度(PPL) , 表示表征解耦程度 。
【机器之心】人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图
图 5:FFHQ 重建结果 。 StyleALAE 对未见过的图像的 1024×1024 重建结果 。
【机器之心】人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图
图 6:StyleALAE 的 FFHQ 生成结果(1024 × 1024 分辨率) 。
【机器之心】人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图
图 9:StyleALAE 的风格混合效果 。 「coarse styles」从 Source 图像中复制了高级特征 , 如姿势、大致发型和脸型 , 从 Destination 图像中复制了所有颜色(眸色、发色和光照);「middle styles」从 Source 图像中复制了较小型的面部特征例如发式、眼睛睁/闭 , 从 Destination 图像中复制了脸型;「fine styles」从 Source 图像中复制了颜色和微结构 。
【机器之心】人脸合成效果媲美StyleGAN,而它是个自编码器
本文插图
图 8:不同方法在 CelebA-HQ 数据集上的重建结果 。 第一行是真实图像;第二行:StyleALAE;第三行:Balanced PIONEER;第四行:PIONEER 。
从图中可以看出 , StyleALAE 的生成结果更加清晰 , 失真度也最低 。


推荐阅读