【机器之心】人脸合成效果媲美StyleGAN，而它是个自编码器( 二 )

本文插图
图 2：StyleALAE 架构。 StyleALAE 编码器中的实例归一化（IN）层用来提取多尺度风格信息，并通过可学习的多重线性映射（multilinear map）将它们组合成为一个潜在代码 w 。
实现
ALAE 的算法训练过程参见下图：

本文插图
ALAE 效果如何？
该研究在多个数据集上评估了 ALAE 的性能，实验代码和数据参见 GitHub 地址。
在 MNIST 上的性能
研究者使用 MNIST 数据集训练 ALAE ，并使用特征表示来执行分类、重建和分析解耦能力的任务。

本文插图
表 2：不同方法在 MNIST 分类任务上的性能。

本文插图
图 3：MNIST 重建效果。
StyleALAE 学习风格表征的能力
研究者在 FFHQ、LSUN 和 CelebA-HQ 数据集上评估 StyleALAE 的性能。

本文插图
表 3：不同方法在 FFHQ 和 LSUN 数据集上的 FID 分数。

本文插图
表 4：不同方法的感知路径长度（PPL），表示表征解耦程度。

本文插图
图 5：FFHQ 重建结果。 StyleALAE 对未见过的图像的 1024×1024 重建结果。

本文插图
图 6：StyleALAE 的 FFHQ 生成结果（1024 × 1024 分辨率）。

本文插图
图 9：StyleALAE 的风格混合效果。「coarse styles」从 Source 图像中复制了高级特征，如姿势、大致发型和脸型，从 Destination 图像中复制了所有颜色（眸色、发色和光照）；「middle styles」从 Source 图像中复制了较小型的面部特征例如发式、眼睛睁/闭，从 Destination 图像中复制了脸型；「fine styles」从 Source 图像中复制了颜色和微结构。

本文插图
图 8：不同方法在 CelebA-HQ 数据集上的重建结果。第一行是真实图像；第二行：StyleALAE；第三行：Balanced PIONEER；第四行：PIONEER 。
从图中可以看出， StyleALAE 的生成结果更加清晰，失真度也最低。

【机器之心】人脸合成效果媲美StyleGAN，而它是个自编码器( 二 )

推荐阅读

「生活万万千」句句散发正能量，读读收获很多，朋友圈励志的句子

国家茶叶专家应邀赴安庆规划示范茶厂建设

百因必有果的梗是什么意思百因必有果这句话对吗

蒋欣|40岁蒋欣同框41岁孙俪，一个风姿卓越，一个老气横秋

MacBook|网友吐槽新MacBook Pro尴尬体验：刘海会遮挡鼠标指针

『直播吧』4、5月预计出现糟糕情况，联合国：疫情或导致粮食危机

荣耀智慧屏带动行业向电视3.0升级

【趣味人生的星座】月季盛开，鸳鸯苏醒，3星座旧缘回眸，余生不分离，下月初

什么是未来保险营销的主流趋势？

青年|魔兽世界怀旧服：TAQ阶段有哪些资源必涨价？

国产有机奶粉哪款好？君乐宝优萃2种益生菌组合更健康！

『美军』打着航行自由的幌子，美接二连三在南海秀肌肉，南部战区发出警告

漫步|在丹麦的街头吹吹风，骑上单车

卫浴间南方人冬天连厕所都不敢上？北方人笑了

埃文特纳为什么没打出来埃文特纳

「大喵说音乐」他是永远不会被人遗忘的自由诗人，他是许巍

土土女排|女排奥运劲敌手术！里约奥运资历尚浅遭弃，曾追传埃格努险胜丁霞

猫扑网论坛登录__什么是猫扑网？

国门中国动画《五六七》冲出国门！第二季已续订

琢衫人34岁李小萌穿衣大胆！大露背红裙穿出少女感，一张娃娃脸太有优势，原创