澄澈的眼|GAN/VAE地位难保?Flow在零样本识别任务上大显身手( 五 )


4 实验结果
1、模拟数据的仿真结果我们首先在模拟数据上做了一些仿真性实验 , 用来验证我们的两个研究动机:
1、生成流是否比GAN和VAE更适用于零样本识别任务?
2、所提出的iMMD损失函数是否能够解决零样本识别中普遍存在的偏移问题?
具体而言 , 给定图(a)所示四类仿真数据 , 其中三类可见 , 一类不可见 。 图(b)是我们方法生成的数据分布结果 , 图(c)和(d)分别是GAN和VAE加上我们提出的iMMD损失的结果 。
显而易见 , GAN和VAE由于训练不稳定等因素 , 无法生成满意的数据分布 。 而我们方法生成的数据则比较符合真实的数据分布 。
图(f-h)则展示了不同参数下iMMD损失的效果 。 可以看到:不加iMMD损失生成的不可见类别数据会向可见类别有所偏移;加过大的iMMD损失同样无法得到稳定的数据生成结果;加正向的MMD损失则会放大原本已经存在的偏移问题 。
澄澈的眼|GAN/VAE地位难保?Flow在零样本识别任务上大显身手2、真实数据库的实验结果我们在国际通用的四个数据库(AwA1&2、CUB、SUN、APY)上将我们方法与目前最好方法进行了一系列对比 。 我们采用两种不同的实验设置 , 即经典零样本学习(Classic ZSL , CZSL)和泛化零样本学习(Generalized ZSL , GZSL) 。
下表展示的是在GZSL实验设置下的实验结果 , 图中加粗的数据表示目前最好效果 , 表中“H”列是最重要的对比指标 , 最后两行是我们方法的结果 。
可以看出 , 我们方法在不同数据库上均领先于目前已有算法 , 并且在H指标上有着不小的提升 , 比如在APY数据库上比排名第二的方法提升了约6% 。
澄澈的眼|GAN/VAE地位难保?Flow在零样本识别任务上大显身手下表展示的是不同方法在CZSL设置下的实验结果 , 除了CUB数据库(我们比最好方法低了0.5%) , 我们在其他数据库上都取得了目前最好的零样本识别效果 。 比如在AwA2数据库上 , 我们比第二名提升了6.4% 。
澄澈的眼|GAN/VAE地位难保?Flow在零样本识别任务上大显身手我们也对所提出的生成流方法进行了一系列对比实验/性能分析(Ablation Study) , 如下表所示 。
具体而言 , 我们对所提出框架中的一些关键因素通过控制变量方法 , 从而得出每个部件在整体模型中的作用 。
我们首先尝试将生成流模型替换为条件VAE模型 , 可以看出 , 识别率大幅下降 , 某些指标下降幅甚至达到50% , 这也从侧面证明了生成流模型对零样本识别任务的贡献和重要性 。
其次 , 我们还尝试移除我们提出的两个损失函数 , 可以看到 , 整个模型的效果大打折扣 。 通过指标下降幅度 , 我们也可以看出在这两个损失中 , iMMD损失对整体识别效果更具有决定性作用 。
澄澈的眼|GAN/VAE地位难保?Flow在零样本识别任务上大显身手【澄澈的眼|GAN/VAE地位难保?Flow在零样本识别任务上大显身手】此外 , 我们还针对不同参数做了一些对比实验 , 也展示了一些可视化结果 , 感兴趣的读者可以查看论文进一步阅读 。
澄澈的眼|GAN/VAE地位难保?Flow在零样本识别任务上大显身手


推荐阅读