MIT下架偏见数据集,Bengio兄弟建议多引少数群体论文:BLM运动持续


机器之心报道
参与:杜伟、小舟、张倩
继 Yann LeCun 为存在数据偏见的算法辩护被骂退出推特之后 , BLM 运动继续在学界蔓延 。 MIT 宣布永久下架包含种族和性别歧视标签图像的 Tiny Images 数据集 , 并致歉 。 此外 , 谷歌研究科学家 Samy Bengio 针对学界中的「名人效应」提出自己的建议 , 呼吁「有意识地引用较低关注度学者的论文」 , 从而引发网友热议 。
MIT下架偏见数据集,Bengio兄弟建议多引少数群体论文:BLM运动持续
本文插图
轰轰烈烈的「Black Lives Matter」运动已经持续了一个多月 , 虽然已有缓和迹象 , 但整体运动开始往各领域蔓延 , 包括学术界 。
在活动刚开始的第十几天 , 全美学界曾掀起过一场停摆 24 小时的运动 , arXiv、Nature、Science 全部暂停更新 , 以重新思考黑人群体在学界的地位 。
虽然活动仅进行了一天 , 但「思考」远未结束 。 最近 , 一位非裔女科学家把大家重新拉回了这一话题 。
事件的起因是 DeepMind 6 月 29 号官宣的一门生成对抗网络(GAN)课程 。 课程的内容比较基础 , 主要介绍 GAN 的原理、优化、改进以及一些变体 。
乍看之下 , 这门课好像没什么问题 。 但是 , 一位名叫 Adji Bousso Dieng 的研究者质问道:「既然你们要开 GAN 的课 , 为什么我在 DeepMind 提出的 PresGAN 没有被包含在内?是因为这篇论文的一作(我)是黑人女性吗?」「我已经厌倦了这种轻视、轻易抹掉我的贡献的行为 。 」
MIT下架偏见数据集,Bengio兄弟建议多引少数群体论文:BLM运动持续
本文插图
这位 Adji Bousso Dieng 是什么来头?
Dieng 来自非洲塞内加尔 , 是哥伦比亚大学统计学系的一名博士研究生 。 她的主要研究方向是将概率图形建模和深度学习结合起来 , 为结构化的高维数据设计模型 。 她的研究工作得到了谷歌博士奖学金的支持 。
读博期间 , Dieng 连续几年在 ICLR、NeurIPS 等顶会参与组织 workshop , 还在微软、Facebook AI 、DeepMind 做过实习生 。 上面提到的 PresGAN 便是她在 DeepMind 实习期间做的 。
根据 Dieng 提供的链接 , 我们找到了这篇论文 。 在论文中 , Dieng 提出了一种 GAN 变体 PresGAN , 主要改进的地方是在密集网络的输出中添加噪声并对熵正则化对抗损失进行优化 。 添加的噪声对预测性对数似然的易处理近似进行渲染 , 并实现训练流程的稳定 。 实验结果表明 , PresGAN 可以减轻模式崩溃并生成高感知质量的样本 。 此外 , PresGAN 还可以缩小传统 GAN 和变分自编码器在预测性对数似然方面的性能差距 。
MIT下架偏见数据集,Bengio兄弟建议多引少数群体论文:BLM运动持续
本文插图
论文链接:https://arxiv.org/pdf/1910.04302.pdf
虽然宣称的效果还不错 , 但遗憾的是 , 这篇论文在 Google Scholar 上的被引量只有「5 次」 。
MIT下架偏见数据集,Bengio兄弟建议多引少数群体论文:BLM运动持续
本文插图
有人认为 , 这就是一篇平平无奇的论文 , 评估结果也很弱 , 即使在 CIFAR-10 上也比 SOTA 差很多 。
MIT下架偏见数据集,Bengio兄弟建议多引少数群体论文:BLM运动持续
本文插图
而且 , 这只是一篇挂在 arXiv 上的论文 , 还没有经过同行评审 。 「多数人不会倾向于引用一篇未经同行评审的论文 。 」
MIT下架偏见数据集,Bengio兄弟建议多引少数群体论文:BLM运动持续
本文插图
总之 , 大家认为 , 这篇论文之所以被引量低 , 并不是因为种族问题 , 而是论文本身不够硬 。
但也有人在看过论文后表示 , 这是一篇不错的论文 , 可能真的被社区低估了 。


推荐阅读