不需要负样本对的SOTA的自监督学习方法：BYOL( 二 ) 作者：AbeFetterman,JoshAlbrecht编译

online network参数为θ ，和momentum network参数ξ 。 online network采用随机梯度下降法进行更新， momentum network采用online network的指数移动平均法进行更新。 online network允许MoCo将之前的投影放入memory bank中以进行高效的利用，并作为对比损失的负样本。这个memory bank支持更小的batch size 。在我们的狗图像的示意图中，正样本是同一副狗的图像的不同的crops ，负样本是在过去的mini-batch中使用过的完全不同的图像，这些图像存储在memory bank中。
在MoCo v2中用于投影的MLP不使用batch normalization 。
文章插图
MoCo v2 结构，上面是online编码器，下面是momentum编码器
BYOLBYOL建立在MoCo的momentum network概念上，增加了一个MLP(qθ) ，用来从z中预测z ' ，而不是使用对比损失， BYOL使用了L2来计算归一化预测p和目标z '之的误差。以我们的狗图像为例， BYOL尝试将狗图像的两种crop转换为相同的表示向量(使p和z '相等) 。因为这个损失函数不需要负样本，所以BYOL中不需要使用memory bank 。
BYOL中的两个MLPs只在第一个线性层之后使用batch normalization 。
文章插图
BYOL结构
根据上面的描述， BYOL似乎可以在不明确地对比多个不同图像的情况下学习。然而，令人惊讶的是，我们发现BYOL不仅在做对比学习，而且对比学习对它的成功是必不可少的。
我们的结果我们最初使用为MoCo编写的代码在PyTorch中实现了BYOL 。当我们开始训练我们的网络时，我们发现我们的网络的表现并不比random好。将我们的代码与[另一个实现：进行了比较，我们发现MLP中缺少了batch normalization 。我们很惊讶batch normalization化对于BYOL的训练是至关重要的，而MoCo v2根本不需要它。
对于我们的初始测试，我们使用带有动量的SGD ， batchsize为256的STL-10无监督数据集训练了一个使用BYOL的ResNet-18 。下面是在MLPs中使用和不使用batch normalization的同一个BYOL算法的前10个epochs的训练。
文章插图
在STL10上ResNet-18的早期训练中验证集的精度基本是线性的。在MLP中不进行批处理归一化的BYOL训练时，其性能并不比随机基线好。
为什么会这样？为了调查性能发生这种戏剧性变化的原因，我们执行了一些额外的实验。
文章插图
使用对比损失的实验配置，更好的和BYOL结果进行比较
因为与MoCo相比预测的MLP q改变了网络深度，我们想知道是否需要batch normalization来规范这个网络。也就是说，虽然MoCo不需要batch normalization ，但是当与额外的预测MLP q配对时， MoCo可能需要batch normalization 。为了测试这一点，我们开始用一个对比损失函数来训练上面的网络。我们发现，在10个epoch内，该网络的性能明显优于随机网络。这个结果让我们怀疑没有使用对比损失函数会导致训练依赖于batch normalization 。
然后，我们想知道另一种类型的规范化是否会有同样的效果。我们对MLPs应用了Layer Normalization而不是batch normalization ，并使用BYOL对网络进行了训练。在MLPs未进行归一化的实验中，其性能并不比随机的好。这个结果告诉我们，在同一个小batch中激活其他输入对于帮助BYOL找到有用的表示是至关重要的。

不需要负样本对的SOTA的自监督学习方法：BYOL( 二 )

推荐阅读

决战！平安京|决战平安京，返校季大揭秘，新手最全攻略！！！

十大蓝牙小音箱排行榜，酷狗蘑蘑小音节奏闪灯一键DJ“城会玩”

风筝|《追风筝的人》：每个人终其一生，都在追逐属于自己的命运

电视剧|同样是扮演“乞丐”，孙俪流鼻涕，周星驰抢狗盆，而他本色出演！

赵露思|《骄阳似我》又传出新阵容，李现将搭档赵露思，你认为符合吗？

顶级奢侈品集团Kering的代表品牌及产地和代表作品或风格有哪些

易简财经|27万股民今夜无眠，黄了！两家券商千亿级合并告吹

华为|华为迎来大消息！俄外长刚刚表态，俄罗斯准备与中国以及华为开展5G技术合作

『包不同』疫情之下，京东有惊喜！

#泌尿外科李成方#长期疲劳会影响身体的哪些部分？

亚美尼亚人|二十世纪初，亚美尼亚人遭到了大屠杀，100万人死于土耳其人之手

『雷帝网』CFO称汽车业回报周期长亏损是阶段性的，恒大健康亏近50亿

拜登|美国下任总统已定？拜登犯下“致命”错误，这次奥巴马也“保不住”他！

精子能有杀菌消炎作用吗

怎么样让别人愿意了解自己

时尚旅游守在富豪门前32年，谁能让他动就奖励一万，印度最“尽职”保安

口腔科张兴医生：种植牙要如何护理？牙科医生教你4招，轻松延长使用寿命！很实用

权志龙否认吸毒传闻，曾被指在机场行为异常，疑似毒瘾发作，12年前曾承认吸毒

李云迪和朗朗谁厉害？

高三最后一个学期是啥心态、