深度聚类的可视化解释( 三 ) _深度聚类

文章插图
Complete Pipeline from Image to Clustering in DeepCluster
本文使用Johnson的K-means实现，faiss库里有。因为聚类必须在所有图像上运行，所以它需要花费总训练时间的三分之一。
聚类完成后，将创建新的图像batch，这样来自每个聚类的图像都有相同的被包含的机会。对这些图像进行随机增强。
7. 表示学习
一旦我们有了图像和聚类，我们就像训练常规的监督学习一样训练我们的ConvNet模型。我们使用256的batch size，并使用交叉熵损失来比较模型预测和ground truth聚类标签。模型可以学习到有用的表示。

文章插图
Representation Learning Part of the DeepCluster Pipeline
8. 在模型训练和聚类之间切换
这个模型训练了500个epochs 。聚类步骤在每个epoch开始时运行一次，为整个数据集生成伪标签。然后，对所有batch继续使用交叉熵损失对卷积神经网络进行常规训练。本文采用动量为0.9、学习率为0.05、权值衰减为10^-5^的SGD优化器。使用用Pascal P100 GPU进行训练。
DeepCluster的代码实现官方实现：https://github.com/facebookresearch/deepcluster，还有AlexNet和Resnet-50的预训练权重：https://github.com/facebookresearch/deepcluster#pre-trained-models 。
英文原文：https://amitness.com/2020/04/deepcluster/

深度聚类的可视化解释( 三 )

推荐阅读

瘦身下半身的运动是什么？

孕妇孕妇吃米粉好吗

刚买回来猫需要检查什么，刚买回来的小猫不吃东西怎么办

肝脏|肝病\救星\找到了，不是猪血，没事泡点，清理肝毒，肝越来越好

明星照片|霍建华林心如与友人聚餐，3岁女儿正面照首曝光，长相甜美惹人爱

布拉德·皮特|希洛：出生就巅峰，遗传朱莉和皮特的超高颜值，16岁美出水

爱范儿用机器人取代人类编辑，这事能行吗？

番位|85花和她们的二番男搭档

震源深度|河北唐山市古冶区发生5.1级地震，震源深度10千米

环球资讯快报|配96单元导弹垂发系统，火力仅次于055大驱，伊朗版濒海舰亮相

Intel|NUC 12发烧版迷你机用上Intel独立显卡：16TB+1TB 1.36万元

hpv九价和四价的区别

面试@当HR问你期望薪水多少？千万别先亮底牌，这样回答才显情商高

虎扑足球|未遵守防疫规定遭重罚！奥地利联赛领头羊被扣6分丢掉榜首

数码小小白还在用4G网的iPhone11，为何如此火爆，5G时代来临

『呆妹儿』小团团和呆妹和好了？两人首次连线开黑，菜到无法直视

龙之队|iPhone12起售价4899元？网友：为收割华为高端用户吧

口腔保卫者：种植牙为什么会受欢迎？

比尔盖茨|比尔盖茨决定离婚后被扒：每年都和前女友度假

潮人|潮流 | 2Pac于服刑中所创作之诗词《4 What It’z Worth》正式曝光