深度聚类的可视化解释 _深度聚类

作者：Amit Chaudhary
编译：ronghuaiyang

导读

视觉上的自监督学习方法，结合聚类，将无监督转变为有监督。

许多自监督方法使用[pretext tasks](https://amitness.com/2020/02/illustrated-selfsupervision -learning/)来生成代理标签，并将无监督学习问题转化为有监督学习的问题。一些例子包括旋转预测，图像着色，拼图等。然而，这样的pretext任务是依赖于领域的，需要专业知识来设计它们。
DeepCluster是Facebook AI研究的Caron等人提出的一种自监督方法，带来了一种不同的方法。这种方法不需要特定于领域的知识，可以用于学习缺乏注释数据的场景的深层表示。
DeepClusterDeepCluster结合了两部分：无监督聚类和深度神经网络。提出了一种端到端联合学习深度神经网络参数及其表示的聚类分配的方法。这些特征被迭代地生成和聚合，最后得到一个训练过的模型和标签作为输出结果。
Deep Cluster Pipeline现在让我们了解一下深度聚类的pipleline是如何工作的。

文章插图
End to End Pipeline of DeepCluster Paper
简介：
如上图所示，将拍摄未标记的图像并对其应用图像增强。然后，使用AlexNet或vgg16等ConvNet架构作为特征提取器。首先，对ConvNet进行随机权值初始化，并在最终的分类头之前从层中取特征向量。然后使用PCA对特征向量进行降维，同时进行白化和L2归一化。最后，将处理后的特征传递到K-means，对每幅图像进行聚类分配。
这些聚类分配被用作伪标签，并训练ConvNet来预测这些聚类。用交叉熵损失来衡量模型的性能。模型训练了100个epoch，每个epoch进行一次聚类的操作。最后，我们可以将学到的表示用于下游任务。
手把手的例子让我们通过一个从输入数据到输出标签的整个pipeline的一步步例子来看看DeepCluster是如何实际应用的：
1. 训练数据
我们从ImageNet数据集中提取未标记的图像，该数据集包括130万张图像，均匀分布在1000个类中。这些图像的minibatch为256 。

文章插图
Example of ImageNet datasets for DeepCluster
N幅图像的训练集在数学上可以表示为：

文章插图

2. 图像增强
将各种变换应用于图像，以便学习到的不受增强的影响的特征。分别在训练模型学习表示和将图像表示发送到聚类算法时进行了两种不同的增强：
Case 1: 聚类时使用的变换
【深度聚类的可视化解释】当要把模型表示送去进行聚类时，不使用随机增强。图像简单地调整为256×256，并使用中心剪裁得到224×224的图像。然后应用归一化。

文章插图
Augmentations done during clustering in DeepCluster
在PyTorch中，可以这样实现：

from PIL import Imageimport torchvision.transforms as transformsim = Image.open('dog.png')t = transforms.Compose([transforms.Resize(256),                        transforms.CenterCrop(224),                        transforms.ToTensor(),                        transforms.Normalize(mean=[0.485, 0.456, 0.406],                                             std=[0.229, 0.224, 0.225])])aug_im = t(im)

Case 2: 训练模型时候的变换
当模型在图像和标签上进行训练时，我们使用随机增强。图像裁剪为随机大小和高宽比，然后调整为224*224 。然后，图像水平翻转的概率为50% 。最后，利用ImageNet均值和方差对图像进行归一化。

文章插图
Sequence of Image Augmentations Used before passing to model
在PyTorch中，可以这样实现：

from PIL import Imageimport torchvision.transforms as transformsim = Image.open('dog.png')t = transforms.Compose([transforms.RandomResizedCrop(224),transforms.RandomHorizontalFlip(),transforms.ToTensor(),transforms.Normalize(mean=[0.485, 0.456, 0.406],std=[0.229, 0.224, 0.225])])aug_im = t(im)
上一页
1
2
3
下一页
		  	





























推荐阅读

           
                  
              
                  历史趣谈人|见人就掏心掏肺的三大生肖女，傻乎乎的，待人善良真诚，最没心眼 
                
                   
                
              
            

                  
              
                  央视|加拿大扮演了美方帮凶，外交部：孟晚舟事件是彻头彻尾的政治事件 
                
                   
                
              
            

                  
              
                  国安|从四连胜到三轮不胜，国安和鲁能完全“颠倒”！两战升班马太丢人 
                
                   
                
              
            

                  
              
                  大厦|接连出售资产 *ST时万保壳动作不断 
                
                   
                
              
            

                  
              
                  iQOO手机iQOO 5系列前瞻！性能、拍照、惊喜都有了，就差一个真香价？ 
                
                   
                
              
            

                  
              
                  甲状腺@床头不要随便放这3样东西，致癌风险越大！你的床头有几样？ 
                
                   
                
              
            

                  
              
                  迪拜收入水平是多少？ 阿联酋迪拜 
                
                   
                
              
            

                  
              
                  「楠竹一」随后得出悲观结论，中国不会再中招，美曾秘密试验切断GPS信号 
                
                   
                
              
            

                  
              
                  世界第二高峰是哪座峰?世界最高第二峰是什么峰 
                
                   
                
              
            

                  
              
                  乐居网推动科技创新助力物业管理升，红杉中国、腾讯共同战略投资世茂服务 
                
                   
                
              
            

                  
              
                  杜海涛和沈梦辰结婚了吗？杜海涛28岁就身家过亿，为何抠门到卖粉丝礼物？ 
                
                   
                
              
            

                  
              
                  我叫小丁兰|搞怪有趣，总有一个逗乐你，幽默段子：让你笑掉大牙的幽默笑话 
                
                   
                
              
            

                  
              
                  同花顺财经@5G吞噬Wi-Fi：流量锐减 
                
                   
                
              
            

                  
              
                  今朝装饰 今朝装饰进军适老装修 蓝海还是噱头 
                
                   
                
              
            

                  
              
                  跟团旅游有哪些不人性化的地方 
                
                   
                
              
            

                  
              
                  橘片爽蒸蛋的做法是什么？ 
                
                   
                
              
            

                  
              
                  4am战队|Pcs7落幕，4AM拿102分倒数第一，韦神的职业生涯或将到此为止 
                
                   
                
              
            

                  
              
                  飞豹战机|美航母火速逃离南海，大批飞豹战机返航基地，俄：这一刻扬眉吐气 
                
                   
                
              
            

                  
              
                  周文健|知名港星现身豪宅吃大餐！62岁发福变化大，定居内地花200万开店 
                
                   
                
              
            

                  
              
                   【西藏飞蝗】我国蝗虫研究史、蝗虫品种及蝗灾最新控制技术 
                
                   
                
              
            

          

后端开发必备的 MySQL 日志文件知识点 

茶叶的原产地是中国吗,茶叶发源于中国 

一致性哈希算法的介绍与实现 

禅意绿茶十二道,喝出时尚的禅意生活 

Linux中显示当前挂载的文件系统命令-findmnt 

炒青绿茶哪里产的,绿茶的分类先容 

Linux系统中虚拟设备文件的各种实用用法 

茶叶在贮藏时的变化,茶叶贮藏保管的重要性 

7个接外包私活的网站，程序员不可不看 

滇红茶的冲泡方法,滇红茶的泡法