适用于少量数据的深度学习结构

作者:Gorkem Polat
编译:ronghuaiyang
导读
一些最常用的few shot learning的方案介绍及对比 。

适用于少量数据的深度学习结构

文章插图
 
传统的CNNs (AlexNet, VGG, googleNet, ResNet, DenseNet…)在数据集中每个类样本数量较多的情况下表现良好 。不幸的是,当你拥有一个小数据集时,它们通常不能很好地工作 。但是,在许多真实的场景中,收集数据是很有挑战性的 。例如,在人脸识别系统中,通常每个人的图像都很少,或者在医学领域中,一些罕见疾病的病例也很有限 。
那么,当你的类别中只有5个样本,甚至每个类别只有一个样本时,深度学习能提供什么呢?这个问题被称为few-shot learning 。这是一个活跃的研究领域,有许多成功的方法可以采用 。在本文中,我将只提到一些最有前途的体系结构 。
这篇文章不会深入地解释架构,因为这会使文章变得很长 。相反,我将只介绍架构的主要思想,以便任何希望处理小数据集的人都可以对模型有一个大致的了解 。
Siamese Neural Networks
适用于少量数据的深度学习结构

文章插图
Siamese Neural Networks的结构
Siamese神经网络以两个样本作为输入,输出给定输入是否属于同一类的概率(或损失) 。输入样本通过相同的网络(共享权值),它们的嵌入在损失函数中进行比较(通常使用基于嵌入的差异的度量) 。在训练过程中,“网络”学会以更稳健的方式对输入进行编码 。首先,在支持集(验证步骤)上对模型进行训练,以学习相同/不同的配对 。然后,将测试样本与训练集中的每个样本进行比较,得到基于学习的编码后的测试样本与每个类(o


    推荐阅读