机器之心：什么是小样本学习？这篇综述文章用166篇参考文献告诉你答案

机器之心报道
参与：魔王
什么是小样本学习？它与弱监督学习等问题有何差异？其核心问题是什么？来自港科大和第四范式的这篇综述论文提供了解答。
数据是机器学习领域的重要资源，在数据缺少的情况下如何训练模型呢？小样本学习是其中一个解决方案。来自香港科技大学和第四范式的研究人员综述了该领域的研究发展，并提出了未来的研究方向。
这篇综述论文已被 ACM Computing Surveys 接收，作者还建立了 GitHub repo ，用于更新该领域的发展。
论文地址：https://arxiv.org/pdf/1904.05046.pdf
GitHub 地址：https://github.com/tata1661/FewShotPapers
机器学习在数据密集型应用中取得了很大成功，但在面临小数据集的情况下往往捉襟见肘。近期出现的小样本学习（Few-Shot Learning ， FSL）方法旨在解决该问题。 FSL 利用先验知识，能够快速泛化至仅包含少量具备监督信息的样本的新任务中。
这篇论文对 FSL 方法进行了综述。首先，该论文给出了 FSL 的正式定义，并厘清了它与相关机器学习问题（弱监督学习、不平衡学习、迁移学习和元学习）的关联和差异。然后指出 FSL 的核心问题，即经验风险最小化方法不可靠。
基于各个方法利用先验知识处理核心问题的方式，该研究将 FSL 方法分为三大类：
数据：利用先验知识增强监督信号；
模型：利用先验知识缩小假设空间的大小；
算法：利用先验知识更改给定假设空间中对最优假设的搜索。
最后，这篇文章提出了 FSL 的未来研究方向：FSL 问题设置、技术、应用和理论。
论文概览
该综述论文所覆盖的主题见下图：

本文插图

我们选取介绍了该综述论文中的部分内容，详情参见原论文。
什么是小样本学习？
FSL 是机器学习的子领域。
我们先来看机器学习的定义：
计算机程序基于与任务 T 相关的经验 E 学习，并得到性能改进（性能度量指标为 P）。

本文插图

基于此，该研究将 FSL 定义为：
小样本学习是一类机器学习问题，其经验 E 中仅包含有限数量的监督信息。

本文插图

下图对比了具备充足训练样本和少量训练样本的学习算法：

本文插图

FSL 方法分类
根据先验知识的利用方式， FSL 方法可分为三类：

本文插图

FSL 方法解决少样本问题的不同角度。
基于此，该研究将现有的 FSL 方法纳入此框架，得到如下分类体系：

本文插图

数据
此类 FSL 方法利用先验知识增强数据 D_train ，从而扩充监督信息，利用充足数据来实现可靠的经验风险最小化。

本文插图

如上图所示，根据增强数据的来源，这类 FSL 方法可分为以下三个类别：

本文插图

模型
基于所用先验知识的类型，这类方法可分为如下四个类别：

机器之心：什么是小样本学习？这篇综述文章用166篇参考文献告诉你答案

推荐阅读

央视|因家中有人感染新冠病毒丹麦卫生大臣进行自我隔离

如何看待4g牌照发了，但是中国联通的股票并没有因为这一利好信息，而上涨，反而一直下跌?

财务如何写年终总结财务年度总结

|内审经验——明白了职场中的权力基础，才知道怎么混职场

急性冠周炎

「宝宝缺铁」宝宝缺铁的症状有哪些

特斯拉|特斯拉Model Y刹车灯亮后追尾！车主发声：未踩刹车单踏板的“锅”

李冰冰 |大花、85花、95后新人花同台吸睛比美，47岁的李冰冰赢了？

破次元跨界！梦洁家纺携手超人气国漫玩转国潮家居！

小暖妈妈说|窝外怂”的孩子，多半是性格缺陷，爸妈需要做好这2步，“窝里横

「柠檬」柠檬鸡脚的做法

发型|“发型”对气质的影响太大，在女星身上充分体现，普通人也能学学

「新生儿惊厥」新生儿惊厥是怎么回事三个改变是判断要点

WEEK UP探展 | 时尚，向文化复兴致敬

【人民日报客户端】新一轮强降雨加速入秋进程华南需警惕秋台风影响

伊朗|电竞都准备进奥运了，伊朗女孩们还因为玩电子游戏而流落异国

九游网|《下一站江湖》如来神掌怎么获取如来神掌获取攻略

『高考生门锁坏了被锁家中』高考生门锁坏了被锁家中是怎么回事?原来是这样

找不到人生的主线任务咋办?

绿叶的舞曲|“三顾茅庐”的经过是什么？诸葛亮为何要将刘备两次拒之门外？