量子位■大幅提高少样本学习性能,清华姚班本科生用“最简单的形式”
鱼羊十三发自凹非寺
量子位报道|公众号QbitA
仅仅根据元学习(Meta-Learning)的基线 , 就彻底打败了所有“花里胡哨”的改进方法 。
就是这些看似简单 , 又容易被忽略的方法 , 却有着强大的魔力 。
而它们的发现者 , 是一位叫做陈胤伯的在读本科生 , 来自清华姚班 。
他提出了一种元基线(Meta-Baseline)方法 , 通过在所有基类(baseclasses)上预先训练分类器 , 并在基于最近质心的少样本(few-shot)分类算法上进行元学习 , 实验结果大大优于目前最先进的方法 。
文章图片
那么问题来了:为什么这么简单的方法却如此有效?
作者发现 , 在元学习阶段 , 一个模型在基类未见任务中的获得更强泛化能力的同时 , 在新类任务中的泛化表现可
此外 , 对于元基线来说 , 存在2个重要的因素:一个是预训练 , 另一个是从预训练分类器中继承一个好的少样本分类度量 。
这就有可能让模型更好地利用 , 具有更强可传递性的预训练表示 。
陈胤伯的研究可以说是从问题的本质出发 , 直击“七寸” , 正如论文所说:
这项工作为该领域建立了一个新基准 , 并给进一步理解元学习框架(用于少样本学习)提供了思路 。
知名互联网博主、北邮陈老师也分享了这项研究 , 得到了较高的关注 。
文章图片
那么 , 具体又是怎么做到的呢?
什么是元基线方法?
少样本学习的目的 , 是让分类模型能迁移到仅带有少量标记样本的新类别中 。 而元学习是目前少样本学习研究中比较常见的方法 。
陈胤伯的元基线方法所做的 , 是用最简单的形式利用预训练分类器和元学习的优势 。
元基线方法包括两个训练阶段 。
文章图片
阶段一:预训练阶段
预训练阶段 , 主要是分类器基线(Classifier-Baseline)的训练 。
具体方法是 , 在具有标准交叉熵损失的所有基类上训练分类器 , 然后删除其最后一个FC层 , 得到编码器fθ 。 编码器能将输入映射到特征空间 。
阶段二:元学习(meta-learning)阶段
这一阶段 , 主要基于分类器基线评估算法 , 进行模型优化 。
给定预训练特征编码器fθ , 在基类训练数据中采样N-wayK-shot任务 。
为了计算每个任务的损失 , 在支持集(support-set)中计算N种类型的质心 , 公式如下 。
文章图片
然后用它们来计算查询集(query-set)中每个样本的预测概率分布 , 公式如下 。
文章图片
损失是根据p和查询集样本的标签计算的交叉熵损失 。
简单的基线改良 , 大幅提升性能
那么 , 元基线方法效果如何?
论文作者在miniImageNet和tieredImageNet两个数据集上进行了实验 。
文章图片
△miniImageNet
文章图片
△tieredImageNet
可以看到 , 尽管元基线方法设计简单 , 但在两个数据集上 , 都明显超过了前辈们 , 提高了至少2个百分点 。
这样的改进效果并不仅仅局限于N-wayK-shot任务 。 在单类K-shot任务中 , 实验结果同样证明了元学习阶段的有效性 。
推荐阅读
- 三生石哥哥多家快递公司宣布会提高快递运送费用
- 可可酱75吋量子点电视让孩子健康成长,如何才能健康不伤眼的看电视?TCL
- 中国智能制造网量子通信布局起风了!,多国已未雨绸缪
- 中国冶金报社中冶京诚电网潮流自动化控制技术大幅提升企业自发电效益
- 「量子力学」爱因斯坦也束手无策,困扰人类上百年的难题,如今终于有了答案
- 与单观经欧盟瞄准“量子互联网”附相关概念股
- 东方魔都网提高产品知名度我只选他,门户新闻代发推荐
- 深圳湾一季度全球智能手表出货量 1370 万台,预计二季度增速将大幅放缓,2020
- 『华为』华为新系统已上路,流畅度大幅提升,苹果迎来终极对手
- 广东圆梦园孵化城【园区动态】广东省重点领域研发计划量子科学与工程重大专项专家组莅临园区考察指导