|ImageNet训练再创纪录,EfficientNet异军突起,ResNet:感受到了威胁( 二 )
论文地址:https://arxiv.org/pdf/2011.00071.pdf
【|ImageNet训练再创纪录,EfficientNet异军突起,ResNet:感受到了威胁】尤洋在推特上表示 , 这项研究在准确率足够高的前提下 , 在速度上创造了一个世界记录 。
本文插图
EfficientNets是基于有效缩放的新型图像分类卷积神经网络系列 。
目前 , EfficientNets的训练可能需要几天的时间;例如 , 在Cloud TPU v2-8节点上训练EfficientNet-B0模型需要23个小时 。
在这项研究中 , 作者探索了在2048个内核的TPU-v3 Pod上训练EfficientNets的技术 , 目的是在以这种规模进行训练时可以实现加速 。
作者讨论了将训练扩展到1024个TPU-v3内核、批量大小为65536时所需的优化 , 例如大批量优化器的选择和学习率的规划 , 以及分布式评估和批量归一化技术的利用 。
此外 , 作者还提供了在ImageNet数据集上训练EfficientNet模型的时序和性能基准 , 以便大规模分析EfficientNets的行为 。
通过优化后 , 作者能够在1小时4分钟内将ImageNet上的EfficientNet训练到83%的top-1准确率 。
图1展示了对不同TPU内核数 , EfficientNet-B2和B5训练时间达到的峰值准确率 。 训练时间在分布式训练和评估循环初始化之后立即开始计算 , 并在模型达到峰值准确率时结束 。
本文插图
可以观察到EfficientNet-B2在1024个TPU-v3内核上的训练时间为18分钟 , top-1准确率为79.7% , 全局批处理大小为32768 , 这表明训练速度明显提高 。
通过在1024个TPU-v3内核上将全局批处理规模扩展到65536 , 可以在EfficientNet-B5上在1小时4分钟内达到83.0%的准确率 。
表2展示了EfficientNet-B2和B5峰值准确率的基准 , 这里可以找到准确率的完整基准以及相应的批次大小 , 作者表示 , 即使使用全局批次大小 , 使用他们的方法 , 也可以在EfficientNet-B5上保持83%的准确率 。
本文插图
这项研究至少表明了 , 在EfficientNet上探索大规模图像分类的快速训练也是一个有希望的方向 。
2方法
将EfficientNet培训扩展到1024个TPU-v3内核会带来很多挑战 , 必须通过算法或系统优化来解决 。
第一个挑战是随着全局批量规模的增加保持模型质量 。 由于全局批处理规模随用于训练的内核数量而定 , 因此 , 必须利用大批量训练技术来保持准确率 。
而在大量TPU芯片上进行训练时也会面临计算瓶颈 , 不过可以使用Kumar等人提出的分布式评估和批量归一化技术来解决这些瓶颈 。 以下是为扩展TPU-v3 Pod上的EfficientNet训练而探索的优化技术:
大批量优化器
最初的EfficientNet论文使用RMSProp优化器 , 但众所周知 , 批量较大时 , RMSProp会导致模型质量下降 。
通过数据并行性将训练规模扩展到1024个TPU-v3内核 , 意味着如果保持每个内核的批量大小不变 , 则全局批量大小必须与内核的数量成比例增加 。 例如 , 如果我们将每核的批处理大小固定为32 , 则1024个核上的全局批处理大小将为32768 。
另一方面 , 如果在扩展到多个核时全局批处理大小是固定的 , 则每核的批处理大小会降低 , 导致效率低下和吞吐量降低 。
因此 , 为了更好地利用每个TPU内核的内存并提高吞吐量 , 必须使用较大的全局批处理大小 。 使用You等人提出的分层自适应速率缩放(LARS)优化器 , 能够扩展到65536的批量 , 同时达到与Tan和Le中报告的EfficientNet基准准确率相似的准确率 。
推荐阅读
- 超能网|亚马逊转用自家芯片进行人工智能训练,只剩少量程序仍然以显卡来训练
- |近期必读 ICLR 2021 模型压缩&预训练相关论文
- |甘肃消防探智慧建设:智能辅助作战训练 管理延伸细节末端
- 2020双十一成绩单|科技早报 | 2020双十一成绩单公布天猫京东再创纪录 斗鱼提交退市申请或明年与虎牙合并
- 京东集团|创纪录!京东11.11下单金额2715亿 助力实体经济 服务亿万用户
- 每日经济新闻|京东双11累计下单金额2715亿创纪录,物流开放业务增长102%
- 京东|下单金额突破2431亿!京东11.11“全球热爱季”再创纪录
- |预训练语言模型:还能走多远?
- 大河风光|知乎带货实战训练营线上第2期,教您知乎带货,月收益几千到几万(无水印)
- 行业互联网|季度业绩创纪录!联想为它的智能转型,交了满意成绩单!