「爱与否科技」v4它来了:接棒者出现,速度效果双提升,YOLO

机器之心报道
机器之心编辑部
YOLOv4真的来了 , 带给我们的除了惊喜 , 还是惊喜 。
两个月前 , YOLO之父JosephRedmon表示 , 由于无法忍受自己工作所带来的的负面影响 , 决定退出计算机视觉领域 。 此事引发了极大的热议 , 其中一个悬念就是:我们还能等到YOLOv4面世吗?
当我们都以为再也没有希望的时候 , YOLOv4却悄无声息地来了 。 这一目标检测神器出现了新的接棒者!
数小时前 , YOLO的官方Github账号更新了YOLOv4的arXiv链接与开源代码链接 , 迅速引起了CV社区的关注 。
「爱与否科技」v4它来了:接棒者出现,速度效果双提升,YOLO
文章图片
YOLOv4论文:https://arxiv.org/abs/2004.10934
YOLOv4开源代码:https://github.com/AlexeyAB/darknet
YOLOv4的作者共有三位:AlexeyBochkovskiy、Chien-YaoWang和Hong-YuanMarkLiao 。 其中一作AlexeyBochkovskiy是位俄罗斯开发者 , 此前曾做出YOLO的windows版本 。
那么 , YOLOv4性能如何呢?
在相关论文中 , 研究者对比了YOLOv4和当前最优目标检测器 , 发现YOLOv4在取得与EfficientDet同等性能的情况下 , 速度是EfficientDet的二倍!此外 , 与YOLOv3相比 , 新版本的AP和FPS分别提高了10%和12% 。
「爱与否科技」v4它来了:接棒者出现,速度效果双提升,YOLO
文章图片
接下来 , 我们看下YOLOV4的技术细节 。
许多特征可以提高CNN的准确率 , 然而真正实行起来 , 还需要在大型数据集上对这些特征组合进行实际测试 , 并且对测试结果进行理论验证 。 某些特征仅在某些模型上运行 , 并且仅限于特定的问题 , 或是只能在小型数据集上运行;而另外有些特征(如批归一化和残差连接)则适用于大多数模型、任务和数据集 。
那么 , 如何利用这些特征组合呢?
YOLOv4使用了以下特征组合 , 实现了新的SOTA结果:
加权残差连接(WRC)
Cross-Stage-Partial-connection , CSP
Crossmini-BatchNormalization , CmBN
自对抗训练(Self-adversarial-training , SAT)
Mish激活(Mish-activation)
Mosaic数据增强
DropBlock正则化
CIoU损失
据介绍 , YOLOv4在MSCOCO数据集上获得了43.5%的AP值(65.7%AP50) , 在TeslaV100上实现了~65FPS的实时速度 。
该研究的主要贡献如下:
建立了一个高效强大的目标检测模型 。 它使得每个人都可以使用1080Ti或2080Ti的GPU来训练一个快速准确的目标检测器 。
验证了当前最优Bag-of-Freebies和Bag-of-Specials目标检测方法在检测器训练过程中的影响 。
修改了SOTA方法 , 使之更加高效 , 更适合单GPU训练 。 这些方法包括CBN、PAN、SAM等 。
YoloV4如何实现这么好的效果?
YoloV4的基本目标是提高生产系统中神经网络的运行速度 , 同时为并行计算做出优化 , 而不是针对低计算量理论指标(BFLOP)进行优化 。 YoloV4的作者提出了两种实时神经网络:
对于GPU , 研究者在卷积层中使用少量组(1-8组):CSPResNeXt50/CSPDarknet53;
对于VPU , 研究者使用了分组卷积(grouped-convolution) , 但避免使用Squeeze-and-excitement(SE)块 。 具体而言 , 它包括以下模型:EfficientNet-lite/MixNet/GhostNet/MobileNetV3 。
YOLOv4包含以下三部分:
骨干网络:CSPDarknet53
Neck:SPP、PAN
Head:YOLOv3
具体而言 , YOLOv4使用了:
用于骨干网络的BagofFreebies(BoF):CutMix和Mosaic数据增强、DropBlock正则化和类标签平滑;
用于骨干网络的BagofSpecials(BoS):Mish激活、CSP和多输入加权残差连接(MiWRC);
用于检测器的BagofFreebies(BoF):CIoU-loss、CmBN、DropBlock正则化、Mosaic数据增强、自对抗训练、消除网格敏感性(Eliminategridsensitivity)、针对一个真值使用多个锚、余弦退火调度器、优化超参数和随机训练形状;


推荐阅读