检测|百度AI获ECCV 2020 挑战赛“双冠王”目标检测技术领先国际( 二 )


如下表所示 , 在不同输入尺度下PP-YOLO模型与YOLOv4模型在COCO数据集精度和V100推理速度的交手结果 。
检测|百度AI获ECCV 2020 挑战赛“双冠王”目标检测技术领先国际
文章图片

而PP-YOLO所应用的这套优化策略 , 也可以被尝试应用到该系列的其它模型上 , 产业开发者或者科研人员可借鉴这套优化算法展开进一步的探索 。
目标检测是计算机视觉领域中的核心任务 , 也是百度的拿手强项 。 去年 , 在目前规模最大的目标检测公开数据集Open Images Dataset V5(OIDV5)中 , 百度基于飞桨PaddleDetection目标模型库研发了大规模图像目标检测模型MSF-DET (Multi-Strategy Fused Detection framework) , 它也成为了OIDV5 2019目标检测比赛中的最好单模型 , 并且在计算机视觉领域的顶级学术会议ICCV 2019上进行技术分享 。 此外 , 在CVPR 2019 Workshop中 , 百度获得"Objects365物体检测"国际竞赛 Full Track冠军 , 而 Full Track主要用于探索目标检测系统的性能上限 , 备受瞩目 。
二、小目标检测 , tiny object detection
TinyPerson数据集包括794张训练图片 , 每张图片中包括上百个小目标人物需要检出 。 任务的目标是评估测试图片中的tiny大小(20*20~40*40像素)的人体目标的AP(Average Precision) 。
百度研究了常见的两级检测器:Faster R-CNN、FPN、Deformable R-CNN、Cascade R-CNN等 , 从而探查其对不懂IoU阈值的检测标准的适合性 。 该方法主要分为四个部分:数据增强、训练策略改进、模型改进和模型融合 。
检测|百度AI获ECCV 2020 挑战赛“双冠王”目标检测技术领先国际
文章图片

1.数据增强
针对一般无人机采集的人群数据集 , 如Semantic Drone Dataset、Stanford Drone Dataset , 由于数据集数量较小难以达到快速收敛和较好的检测效果 。 百度采用额外的同类数据来进行同尺度预训练 , 从而提高模型对同等先验知识的理解 , 提高模型的检测能力 。 通过加入数据增强策略 , AP50(tiny)提升2%至3% 。
2.训练策略改进
对于无人机航拍收集的数据 , 不同图像的原始尺寸和目标的相对尺寸会有所不同 , 这样会造成检测器对有些图像的理解困难 。 在训练过程中 , 百度随机将输入图像的大小调整为原始大小的0.5、1.5倍、1.5倍 , 以帮助解决尺度差异问题 。 在改进训练策略以后 , AP50(tiny)由57.9%提升至65.38% 。
3.模型改进
对于传统的二阶段检测器 , 如R-CNN和FPN系列 , 通常使用ResNet系列网络作为骨架网络 。 为了改进这种系列检测器 , 对于FPN检测器 , P3层为微小物体的检测提供了相对应尺度的特征 。 然而 , P3层的不足在于它具有语义描述 。 因此百度用PAFPN代替FPN , 提高网络的语义识别能力 。 相较普通的FPN , PAFPN增加了一条自下而上的路径 , 从而提高了基于提议的实例分割框架中的信息流 。 此外 , 在下采样模块中 , 百度通过“carafe”采样方法来代替原来的卷积模块下采样方法 , 然后使用可变形卷积模块 。 在上采样模块中 , 百度基于可变形卷积模块代替原来的卷积模块对特征进行上采样 。 改进后的PAFPN , AP50(tiny)提升了1.5% 。
检测|百度AI获ECCV 2020 挑战赛“双冠王”目标检测技术领先国际
文章图片

4.模型融合
对于难度较大的无人机航拍目标的小目标检测任务 , 单模型单尺度显然无法满足图像的复杂以及低信噪比特性 , 因此 , 百度考虑使用多尺度多模型实现高精度检测 。 对于模型融合方法 , 百度采用具有不同骨架网络(Res2Net, ResNet200 , ResNeXt101 , SENet154等)的Cascade R-CNN检测器进行融合 。 对于每个模型 , 百度预测了NMS后的边界框 。 给每个模型一个从0到1的标量权重 , 所有权重总和为1 , 每个模型的盒子的可信度分数乘以其权重 , 最后合并来自所有模型的框并运行原始的NMS , 除了百度添加来自不同模型的分数而不是只保留最高的一个 。 依次顺序使用NMS的修改合并了不同IoU阈值的预测框 。 最终 , 模型的AP50(tiny)达到了72.23% 。
检测|百度AI获ECCV 2020 挑战赛“双冠王”目标检测技术领先国际
文章图片

通过以上优化 , 百度团队在Tiny Object Detection比赛中获得冠军 , 领先第二名0.8% 。 与此同时 , 百度通过这样的优化方式 , 能对更多不同领域的微小目标检测需求提供更有力的帮助 , 为各行各业赋能 。
百度持续在物体检测技术上深耕 , 近两年在国际检测大赛中 , 斩获5项国际比赛冠军;取得了业内最重磅的coco object detection检测比赛冠军 , 代表了百度在目标检测领域的领先性;取得tiny object detection比赛的冠军 , 更表明了百度在小目标检测领域技术的突破 。 取得这些成绩的同时 , 百度产研并重 , 深度布局不同领域 。 2017年至今 , 百度AI工业已落地电子、汽车、钢铁、能源、橡胶、纺织等 10多个行业 , 超过 50个细分垂类 。


推荐阅读