#达摩#CVPR2020 | 阿里达摩院自动驾驶新成果,3D物体检测精度与速度的兼得

北京联盟_原题是:CVPR2020 | 阿里达摩院自动驾驶新成果 , 3D物体检测精度与速度的兼得
机器之心发布
阿里巴巴达摩院在自动驾驶 3D 物体检测方面又有新成果发布 。近日 , 计算机视觉顶会 CVPR 2020 接收论文结果发布 , 达摩院一篇名为《Structure Aware Single-Stage 3D Object Detection from Point Cloud》的论文入选 。
该论文提出了一个通用、高性能的检测器 , 首次实现 3D 物体检测精度与速度的兼得 , 有效提升自动驾驶系统安全性能 。目前 , 该检测器在 KITTI BEV 排行榜上排名第一 。
#达摩#CVPR2020 | 阿里达摩院自动驾驶新成果,3D物体检测精度与速度的兼得
文章图片

文章图片

3D 目标检测需输出物体类别及在三维空间中的长宽高、旋转角等信息
和普通 2D 图像识别应用不同 , 自动驾驶系统对精度和速度的要求更高 , 不仅需要快速识别周围环境的物体 , 还要对物体在三维空间中的位置做精准定位 , 但仅靠传感器和传统算法模型无法平衡视觉识别的精度和速度 , 因此 , 全新的检测器成为提升自动驾驶系统安全性的关键因素 。
虽然 , 业界主流的单阶段检测器在检测速度上有不俗的表现 , 但其检测精度却差强人意 。为此 , 达摩院提出了全新的思路 , 即将两阶段检测器中对特征进行细粒度刻画的思想移植到单阶段检测中 。具体来说 , 达摩院在训练中利用一个辅助网络将单阶段检测器中的体素特征转化为点级特征 , 并施加一定的监督信号 , 同时在模型推理过程中辅助网络无需参与计算 , 因此 , 在保障速度的同时又提高了检测精度 。
该论文团队表示 , 「检测器是自动驾驶系统的核心组件之一 , 但这一领域一直以来缺少创新和突破 , 此次我们提出的检测器融合了单阶段检测器和两阶段检测器的优势 , 因此同时实现了 3D 检测精读和速度的提升 , 未来检测器的创新研究还可以解决自动驾驶产业的更多难题 。」
研究结果显示 , 该检测器在 KITTI BEV(bird`s eye view)排行榜上排名第一, 检测速度达到 25FPS , 同时精度也超过其他的单阶段检测器 。
#达摩#CVPR2020 | 阿里达摩院自动驾驶新成果,3D物体检测精度与速度的兼得
文章图片

文章图片

KITTI BEV 排行榜 , 达摩院位居第一
据了解 , 该论文共有 5 位作者 , 第一作者为达摩院研究实习生 Chenhang He , 另外四位作者也为达摩院科学家 , 包括达摩院高级研究员、IEEE Fellow 华先胜 , 达摩院高级研究员、香港理工大学电子计算学系讲座教授、IEEE Fellow 张磊 , 达摩院资深算法专家黄建强 。
以下是论文一作对该论文做出的解读:
1. 背景
目标检测是计算机视觉领域的传统任务 , 与图像识别不同 , 目标检测不仅需要识别出图像上存在的物体 , 给出对应的类别 , 还需要将该物体通过 Bounding box 进行定位 。根据目标检测需要输出结果的不同 , 一般将使用 RGB 图像进行目标检测 , 输出物体类别和在图像上 2D bounding box 的方式称为 2D 目标检测 。而将使用 RGB 图像、RGB-D 深度图像和激光点云 , 输出物体类别及在三维空间中的长宽高、旋转角等信息的检测称为 3D 目标检测 。
#达摩#CVPR2020 | 阿里达摩院自动驾驶新成果,3D物体检测精度与速度的兼得
文章图片

文章图片

从点云数据进行 3D 目标检测是自动驾驶(AV)系统中的的关键组件 。与仅从图像平面估计 2D 边界框的普通 2D 目标检测不同 , AV 需要从现实世界估计更具信息量的 3D 边界框 , 以完成诸如路径规划和避免碰撞之类的高级任务 。这激发了最近出现的 3D 目标检测方法 , 该方法应用卷积神经网络(CNN)处理来自高端 LiDAR 传感器的点云数据 。


推荐阅读