#达摩#CVPR2020 | 阿里达摩院自动驾驶新成果,3D物体检测精度与速度的兼得( 二 )
目前基于点云的 3D 物体检测主要有两种架构:
1) 单阶段检测器 (single-stage): 将点云编码成体素特征 (voxel feature), 并用 3D CNN 直接预测物体框, 速度快但是由于点云在 CNN 中被解构, 对物体的结构感知能力差, 所以精度略低.
2) 两阶段检测器 (two-stage): 首先用 PointNet 提取点级特征, 并利用候选区域池化点云 (Pooling from point cloud) 以获得精细特征. 通常能达到很高的精度但速度很慢.
文章图片
文章图片
2. 方法
目前业界主要以单阶段检测器为主 , 这样能保证检测器能高效地在实时系统上进行 。我们提出的方案将两阶段检测器中对特征进行细粒度刻画的思想移植到单阶段检测中 , 通过在训练中利用一个辅助网络将单阶段检测器中的体素特征转化为点级特征 , 并施加一定的监督信号 , 从而使得卷积特征也具有结构感知能力 , 进而提高检测精度 。而在做模型推断时 , 辅助网络并不参与计算(detached), 进而保证了单阶段检测器的检测效率 。另外我们提出一个工程上的改进 , Part-sensitive Warping (PSWarp), 用于处理单阶段检测器中存在的「框-置信度-不匹配」问题 。
文章图片
文章图片
主体网络
用于部署的检测器 , 即推断网络 , 由一个骨干网络和检测头组成 。骨干网络用 3D 的稀疏网络实现 , 用于提取含有高语义的体素特征 。检测头将体素特征压缩成鸟瞰图表示 , 并在上面运行 2D 全卷积网络来预测 3D 物体框 。
辅助网络
在训练阶段 , 我们提出一个辅助网络来抽取骨干网络中间层的卷积特征 , 并将这些特征转化成点级特征 (point-wise feature) 。在实现上 , 我们将卷积特征中的非零信号映射到原始的点云空间中 , 然后在每个点上进行插值 , 这样我们就能获取卷积特征的点级表示 。令 {:j=0,…,M} 为卷积特征在空间中的表示, {:i=0,…,N} 为原始点云, 则卷积特征在原始点上的表示等于
【#达摩#CVPR2020 | 阿里达摩院自动驾驶新成果,3D物体检测精度与速度的兼得】
文章图片
文章图片
辅助任务
我们提出两种基于点级特征的监督策略来帮助卷积特征获得很好的结构感知力 , 一个前景分割任务 , 一个中心点回归任务 。
文章图片
文章图片
具体来说 , 相比于 PointNet 特征提取器 (a) , 卷积网络中的卷积操作和下采样会造成点云结构的破坏(b)使得特征对物体的边界与内部结构不敏感 。我们利用分割任务来保证部分卷积特征在下采样时不会被背景特征影响 (c) , 从而加强对边界的感知 。我们利用中心点回归任务来加强卷积特征对物体内部结构的感知能力 (d) , 使得在少量点的情况下也能合理的推断出物体的潜在大小 , 形状 。我们使用 focal loss 和 smooth-l1 对分割任务与中心回归任务分辨进行优化 。
3. 工程上的改进
文章图片
文章图片
在单阶段检测中 , feature map 和 anchor 的对齐问题是普遍存在的问题 , 这样会导致预测出来的边界框的定位质量与置信度不匹配 , 这会影响在后处理阶段(NMS)时 , 高置信度但低定位质量的框被保留 , 而定位质量高却置信度低的框被丢弃 。在 two-stage 的目标检测算法中 , RPN 提取 proposal , 然后会在 feature map 上对应的的位置提取特征(roi-pooling 或者 roi-align) , 这个时候新的特征和对应的 proposal 是对齐的 。我们提出了一个基于 PSRoIAlign 的改进 , Part-sensitive Warping (PSWarp), 用来对预测框进行重打分 。
推荐阅读
- 畜牧业@畜牧互联网再次引爆:阿里养猪,京东养鸡,快看大佬们都在干嘛
- 『腾讯科技』淘宝天猫蒋凡在阿里内网回应传闻:深表歉意,恳请公司展开调查
- #阿里巴巴#将饿了么卖给阿里,套现600亿的大学生,如今在干什么呢?
- 服务@云市场跨步式发展 打造ToB云市场阿里腾讯外“第三股势力”
- 『程序员』阿里程序员感慨:公司期权套牢了我,外面开五六万的薪资都不想接
- 「创作者来直播」阿里老师给检察官做直播,猜猜带的什么货?
- 『湘潭』华为、京东、阿里云……湘潭欲打造的这个“英雄联盟”很是“牛”
- #新开普#阿里系进驻后股价翻倍,这家豫股却遭大股东减持套现63次丨立方财报眼
- 【天猫】天猫“总裁夫人”手撕张大奕:如涵股价暴跌9% 阿里股价波动较小
- [马云]卸任后的马云只拥有7的股权,为何却仍可以控制阿里