全球计算机视觉顶会CVPR 2020论文出炉:腾讯优图17篇论文入选( 三 )


全球计算机视觉顶会CVPR 2020论文出炉:腾讯优图17篇论文入选

----全球计算机视觉顶会CVPR 2020论文出炉:腾讯优图17篇论文入选//----

  6、基于注意力机制及多关系检测器的小样本物体检测

  Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector

  本文由香港科技大学和腾讯优图实验室联合提出 。 目标检测网络已经被广泛应用到安保 , 自动驾驶 , 医学图像等各个领域 。 然而传统的目标检测网络需要使用大量高质量的训练样本对模型进行训练 。 这些训练样本需要大量的人力物力进行标注 , 往往无法快速获得 , 所以无法将目标检测模型快速部署到新样本的检测中 , 而小样本目标检测方法可以很好地解决这一问题 。 联合团队提出了一种基于深度孪生网络的小样本目标检测模型 , 通过基于注意力机制的候选框网络 , 多关系检测器以及三元组对比训练方法对网络进行改进 , 使得网络能够不对新物体重新训练即可应用于新类别检测 。 此外 , 文章中提供了一个1000类的小样本物体检测数据集 , 希望可以方便该领域的研究 。

  该联合团队的工作主要有以下贡献:首先 , 使用注意力机制对物体检测候选框进行筛选 。 将待检测新物体的特征作为滤波器在输入图片上进行卷积 , 以此找出潜在的候选框区域 。 然后 , 使用多关系检测器对这些候选框进行分类以及位置调整 。 多关系检测器对候选框和新物体进行像素级、区域级和全图级的多级关系匹配 , 以此找出匹配程度最高的区域作为检测输出 。 最后 , 构建(目标样本 , 正样本 , 负样本)训练样本三元组对模型进行训练 , 使得网络能够同时学习到相同物体间的相似性和不同物体间的差异性 , 从而大大提升网络在新样本上的检测性能 。 该方法在多个数据集上均取得了最好的结果 , 且无需在新物体上进行任何训练 。 其基本框架图如下:


全球计算机视觉顶会CVPR 2020论文出炉:腾讯优图17篇论文入选

----全球计算机视觉顶会CVPR 2020论文出炉:腾讯优图17篇论文入选//----

  7、基于显著性引导级联抑制网络的行人重识别

  Salience-Guided Cascaded Suppression Network for Person Re-identification

  本文由北京大学、腾讯优图和南方科技大学联合提出 。 利用注意力机制对全局和局部特征进行建模 , 作为最终的行人表征 , 已成为行人再识别(Re-ID)算法的主流趋势 。 这些方法潜在的局限性是 , 它们侧重于提取最突出的特征(显著性特征) , 但重新识别一个人可能依赖于不同情况下显著性特征所掩盖的各种其他的线索 , 比如身体、衣服甚至鞋子等 。 为了解决这一局限性 , 联合团队提出了一种新的显著性引导级联抑制网络(SCSN) , 该网络使模型能够挖掘多样化的显著性特征 , 并通过级联的方式将这些特征集成融合到最终的特征表示中 。

  联合团队的工作主要有以下贡献:第一、我们观察到 , 以前网络学习到的显著性特征可能会阻碍网络学习其他重要信息 。 为了解决这一局限性 , 引入了级联抑制策略 , 该策略使网络能够逐级挖掘被其他显著特征掩盖的各种潜在的、有用的特征 , 并融合各级提取的特征作为最后的特征表示; 第二、提出一个显著特征提取(SFE)单元 , 该单元可以抑制在上一级联阶段学习到的显著特征 , 然后自适应地提取其他潜在的显著特征 , 以获得行人的不同线索;第三、开发了一种有效的特征聚合策略 , 充分增强了网络提取潜在显著特征的能力 。 实验结果表明 , 该方法在四个大规模数据集上的性能优于现有最好的方法 。 特别是 , 该方法在CUHK03数据集上比目前最好的方法提升7.4% 。 其基本框架图如下:


推荐阅读