【科技小数据|2020基于记忆增强的全局-局部整合网络-更准的视频物体检测，CVPR】编者按：在视频物体检测任务中

【【科技小数据|2020基于记忆增强的全局-局部整合网络-更准的视频物体检测，CVPR】】编者按：在视频物体检测任务中，由于相机失焦、物体遮挡等问题，仅基于图像的目标检测器很可能达不到令人满意的效果。针对此类问题，微软亚洲研究院提出了基于记忆增强的全局-局部整合网络（MemoryEnhancedGlobal-LocalAggregation,MEGA），它可以在只增加非常小的计算开销的前提下，整合大量的全局信息和局部信息来辅助关键帧的检测，从而显著地提升了视频物体检测器的性能。在广泛使用的ImageNetVID数据集中，此方法达到了截至目前的最好结果。
视频物体检测（videoobjectdetection），即在一段视频中检测出每一帧上的所有物体。相对于在静止的图像中寻找物体而言，在一段视频中找到物体会面临更多的困难：物体可能会遭遇相机失焦，物体遮挡等问题（图1），因此如果只是简单地将一个图像检测器用于视频检测，效果通常是不尽如人意的。

文章图片
图1：视频中一些常见的问题
但反过来，在视频中检测物体意味着我们可以利用时序上的相关性来辅助我们进行检测：人们可以根据一些历史信息（比如说位置信息、语义信息），来判断这个被遮挡的物体是什么。因此在视频物体检测中，如何利用好时序信息来辅助质量比较差的帧上的检测是一个重要的研究方向。
一般来说，人类主要会通过两类信息来辅助对质量较差的帧进行物体检测，即局部定位信息与全局语义信息。如果物体在当前帧中难以定位，我们可以通过相邻帧之中的类似物体或帧的差异来辅助定位，我们称之为局部定位信息。如果我们难以判断这一帧的物体的类别，我们可以通过从任意其他帧中找出与当前的模糊物体具有高度相似性（比如说颜色、形状很像）的物体来辅助定位，此类信息被定义为全局语义信息。具体如下图2所示。

文章图片
图2：人类可以利用的信息规模
从这个角度出发，我们发现目前的视频物体检测方法都仅单独考虑了其中一种信息进行辅助目标检测，虽然它们各自都取得了不错的效果，但是如果能够设计一种更加高效的信息融合方式来同时利用好两类信息，那么模型的表现应该能够更加出色。
除此之外，另一个在现存方法中存在的问题就是整合规模（aggregationscale），也就是关键帧能够使用信息的范围。因为计算资源的限制，不管是局部类还是全局类的方法，他们使用的帧的数量通常都只有20-30帧，换算成秒也就是1-2秒，整合规模的不足也局限了这些方法的有效性。
解决方案

文章图片
图3：模型结构示意图
我们分两步来解决上文提到的两个问题。
第一步：解决全局信息和局部信息单独考虑的问题。我们设计了简洁的基础模型（图3a）来完成这项任务。首先，我们使用区域候选网络从关键帧的相邻帧和全局帧中生成一些候选区域。第二是使用关联模块（relationmodule）将全局帧中候选区域对应的特征给整合到局部帧的候选区域的特征中。之后，局部帧内部会再过若干层关联模块得到增强后的关键帧特征。由此，我们的关键帧特征就同时得到了全局和局部两方面的信息。
第二步：解决整合规模太小的问题。如果只有基础模型，我们关键帧能够得到的全局和局部信息仍然很少，以图3a为例，全局和局部信息都只有4帧。为了解决这个问题，我们设计了一个简洁高效的长时记忆模块（LongRangeMemory ， LRM），在做完对某一帧的检测后将其特征保存下来，并在下一帧的检测中使用该特征来辅助检测，由于关系模块的多层结构，可以极大地增加了关键帧能够看到的范围，以图3b为例，我们保留了长度为3帧的记忆，而由于其具有两层的关系模块，使得其整合规模从之前的8帧增长到20帧。

【科技小数据|2020基于记忆增强的全局-局部整合网络-更准的视频物体检测，CVPR】

推荐阅读

青年|7月24日LCK夏季赛前瞻预测：DWG对战SB 上中野强强对抗，谁能更胜一筹

叶念琛百度百科?叶名琛白悠悠

文史书院|心地善良，救过姜子牙，却被燃灯当炮灰，应劫而死，元始有一徒孙

湖人队|35胜，44胜，46胜，44胜！最没有含金量的总冠军要诞生了？

潮人集|这哪像30岁啊？Krystal的高级颜真的很可秀晶的度假风甜美名媛风的Jessica，秀晶秀妍的白富美日常！素颜同框堪比漫画脸

怀旧服|《魔兽世界怀旧服》神秘杂烩怎么样神秘杂烩介绍

灰灰小吃货白鳝的烹制法，有蒸、炸、扣、焖等，以蒸最能体现其鲜美

新华社|新规！外资持股达24%即须披露，外资投资范围进一步扩大

三国两晋南北朝|五虎上将不受重用？只因他太仗义，得罪所有将士，得罪了刘备

国青：韩媒评国青球员违纪称自我管理不足话不好听却让你无法反驳

玫瑰之战|《玫瑰之战》让人失望，空有傲骨皮囊，好牌打瞎了

大众报业·海报新闻|注意！大雨后，泰安、济宁等山东7市引发地质灾害可能性较大

布朗红大树红茶的泡法,国艳普洱茶布朗大树

创历史!费德勒年入超1亿美元超C罗梅西登顶福布斯

上交|小伙在家里的地窖中，发现10万多件圆明园宝物，上交国家后怎样了

开花|养三角梅，最容易犯的3个地方，才是导致不开花的关键原因

慕之时尚|刘涛为了美有多拼？穿开叉裙到大腿根，配花衬衫清新减龄品味不凡

财经涂鸦|锂电池制造先行者德赛电池：业绩微增无碍公募集中建仓

销售|巴基斯坦8月汽车销量同比增16% 自疫情以来首次回升

大潮|行业“红利大潮“退却“电子烟第一股”思摩尔如何“逆势”破局