【科技小数据|2020基于记忆增强的全局-局部整合网络-更准的视频物体检测,CVPR】( 二 )
不仅如此 , 这两部分结构还互相受益:长时记忆模块使得关键帧能够获得更多的全局和局部信息 , 反过来 , 这些帧又能够提供更加强大的记忆 。
实验结果
我们在广泛使用的视频物体检测数据集ImageNetVID上对我们的方法进行了实验 , 表1总结了我们的方法与其他方法相比的表现 。 在本文新提出的模块的辅助下 , 我们训练出来的视频物体检测器取得了在该数据集上的至今最佳结果 。
文章图片
表1:总体实验结果
为了验证我们方法的有效性 , 我们做了充足的消融实验 。 表2展示了我们的模型中各个模块的作用 , 表3展示了全局信息和局部信息两个缺一不可 , 表4则说明了超参数对模型整体表现的影响 。
表2:各个模块的作用
文章图片
表3:全局信息与局部信息的作用
文章图片
表4:超参数的设置
图4是模型的一些可视化结果 。 可以看到我们的方法能够克服许多困难的情形 , 得出不错的检测结果 。
文章图片
图4:可视化结果
结语
在本文中 , 我们提出了基于记忆增强的全局-局部整合网络(MEGA) , 它从全局和局部两方面出发 , 共同解决视频物体检测的问题 。 首先我们将全局特征整合到局部特征中 , 以解决无效的问题 。 之后 , 我们引入了新的长时记忆模块(LongRangeMemory,LRM)来解决整合规模太小的问题 。 在视频物体检测数据集ImageNetVID上进行的实验表明 , 我们的方法取得了在该数据集上的至今最佳结果 。
推荐阅读
- 科技一哥|荣耀30青春版图集赏析:触觉与视觉的完美享受
- 科技犬君|vs 索尼A9G 谁强?,上半年用户喜爱手机盘点;小米电视大师65英寸OLED
- 精选泛科技|结果如何?,一加8续航遭质疑:上半年最全机型横评出炉
- HAO懂科技|小米“神机”要来了?,小米正式“反击”!上下对折+骁龙865
- 阿拉图图科技说|而给华为仅仅是800万枚!,台积电为苹果准备8000万枚芯片
- 网罗说科技|三星note10一夜成“中端机”,还是256GB+3500mAh,三星扛不住了
- 科技数码迷|华为+荣耀别不报!入门级机型你们真没有Redmi良心
- 「小米科技」小米11Pro宣布新技术!首发骁龙875+屏下镜头,米粉:价格有点小贵
- 小熊科技|你会考虑吗?,三星顶级旗舰清仓!5G网络+45W快充+2k屏幕
- 简简科技|联想:国内同步上市,支持5G,界读丨摩托罗拉折叠手机Razr2曝光