DeepTech深科技|1400多颗Star|专访,机器视觉领军学者沈春华,获澳大利亚科研终身成就奖!新算法获GitHub( 二 )


更重要的是 , FCOS可避免和锚框有关、且对最终检测结果敏感的所有超参数 。 因此FCOS比以往基于锚框的一阶段或者二阶段目标检测器要大大简化 。
DeepTech深科技|1400多颗Star|专访,机器视觉领军学者沈春华,获澳大利亚科研终身成就奖!新算法获GitHub
文章图片
图|FCOS网络结构
从论文中的对比测试来看 , FCOS的精度已超过老牌经典算法FasterR-CNN 。
DeepTech深科技|1400多颗Star|专访,机器视觉领军学者沈春华,获澳大利亚科研终身成就奖!新算法获GitHub
文章图片
图|FCOS的精度对比
如下图案例所示 , FCOS在对目标物体框中、所有的点进行目标框回归时 , 会用各个边的距离长度来计算损失 , 这样可以为后续使用Center-ness准备 。
DeepTech深科技|1400多颗Star|专访,机器视觉领军学者沈春华,获澳大利亚科研终身成就奖!新算法获GitHub
文章图片
图|FCOS用各个边的距离长度来计算损失
目前 , 在开发者群体中 , FCOS的论文已经成为他们眼中的“沈春华团队的代表作” 。 而BlendMask、CondInst、SOLO的相关论文则被媒体称为“沈春华团队的又一力作” 。
BlendMask:可提取更准确的实例分割特征
BlendMask的中文意思为实例分割算法 , 它来自沈春华团队的另一篇发表于CVPR2020的论文《BlendMask:自上而下与自下而上相结合的实例分割》(BlendMask:Top-DownMeetsBottom-UpforInstanceSegmentation) 。
BlendMask提出了一种结合自上向下和自下向上两种设计策略的实例分割算法 , 在精度上超越了另一目标检测项目MaskRCNN , 速度上快20% 。
经测试发现 , 在COCO数据集上使用ResNet-50 , BlendMask性能可达37.0%的mAP(平均精度均值 , meanaverageprecision) , 使用ResNet-101其性能可达到38.4%的mAP 。
BlendMask可通过更合理的Blender模块 , 来融合top-level和low-level的语义信息 , 从而提取更准确的实例分割特征 。 据悉 , BlendMask是少有的在mAP和推理效率方面均能胜过MaskR-CNN的算法之一 。
ABCNet:比其他方法最高快10倍以上
ABCNet的全称为AdaptiveBezier-CurveNetwork , 中文意思为自适应贝塞尔曲线网络 。 近年来 , 场景文本的检测与识别越来越受重视 。
现有方法大致分为两类:基于字符的方法和基于分段的方法 。 这些方法的标注代价高昂、框架十分复杂 , 因此并不适用于实时应用程序 。
为此 , 沈春华团队提出ABCNet来解决上述问题 。 其贡献主要有三方面:
1、首次提出通过参数化的贝塞尔曲线(应用于二维图形应用程序的数学曲线) , 并自适应地拟合任意形状的文本 。
2、设计了一种新颖的贝塞尔曲线层 , 可用于提取任意形状的文本实例的精确卷积特征 , 精度上远超此前方法 。
3、与边界框目标检测方法相比 , 贝塞尔曲线检测引入的计算开销可以忽略不计 , 兼具高效率和高准确度两大优势 。 在基准数据集Total-Text和CTW1500上进行的实验表明 , ABCNet能达到较高的精度 , 速度也有显著提升 。 其中在Total-text上 , ABCNet的实时版本比其他方法最高快10倍以上 。
CondInst:可显著加快推理速度
CondInst是一个用于实例分割的条件卷积 , 相关论文《基于条件卷积的实例分割》“ConditionalConvolutionsforInstanceSegmentation”发表在ECCV2020上 。
CondInst可以完全不依赖ROI(感兴趣的区域 , regionofinterest)操作 。 而是采用以实例为条件的动态卷积达到分割实例的效果 。
具体来说 , 它有两个优点:1、通过全卷积网络解决了实例分割 , 无需进行ROI裁剪和特征对齐等操作 。 2、由于动态生成的条件卷积的性能大大提高 , 因此可以显著加快推理速度 。
以上几个算法 , 是沈春华团队AdelaiDet开源工具箱中的主要组成部分 。 该工具箱受到了学术界和工业界的相当的关注 。 亚马逊AWS已有意向在其产品中使用工具箱中的目标检测、实力分割、文字检测识别等能力 。


推荐阅读