江苏龙网


首页 > 人文 >>

范式|第四范式提出AutoSTR,自动搜索文字识别网络新架构( 二 )



按关键词阅读:


作为一个不可或缺的通用模块,特征序列抽取器在当前大多数文本识别方法中起着至关重要的作用。该工作的目标是扩展NAS,为通用文本识别过程寻找更好的主干网络。该工作的主要贡献如下:
我们发现,对于STR具有重要意义的特征抽取器结构在此前的工作中还没有得到很好的研究。这促使我们设计一个数据相关主干网络来提高文本识别的性能,这也是将NAS引入STR的第一次尝试。
该工作为STR引入了一个特定域的搜索空间,该空间包含下采样路径和操作的选择,并提出了一种新的搜索算法将操作和下采样路径分离,从而在空间中进行有效的搜索。通过在搜索过程中加入一个额外的正则化器,在模型大小与识别精度方面进行了有效的权衡。
该工作对各种基准数据集进行了大量的实验。结果表明,AutoSTR可以发现data-dependent backbones,并以更少的浮点运算和模型参数获得最先进的方法。
(1)搜索目标
场景文本识别任务的输入是文本图像块,由于卷积神经网络(CNN)具有超强的自动提取视觉特征的能力,本文通过堆叠卷积层(Convolution layer)来搭建序列特征提取模块。一层卷积层可以被形式化定义为 ,以下简称为 ,其中 为输入特征矩阵, 为带有超参数 的卷积层。更具体来说, 定义了卷积层 的操作类型,可以为3X3的常规卷积操作、5X5的深度可分离卷积操作、3X3平均池化操作等等, 分别代表着在卷积滑动过程中在高度和宽度方向上面的步长,用于控制特征分辨率的变换。因此,一个深度卷积网络 可以看做是由 层卷积操作层的堆叠构成的,表示为 。经过深度卷积网络 处理后, 空间大小的输入 将被映射成固定大小的的输出,送入到特征翻译模块。
为了自动化设计用于文本识别任务的序列特征提取器,本文需要调整结构超参数以搜索出合适的体系结构,这些结构由 (对于卷积步长)和 (对于卷积操作)控制。本文用 表示网络 在训练数据集上面的损失,用 表示网络 在验证数据集上面的准确率。本文可以将自动设计序列特征提取器定义为公式(1)中的双层优化形式,
其中 和 为上层表示网络结构的超参数, 为下层网络卷积权重的变量, 表示 需要满足的约束条件,也就是:
其中 和 是针对于应用的输出特征空间大小的约束,约束 的目的是控制序列特征模块输出的分辨率大小,以便适用于后面的翻译模块。
(2)搜索空间
搜索空间的设计是整个网络结构搜索的关键点,我们为STR任务设计了一个两级的层次化搜索空间,即下采样路径层级搜索空间和操作层级搜索空间,如下图所示。
经过矫正后的输入文本图像中,字符在图像中呈水平位置均匀放置,为了在紧凑的文本的形状中保留图像中字符更具区分性的特征,一种最常见的做法是沿着高度轴压缩特征直到降低为1,但是沿着宽度轴方向压缩更少的倍数以确保最终的特征序列长度大于字符串的长度。更具体来说,当前的主流方法使用的都是ASTER中提出来的特征序列提取器。输入的文本图像的高度统一为固定的大小,例如32。并且为了在宽度轴上面保留更多的分辨率,以区分相邻的字符, 因此卷积步长超参数 只能从 中选择,在整个下采样路径中 出现2次, 出现3次,从而满足约束 使得 、 ,最终大小为 的输入文本图片被映射为长度 大小的特征序列,送入到后面的特征翻译模块。如下图任意一条从 到 的连通路径表示下采样路径搜索空间中一种结构配置。本文的目标是在这样的3D网格搜索空间中找到一条路径,实现最佳的识别性能。
此外目前的场景文本识别网络的特征提取层都是使用相同的卷积操作进行堆叠,比如ASTER中各层卷积都是使用了3X3的残差网络结构。这样的配置可能是局部最优的,且带来参数以及计算量的冗余。区别于手工设计的结构将每个 设置成固定的操作,本文为每层卷积层设置不同的操作, 可以从带有 个并行的卷积操作的选择块中挑选一个卷积操作,如下图所示。本文选择的基础卷积操作来源于MobileNetV2的结构, 其使用轻量级的深度可分离卷积来节约网络模型中的计算量(FLOPS)和模型参数量(Parameters)。


来源:(行走自由的花)

【江苏龙网】网址:/a/2021/0326/lmkd0RTG1542020.html

标题: 范式|第四范式提出AutoSTR,自动搜索文字识别网络新架构( 二 )


上一篇: 缺陷|日本零部件供应巨头存产品缺陷:丰田、本田、马自达躺枪

下一篇: 钓底|钓鱼技巧:两种离底钓法,绝杀离底之鱼,钓鱼未必一定要钓底!


人文

人才|长兴立体化招聘新模式加快引进大学生

阅读(22)

线上线下实现无缝对接,取得了让企业“走出去”,把学生“引进来”的校地企三赢的成效。据介绍,上述招聘新模式是为加快推进“企业人才引进和用工保障攻坚行动”,长兴县人力资源和社会保障局大力引进储备该县企业紧缺急需专业人才,针对疫情防控常态化形势,...

人文

广西|【落实“六稳六保·优化营商环境”】推进一站式服务 广西稳企利企促“活市”

阅读(46)

”在南宁经济技术开发区政务服务中心企业开办一站式服务专区,前来办理业务的黄女士感慨。说话间,黄女士接过了工作人员递过来的营业执照,“现在办理企业开办手续太方便了!”企业开办人员从工作人员手中接过营业执照得益于政务服务模式改进,不断优化营商环...

人文

发展|山东:2022年海水淡化产能规模超过每日100万吨

阅读(49)

“淡化海水的有效供给,还有利于减少滨海地区开采地下水,减缓海水内侵导致的盐渍蔓延,保护水生态环境;同时,作为海洋战略性新兴产业,海水淡化与综合利用产业能有效加速山东省海洋经济新旧动能转换,培育新的增长点。”山东省海洋局局长张建东说。目前,山...

人文

面包|蔓越莓辫子面包

阅读(44)

By 饭小小 【豆果美食官方认证达人】用料高筋面粉 250g奶粉 8g白砂糖 40g黄油 20g酵母 5g盐 2.5g蛋液 15g水 123g蔓越莓干 30g【辅料】白芝麻 少许做法步骤1、盐和黄油除外,所有的放一起揉成团状2、像搓衣板错衣服那样来回搓数次,动作要快3、面团表面光滑...