江苏龙网


首页 > 人文 >>

范式|第四范式提出AutoSTR,自动搜索文字识别网络新架构( 三 )



按关键词阅读:


 范式|第四范式提出AutoSTR,自动搜索文字识别网络新架构
文章图片
(3)搜索算法
本文将搜索 的过程和搜索 的过程解耦成两步搜索过程,具体来说,在第一步中,本文下采样路径上面的卷积操作 全部固定成默认的3X3的普通残差网络层,然后在此基础上搜索下采样路径。第二步搜索的过程是基于第一步已经搜索出来的最优下采样路径,进一步搜索如何在该路径上面放置更好的卷积操作。
第一步:搜索特征下采样路径
用 表示卷积网络 在数据集 上计算得到的序列交叉熵损失。用 表示训练集,对应的 表示验证集。在这一步骤中先默认卷积操作为固定的 ,搜索下采样路径。因此公式(1)中 变成了常量,可以被改写成公式(2)中的搜索任务。
在3.2.1节本文已经阐述了下采样路径中只能存在两次 和三次 的卷积滑动的步长策略以满足约束条件 ,我们分别用符号 和 表示这两种步长策略。注意到目前的一些NAS方法,在每个卷积阶段使用相同数量的层,并取得了良好的效果。通过使用这些合理的先验知识与设计准则,本文对搜索空间进行了简化,对于一个深度 的网络,本文在第1、4、7、10、13层分别设置特征下采样,而其他层使用步长 即保持当前分辨率不变,从而将整个网络平均分成五个卷积阶段,每个卷积阶段包含3个卷积层。因此特征下采样路径可以划分为10种典型的路径: 、 、 、 、 、 、 、 、 和 。本文可以在这些典型的路径集合中进行小范围的网格化搜索,以找到最接近 的良好路径。然后,通过在搜索步骤2中学习跳连接(Skip-Connect)层,从而可以减少每个卷积阶段的卷积层数。
第二步:搜索卷积操作块
受可微分架构搜索的启发,我们给第 层的卷积操作 赋予结构参数 ,从而将卷积块中操作的离散选择给连续化。由于 对整个网络的复杂度和准确率都会产生影响,因此我们给操作搜索的优化函数引入了一个正则项 以便实现一个良好的折中,如公式(3), 用于调节正则项对损失函数的影响程度, 表示作为参考网络的计算量。
因此公式(1)的优化目标可以继续改写成公式(4),
目前很多方法可以用来解决公式(4)中的问题,比如DARTS [1]、NASP [2]等等,为了节约显存,我们最后采用了ProxylessNAS [3]。
[1]. DARTS: Differentiable Architecture Search. ICLR 2018
[2]. Efficient Neural Architecture Search via Proximal Iterations. AAAI 2020.
[3]. Proxylessnas: Direct neural architecture search on target task and hardware. ICLR 2018
4
【 范式|第四范式提出AutoSTR,自动搜索文字识别网络新架构】实验结果
此次,根据一般场景文本识别设计基准来评估本次工作的搜索架构。实验数据包括IIIT 5K-Words (IIIT5K) 、Street View Text (SVT) 、ICDAR 2003 (IC03) 、 ICDAR 2013 (IC13) 、ICDAR 2015 (IC15)、SVT-Perspective (SVTP) 等数据,其中,前四个数据集中的图像是规则的,其余为不规则的。
(1)实验对比
在识别精度上,利用搜索到的主干网,整个框架与其他最先进的方法进行了比较,如下图所示。
 范式|第四范式提出AutoSTR,自动搜索文字识别网络新架构
文章图片
AutoSTR在IIIT5K、SVT、IC15、SVTP中表现最好,在IC03、IC13中也获得了相似的结果。值得注意的是,AutoSTR在IIIT5K、SVT、IC03、IC13、SVTP、IC15上的表现优于ASTER,分别为1.4%、1.9%、0.9%、2.7%、2.3%,证明了AutoSTR的有效性。尽管SCRN可以获得与AutoSTR相当的性能,但它的校正模块需要额外的字符级注释来实现更精确的校正。作为一个插件,AutoSTR在配备SCRN整流模块的同时,有望进一步提高性能。
在计算耗能方面,下图详细比较了各方法的浮点运算和内存大小。
 范式|第四范式提出AutoSTR,自动搜索文字识别网络新架构


来源:(行走自由的花)

【江苏龙网】网址:/a/2021/0326/lmkd0RTG1542020.html

标题: 范式|第四范式提出AutoSTR,自动搜索文字识别网络新架构( 三 )


上一篇: 缺陷|日本零部件供应巨头存产品缺陷:丰田、本田、马自达躺枪

下一篇: 钓底|钓鱼技巧:两种离底钓法,绝杀离底之鱼,钓鱼未必一定要钓底!


人文

人才|长兴立体化招聘新模式加快引进大学生

阅读(22)

线上线下实现无缝对接,取得了让企业“走出去”,把学生“引进来”的校地企三赢的成效。据介绍,上述招聘新模式是为加快推进“企业人才引进和用工保障攻坚行动”,长兴县人力资源和社会保障局大力引进储备该县企业紧缺急需专业人才,针对疫情防控常态化形势,...

人文

广西|【落实“六稳六保·优化营商环境”】推进一站式服务 广西稳企利企促“活市”

阅读(46)

”在南宁经济技术开发区政务服务中心企业开办一站式服务专区,前来办理业务的黄女士感慨。说话间,黄女士接过了工作人员递过来的营业执照,“现在办理企业开办手续太方便了!”企业开办人员从工作人员手中接过营业执照得益于政务服务模式改进,不断优化营商环...

人文

发展|山东:2022年海水淡化产能规模超过每日100万吨

阅读(49)

“淡化海水的有效供给,还有利于减少滨海地区开采地下水,减缓海水内侵导致的盐渍蔓延,保护水生态环境;同时,作为海洋战略性新兴产业,海水淡化与综合利用产业能有效加速山东省海洋经济新旧动能转换,培育新的增长点。”山东省海洋局局长张建东说。目前,山...

人文

面包|蔓越莓辫子面包

阅读(44)

By 饭小小 【豆果美食官方认证达人】用料高筋面粉 250g奶粉 8g白砂糖 40g黄油 20g酵母 5g盐 2.5g蛋液 15g水 123g蔓越莓干 30g【辅料】白芝麻 少许做法步骤1、盐和黄油除外,所有的放一起揉成团状2、像搓衣板错衣服那样来回搓数次,动作要快3、面团表面光滑...