「图像处理」李沐团队提出最强ResNet改进版，多项任务达到SOTA

本文插图

这就表明，如果一个模型由更多的Split-Attention模块组成，那么它的效果会更好。
语义分割在语义分割下游任务的转移学习中，使用DeepLabV3的GluonCV实现作为基准方法。
从下表中不难看出， ResNeSt将DeepLabV3模型实现的mIoU提升了约1% ，同时保持了类似的整体模型复杂度。

本文插图

【「图像处理」李沐团队提出最强ResNet改进版，多项任务达到SOTA | 已开源】值得注意的是，使用ResNeSt-50的DeepLabV3模型的性能，比使用更大的ResNet-101的DeepLabV3更好。
ResNeSt：注意力分割网络性能如此卓越，到底是对ResNet做了怎样的改良呢？
接下来，我们就来揭开ResNeSt的神秘面纱。
正如刚才我们提到的， ResNeSt是基于ResNet ，引入了Split-Attention块，可以跨不同的feature-map组实现feature-map注意力。
Split-Attention块是一个计算单元，由feature-map组和分割注意力操作组成。下2张图便描述了一个Split-Attention块，以及cardinal group中的split-Attention 。

本文插图

本文插图

从上面的2张图中不难看出，都有split的影子。比如 K(k) 和 R(r) 都是超参数，也就是共计 G = K*R 组。
除此之外，也可以与SE-Net和SK-Net对比着来看。
其中， SE-Net引入了通道注意力(channel-attention)机制；SK-Net则通过两个网络分支引入特征图注意力(feature-map attention) 。
ResNeSt和SE-Net、SK-Net的对应图示如下：

本文插图

研究人员介绍

本文插图

李沐，亚马逊首席科学家，加州大学伯克利分校客座助理教授，美国卡内基梅隆大学计算机系博士。
专注于分布式系统和机器学习算法的研究。他是深度学习框架MXNet的作者之一。
曾任机器学习创业公司Marianas Labs的CTO和百度深度学习研究院的主任研发架构师。
李沐有着丰富的研究成果，曾先后在国内外主流期刊上发表多篇学术论文，其中《DiFacto — Distributed Factorization Machines 》在ACM国际网络搜索和数据挖掘（WSDM）大会上被评为最佳论文奖。
传送门论文地址：https://hangzhang.org/files/resnest.pdf
GitHub项目地址：https://github.com/zhanghang1989/ResNeSt
— 完 —
量子位 QbitAI · ***签约
关注我们，第一时间获知前沿科技动态

「图像处理」李沐团队提出最强ResNet改进版，多项任务达到SOTA | 已开源( 二 )

推荐阅读

西藏纳木错是我国第几大咸水湖纳木错湖是海拔最高的湖

男人戒酒喝这水，肾脏越喝越虚！

米饭|几道美味菜肴，简单易学，每次做都担心米饭不够

冬天只需吃这一物让你百病消

每经9点丨国家卫健委：昨日新增确诊病例99例

食材▲9道适合瘦身喝的汤，低脂低卡，每天一碗，不用节食也能瘦

小雪+雨夹雪＋霾！未来三天，注意这些事→

「体坛焦点」平均年薪3000万，名记：布雷迪预计将加盟坦帕湾海盗

菲律宾|不愿意充当美军马前卒，杜特尔特态度逆转，航母刚走就瞬间认怂了

打新娘 * (打屁屁的视频)**

「林火」澳大利亚林火还在烧

[人民前线]侦察兵里当尖兵！，00后上等兵

这道酥到掉渣的老婆饼真的是不讲究，有啥放啥都好吃

电脑的网络带宽测试软件推荐带宽测试软件点对点

保山警方安全头盔又救一命！，71岁老人骑摩托追尾

澎湃|上海科技馆、自博馆自7月21日起恢复团队接待和影院开放

整治|已整治“散乱污”场所1.3万家，白云超前完成年度“小目标”

海陆空天惯性世界|到底买不买，俄罗斯决定敲山震虎：苏35千里奔袭土耳其身下软肋

以下哪个圣痕没有负面以下哪个圣痕没有负面效果

镜子发型|2020精选“不老气”发型16款，无论长短都很美，看看你喜欢哪一款