苹果此前在论文《FastViT: A Fast Hybrid Vision Transformer using Structural Reparameterization》中提出的 FastViT 架构已正式开源 。
文章插图
论文地址:https://arxiv.org/pdf/2303.14189.pdf
代码仓库:https://Github.com/Apple/ml-fastvit
FastViT 有机地结合了 CNN 和 Transformer 的优势,无论在精度或者运行效率上均有了稳定的提升 。FastViT 引入了一种新的 Token 混合算子,命名为 RepMixer 。从名字来看,它结合了结构重新参数化技术 。该算子的作用原理是通过消除网络中的 skip connection 来降低内存访问成本 。
FastViT 整体框架图:
文章插图
实验结果表明,FastViT:
- 在移动设备上的速度比混合 Transformer 架构 CMT 快 3.5 倍
- 在 Imag.NET 数据集上的精度相同,但速度比 EfficientNet 快 4.9 倍且比 ConvNeXt 快 1.9 倍
- 在相似的延迟下,FastViT 在 ImageNet 上的 Top-1 精度比 MobileOne 高出 4.2%
文章插图
参考:https://mp.weixin.qq.com/s/poJur-vOtU2-h2tUe89shA、https://mp.weixin.qq.com/s/uqcWy4sx1NQuqOplsGDUlg
END
【苹果开源FastViT:快速卷积Transformer的混合视觉架构】
推荐阅读
- 苹果酸是什么东西对人体有害吗 苹果酸是什么东西
- jsp文件怎么打开 jsp文件怎么打开方式苹果手机
- 苹果背部敲击怎么设置二维码 苹果背部敲击怎么设置
- 苹果推出新功能,让用户轻松管理两个微信账号
- 可绕过苹果三重防护机制,专家发现 macOS 新漏洞
- 苹果的10种吃法 苹果有哪10种吃法
- Python 失宠!Hugging Face 用 Rust 新写了一个 ML 框架,现已低调开源
- 苹果春季施肥方法 苹果春季施肥方法视频
- 苹果手机量尺寸功能在哪里透明测量尺子 苹果手机量尺寸功能在哪里
- 李湘分享王诗龄暑假生活,因苹果手机没有带壳,被指责炫富好荒诞