那年初夏|华人学者提出软件算法架构加速AI实时化,性能超越GPU、FPGA( 三 )
模型压缩技术主要分为两类:1.剪枝(pruning);2.量化(quantization)
剪枝技术意在删除模型中冗余的权重来减少权重的存储量和计算量 , 而量化技术意在降低权重的精度来减少存储和加快计算速度 。
在CoCoPIE架构中他们新提出了“卷积核模式剪枝(kernelpatternpruning)”和“连通性剪枝(connectivitypruning)” , 以便在不损失准确性的情况下实现更高的剪枝倍率和加速效果 。
1.压缩权重存储(compressedweightstorage)
压缩权重存储格式是专门为CoCoPIE中使用的卷积核模式和连通性剪枝设计的 。 卷积核与输出通道重排结合后 , 这种紧凑的数据结构比传统的CSR(压缩稀疏行)格式能够产生更好的压缩率 。
2.消除负载冗余(loadredundancyelimination)
通过在内核执行代码生成过程中通过分析处理两个寄存器级负载冗余问题 , 解决了基于卷积核模式化剪枝对内存性能的挑战 。 在内存和缓存之间的数据移动已通过高级数据平铺技术进行了优化的前提下 , 这种负载冗余消除有着更加重要的意义 。
推荐阅读
- 那年初夏|SecMind近期安全资讯第十九期
- 春公子|一念之差失败破产,他是昔日华人首富:一人之力挑战美国科技巨头
- 硅谷|欢迎回家!在美华人经历至暗时刻,硅谷上万华人工程师毅然离开
- 科技小辛辛|这篇CVPR华人论文帮你搞定,手残党福音:一键抠图、隔空移物
- 风抚那年殇|其中有四件在中国, 个个都是价值连城,世界上5大失传文物,
- 华为|华为被制裁是自找的?美籍华人院士再放狠话:不要老说自己是第一!
- 那年初夏|转网后遗症?,只出不进?中国移动今年累计流失用户近400w
- 那年初夏|国家出手统筹规划,为发展助力,全国一心的时代要到了
- 那年初夏|19种多彩混光让你酷炫吃鸡,百元性价比机械键盘推荐
- IBM|最悲壮的华人首富:曾经的世界电脑大王,为什么会轰然倒下?