|CPU推理性能提高数十倍，旷视天元计算图、MatMul优化深度解读

机器之心发布
机器之心编辑部
本文针对旷视天元深度学习框架在推理优化过程中所涉及的计算图优化与 MatMul 优化进行深度解读。
背景及引言
在深度学习大规模落地边缘端场景的今天，如何最大程度降本增效，是企业与开发者共同关注的话题。其中，模型的训练与推理是两个关键环节。
天元（MegEngine）深度学习框架凭借「训练与推理一体化」的独特范式，能够极大程度上（90%）节省模型从研发到部署的整体成本，降低转换难度，真正实现小时级转化；同时，天元（MegEngine）在 CPU 推理方面所做的大量优化工作，也使得开发者在推理时能够发挥出处理器的最佳性能。
在之前我们对天元的极致推理优化进行了综述《工程之道， MegEngine 推理性能极致优化之综述篇》。本文则针对天元在推理优化过程中所涉及的计算图优化与 MatMul 优化进行深度解读，希望能够帮助广大开发者在利用天元 MegEngine「深度学习，简单开发」的同时，也能够了解 CPU 优化的相关知识。
从而帮助大家在模型部署的整体流程中更好地进行加速；在实际模型部署时能够评估模型在特定平台上运行所能达到的性能以及内存使用情况；以及在算法设计时可以设计出更利于 CPU 优化加速的卷积 Opr 等。
CPU 推理优化概览
对于产业应用而言， CPU 推理的性能优化至关重要，如下表所示，经过优化的推理性能可以较未经优化的原始性能提升数十倍。

本文插图

在进行模型推理阶段的优化时，首先需要对模型的计算图进行优化，以避免冗余的计算与访存，确保计算图在推理时是最优的；其次，在大多 CV 相关模型中，卷积的计算比重最高，达到模型总计算量 90% 以上，因此对模型推理的优化主要聚焦在对卷积计算的优化上。
通常而言，卷积计算的实现方式有 3 种：direct 卷积， Im2col 卷积以及 Winograd 卷积。
direct 卷积：根据卷积的计算公式直接对 FeatureMap 上进行滑窗计算；
Im2col 卷积：根据卷积计算需要在输入通道上进行 reduce sum 的特点，将卷积运行转化为 MatMul 计算；
winograd：在保证计算无误的前提下，使用加法替代乘法，达到优化卷积乘法计算量的目的，在中间过程需要使用 MatMul 进行计算。
由上文可知，以 Im2col 或 Winograd 方法进行的卷积计算会频繁使用到 MatMul ，因此对 MatMul 这种基础算子的优化就显得尤为重要。
基于上述考量，本文将首先介绍模型优化中的图优化，然后介绍基础算子 MatMul 在 CPU 上的优化方法。
推理计算图优化
在训练阶段定义模型的计算图，主要是为了满足模型参数的训练需求。当训练结束，模型参数固定后，对计算图的进一步优化能够帮助模型推理更加高效。
推理和训练的计算图是一张有向无环图(DAG) ，在天元中，开发者能够以类似 LLVM 的方式对 DAG 计算图定义许多优化方法，这里简称 OptPass 。 OptPass 可以根据用户的配置有选择性的加入到图优化的 OptPass 列表中，从而帮助用户灵活地为图优化定义 OptPass 。
计算图优化
天元定义了多个为推理进行计算图优化的 OptPass ，开发者使用这些 OptPass 之后，将得到一张用于推理的最优计算图。下面以 MobileNetV1 中，Convolution+Batch Norm+Relu 这样的典型结构经过计算图优化之后 Fuse 为 ConvBias 的过程为例，介绍天元的计算图优化过程。
由于 Batch Norm 在推理阶段除了输入 Tensor 外其他都是常数，因此可以简化为多个 elemwise 的组合，天元实现了一个 ConvertBatchNormToElemwisePass 的 Optpass ，这个 OptPass 将模型中的所有 Batch Norm 转化为 Elemwise ，具体转化原理如下：

|CPU推理性能提高数十倍，旷视天元计算图、MatMul优化深度解读

推荐阅读

小暖妈妈说|窝外怂”的孩子，多半是性格缺陷，爸妈需要做好这2步，“窝里横

「宝宝缺铁」宝宝缺铁的症状有哪些

【人民日报客户端】新一轮强降雨加速入秋进程华南需警惕秋台风影响

找不到人生的主线任务咋办?

如何看待4g牌照发了，但是中国联通的股票并没有因为这一利好信息，而上涨，反而一直下跌?

发型|“发型”对气质的影响太大，在女星身上充分体现，普通人也能学学

WEEK UP探展 | 时尚，向文化复兴致敬

李冰冰 |大花、85花、95后新人花同台吸睛比美，47岁的李冰冰赢了？

『高考生门锁坏了被锁家中』高考生门锁坏了被锁家中是怎么回事?原来是这样

财务如何写年终总结财务年度总结

破次元跨界！梦洁家纺携手超人气国漫玩转国潮家居！

伊朗|电竞都准备进奥运了，伊朗女孩们还因为玩电子游戏而流落异国

绿叶的舞曲|“三顾茅庐”的经过是什么？诸葛亮为何要将刘备两次拒之门外？

央视|因家中有人感染新冠病毒丹麦卫生大臣进行自我隔离

「柠檬」柠檬鸡脚的做法

|内审经验——明白了职场中的权力基础，才知道怎么混职场

「新生儿惊厥」新生儿惊厥是怎么回事三个改变是判断要点

九游网|《下一站江湖》如来神掌怎么获取如来神掌获取攻略

急性冠周炎

特斯拉|特斯拉Model Y刹车灯亮后追尾！车主发声：未踩刹车单踏板的“锅”