NVIDIA|NVIDIA两款全新GPU首秀：刷新AI推理纪录、性能314倍于CPU 显卡|NVIDIA两款全新GPU首秀：刷

时隔半年，MLPerf组织发布最新的MLPerf Inference v1.0结果，V1.0引入了新的功率测量技术、工具和度量标准，以补充性能基准，新指标更容易比较系统的能耗，性能和功耗。
V1.0版本的基准测试内容云端推理依旧包括推荐系统、自然语言处理、语音识别和医疗影像等一系列工作负载，边缘AI推理测试则不包括推荐系统。

文章图片
MLPerf Inference v1.0
【NVIDIA|NVIDIA两款全新GPU首秀：刷新AI推理纪录、性能314倍于CPU】所有主要的OEM都提交了MLPerf测试结果，其中，在AI领域占有优势地位的NVIDIA此次是唯一一家提交了从数据中心到边缘所有MLPerf基准测试类别数据的公司，并且凭借A100 GPU刷新了纪录。
不仅如此，超过一半提交成绩的系统都采用了NVIDIA的AI平台。
不过，初创公司提交其AI芯片推理性能Benchmark的依旧很少。
AI推理最高性能半年提升45%
雷锋网在MLPerf Inference v0.7结果发布的时候已经介绍过，NVIDIA去年5月发布的安培架构A100 Tensor Core GPU在云端推理的基准测试性能是最先进英特尔CPU的237倍。
经过半年的优化，NVIDIA又将推荐系统模型DLRM、语音识别模型RNN-T和医疗影像3D U-Net模型的性能进一步提升，提升幅度达最高达45%，与CPU的性能差距也提升至314倍。

文章图片
从架构的角度看，GPU架构用于推理优势并不明显，但NVIDIA依旧凭借其架构设计配合软件优化刷新了MLPerf AI云端和边缘推理的Benchmark纪录。
MLPerf的Benchmark证明了A100 GPU性能，但其不菲的售价也是许多公司难以承受的。
今天，更具性价比的NVIDIAA30（功耗165W）和A10（功耗150W） GPU也在MLPerf Inference v1.0中首秀。
A30 GPU强于计算，支持广泛的AI推理和主流企业级计算工作负载，如推荐系统、对话式AI和计算机视觉。
A10 GPU更侧重图像性能，可加速深度学习推理、交互式渲染、计算机辅助设计和云游戏为混合型AI和图形工作负载提供支持。可以应用于AI推理和训练的A30和A10 GPU今年夏天开始会应用于各类服务器中。

文章图片
A100云端AI推理性能比CPU高314倍
A100经过半年的优化，与CPU的性能差距从v0.7时最多237倍的差距增加到了最高314倍。
具体来看，在数据中心推理的Benchmark中，在离线（Offline）测试，A100比最新发布的A10有1-3倍的性能提升，在服务器（Server）测试中，A100的性能最高是A10的近5倍，在两种模式下，A30的性能都比A10高。

文章图片
值得注意的是，英特尔本月初最新发布的第三代至强可扩展CPU Ice Lake的推理性能相比上一代Cooper Lake在离线测试的ResNet-50和SSD-Large模型下有显著提升，但相比A100 GPU体现出17-314倍的性能差距。
高通AI 100的云端AI推理在MLPerf Inference v1.0测试下表现不错，其提交的离线和服务器测试下的ResNet-50和SSD-Large模型成绩显示，高通AI 100的推理性能均比NVIDIA新推出的A10 GPU高，其它模型的成绩高通并未提交。
从每瓦性能来看，高通A100在提交成绩的ResNet-50和SSD-Large模型中比A100更高，但性能比A100低。
赛灵思的VCK5000 FPGA在图像分类ResNet-50的测试中表现不错。
Jetson系列是唯一提交所有边缘推理测试成绩的芯片
A系列GPU在云端AI推理的性能优势可以延续至边缘端。MLPerf的边缘AI推理Benchmark分为Single-Stream和Multi-Stream，A100 PCIe、A30、A10在Single-Stream的所有模型下都有显著的性能优势，高通A100在ResNet-50模型下也优势明显，不过高通也仅提交了这一模型的成绩。

文章图片
这些产品用于边缘AI推理有些大材小用，NVIDIA的Jetson家族的AGX Xavier和Xavier NX更适合边缘场景，根据提交的数据，Centaur公司在ResNet-50模型中优势明显，SSD-Small模型下的性能与Jetson Xavier NX性能相当。
边缘AI推理的Multi-Stream Benchmark，只有NVIDIA提交了成绩，A100 PCIe版本的性能最高是Jetson AGX Xavier和Xavier NX的60倍。
在NVIDIA此次提交的结果中，多项是基于Triton推理服务器，其支持所有主要框架的模型，可在GPU及CPU上运行，还针对批处理、实时和串流传输等不同的查询类型进行了优化，可简化在应用中部署AI的复杂性。

NVIDIA|NVIDIA两款全新GPU首秀：刷新AI推理纪录、性能314倍于CPU

推荐阅读

技术■邀你参加 | 首场技术转化“云课堂” 本月7号开讲

『易经风水知识』代表钱仓丰满，命中财气很旺！，脸上这个地方饱满

诗词歌赋|“鸡声茅店月，人迹板桥霜”中茅店到底何意？诗词大会54人答错

幼儿交通安全小知识顺口溜?交通安全小知识顺口溜图片_1

怀孕可以吃孕妇奶粉吗？怀孕吃什么比较好

『荣耀De冷』那个朱棣临终前说“爱我”的人，大明管家夏原吉

综艺|《未知的餐桌》凭6分的评分获得口碑，岳云鹏的观众缘真不是玄学

哪些人不宜食用青羊肉？青羊肉的副作用有哪些?

穿搭|周迅没有明星架子，穿T恤牛仔裤坐地上帮奶奶拍照，广受网友好评

8个字押韵的结婚祝福语有哪些？

幽默渠昊英|搞笑段子：好歹我也是过了英语四级,你说个panda会死啊

李沁|又被李沁美到了！一袭白色缎面拖尾长裙配大红唇，女神范十足

家里的管道漏水怎么办家里管道漏水怎么办

那么心动|父亲拼命凑钱坐车送去，看到女婿的债主愣了，女婿欠债八十万

卓依婷|卓依婷曾经被观众大喊：滚下去，你个冒牌货，卓依婷已经去世了

一全姐说|她被誉为“排球女神”，因一张训练照走红，颜值不输娱乐圈明星

为啥晚上不能吃姜

WeChat|腾讯公司回应美国商务部针对WeChat最新行政命令

央视|结伙辱骂、殴打医护人员陕西“伤医”父子终被判刑！

浙江象山一渔船被撞沉 2人获救5人失联