快科技@苏黎世跑分可以代表处理器的AI性能吗?

随着手机端加入了越来越多的AI运算 , AI性能已经成为手机处理器的一大关键性能指标 。 近期我们注意到 , 一款测试工具频繁出现在公众视线中:ETHAI-Benchmark , 也就是我们常说的苏黎世跑分 。 一些处理器厂商经常会援引苏黎世跑分的测试数据 , 用以展现其AI性能的强大 。 但苏黎世跑分真能代表处理器的AI性能吗?
苏黎世跑分其实和大家所熟知的安兔兔、GeekBench等跑分软件类似 , 不同的是 , 苏黎世跑分是专门针对AI性能的一款跑分软件 , 它通过对象识别、人脸识别、图像去模糊等共9大测试项的测试 , 根据不同测试项的重要程度不同 , 匹配不同的权重 , 最终得出一个表征AI性能的分数 。
苏黎世跑分客观吗?
-16位浮点运算占比过大严重脱离实际AI应用特点
这是目前最新的苏黎世跑分数据:
快科技@苏黎世跑分可以代表处理器的AI性能吗?
文章图片
我们截取出了2020年颇具代表性的两大平台麒麟9905G和骁龙865的苏黎世跑分成绩 。 其中 , 麒麟9905G得分为70185 , 骁龙865得分29724 , 骁龙865在总分上落后麒麟9905G一大截 。 但分别对比各个测试子项 , 骁龙865却在绝大多数项目上都取得领先 。 唯独在FP16子项大幅落后于麒麟9905G 。 这是为什么?FP16指的是什么?
快科技@苏黎世跑分可以代表处理器的AI性能吗?
文章图片
▲苏黎世跑分各测试子项的占比分配图
FP16指的是16位浮点运算 , 在苏黎世跑分测试子项的占比中 , FP16占到了48%(浅蓝色部分) , 是整数运算(橙色部分)的2倍 。
快科技@苏黎世跑分可以代表处理器的AI性能吗?
文章图片
我们再对应实际的AI运算场景来看一下 。 上图列举了手机中主要AI应用中的详细运算类型 , 如:拍照中的防抖、降噪、HDR…视频拍摄中的慢动作、降噪、帧率转换等均是整数运算 。 全部的AI场景中 , FP16浮点运算参与的比重非常小 。
也就是说 , 实际AI应用中 , 大多数使用的都是IN8、INT16整数运算 。 苏黎世跑分中 , FP16浮点运算48%的比重分配可能严重脱离了实际 。
-缺乏对平台SDK的专门适配
需要注意的是 , 无论哪一款AI测试工具 , 都需要适配平台芯片的SDK(软件开发工具包) , 才能测试出芯片真实的AI能力 。
这里需要介绍一下的是 , 安卓平台有一个基础SDK , 叫做AndroidNNAPI 。 但为了方便厂商在平台上进行快捷开发与适配 , 平台商都会推出自己的SDK 。 苏黎世跑分采用的是AndroidNNAPI 。 但实际上 , 以骁龙平台为例 , 该SDK在骁龙平台的厂商中使用率非常低 。 数据显示:高通平台各厂商中使用骁龙SDK的比例为94% , 而使用AndroidNNAPI的比例小于1% 。
快科技@苏黎世跑分可以代表处理器的AI性能吗?
文章图片
苏黎世跑分不支持骁龙SDK , 因此在测试中并不能发挥出骁龙平台的全部AI性能 , 得出的数据并不具备参考意义 。
-苏黎世跑分可信度存疑
在苏黎世跑分官网的排行榜中 , 2020.2.24显示麒麟9905G的得分为52403 , 而在2020.3.31其得分就改为了70185 。 具体的原因我们暂未可知 , 但我们猜测苏黎世跑分可能对测试子项的比重做出了调整或增加了对麒麟9905G平台的一些新的支持 。
快科技@苏黎世跑分可以代表处理器的AI性能吗?
文章图片
苏黎世跑分的标准可能还未完全确定 , 仍在持续调整中 。
该如何了解处理器的AI性能?
【快科技@苏黎世跑分可以代表处理器的AI性能吗?】值得一提的是 , 各大厂商在发布移动处理器时 , 几乎都会以TOPS(TeraOperationPerSecond , 万亿次/每秒)为单位 , 公布理论AI性能 。 比如骁龙865为15TOPS , 天玑1000为4.5TOPS , 这就是其理论的AI算力 , 而麒麟9905G并未公布过此项数据 。 理论AI算力为官方数据 , 可以作为评定其AI性能的主要参考 。


推荐阅读