AI人工智能|AI最新趋势 | 我从MLPerf基准测试中读出这些( 三 )


而对话式AI自身也成为了业界关注的焦点 , 推动从金融到医疗健康等行业的业务发展 , 使他们能够构建和部署更快、更智能的会话式AI服务 , 实现更自然的AI人机交互 。 在本轮基准测试中 , 对使用BERT的对话式AI进行了测试(BERT是现有最复杂的神经网络模型之一) 。
最后 , 强化学习测试中使用了Mini-go和全尺寸19x19 围棋棋盘 。 该测试是本轮最复杂的测试 , 内容涵盖从游戏到训练的多项操作 。
事实上 , 在今年GTC黄仁勋的演讲中 , 就包括了对于交互式语音应用(多任务)和推荐系统解决方案(大规模稀疏化数据的处理)等方向的演示 , 引发了业界对于AI下一步应用热点的预测 。 加之MLPerf此次的测试内容更新 , 更进一步展示了这些热点方向 。
写在最后
在很长一段时间内 , 业界都在讨论是否有必要设立AI基准 。 MLPerf的推动者之一吴恩达曾表示:“AI正在改变多个行业 , 但是为了发挥它最大的潜能 , 我们仍需要更快的硬件和软件 。 ”
行业中的支持者也认为 , 标准的缺失限制了AI的应用 , 他们希望基准的确立能帮助AI开发者创造出更好的产品 , 让使用者充分了解所需产品 。 这也正是MLPerf的目标 , 希望用可复制的、公平可靠的基准测量方法来推动机器学习行业和研究的发展 , 产品之间的对比还可以促进供应商和学者之间的竞争 。
当然 , 基准测试自身也面临着变革需求:例如要测规模变化的庞大的AI系统 , 从几块、几十到几千上万块加速卡 , 如何对它们进行客观测试?面对集群计算机 , 测试程序如何做到规模可变的?凡此种种 , 都是面临的挑战 。
不管怎样 , 在AI性能基准测试这个领域目前已经有很多探索 , 比如MLPerf , 小米的mobile AI bench , 百度的Deepbench , 中国人工智能产业发展联盟的AIIA DNN Benchmark等 。 其中 , MLPerf作为国际上大家比较认可的机器学习的标准 , 已经做出了一定的表率 。 这些积极探索也正在驱动前沿大规模计算的迅猛发展 。


推荐阅读