DT Value|NVIDIA安培GPU:从TOP500走向云智应用


八一八安培架构GPU的基本功
2017年5月10日 , NVIDIA(英伟达)推出Volta架构及对应的Tesla V100数据中心GPU 。 一年之后 , IBM为美国能源部(DOE)建造的超级计算机Summit就在近3万个Tesla V100 GPU的加持下登上TOP500榜单的首位 。 在这500套(当时)全球最快的高性能计算(High Performance Computing , HPC)系统中 , 使用加速器的有110套 , 其中NVIDIA GPU多达98套 , 接近九成 , 在前10名中也占据了半壁江山 。

DT Value|NVIDIA安培GPU:从TOP500走向云智应用
本文插图

2019年11月 , TOP500榜单中使用加速器的系统数量 , Volta架构傲视同侪
TOP500榜单每年更新两次 , 时隔一年半之后 , 榜单的头名和NVIDIA GPU在前10名中的占比都没变 , 但是使用加速器或协处理器技术的系统增加到145套:其中基于Volta的多达94套 , 接近三分之二;使用NVIDIA GPU的系统数量比前一期榜单的加速器方案总和(134套)都多……而在强调单位能效的Green500榜单中 , 前10名中有8个采用NVIDIA GPU——7个是V100 。
如果我们把目光放在TOP500榜单的后100名(401~500) , 会发现另一个有趣的现象:2018年6月 , 采用NVIDIA GPU的系统只有15个;2019年11月 , 仅采用V100的系统就有18套 , 其中排名第422和494位的两套系统 , 其节点和互连方案与榜单前两名(美国能源部的Summit和Sierra)如出一辙 。
快速占据TOP500榜单的近20% , 既“上得厅堂”又“下得厨房” , V100可以说是有史以来最为成功的数据中心GPU 。 又是在5月 , 又是在TOP500榜单更新之前 , 三年后在老黄的厨房“面世”的A100 GPU能否取得更高的成就?

DT Value|NVIDIA安培GPU:从TOP500走向云智应用
本文插图

Ampere(安培)架构推出当天 , 即宣布获得美国和德国的6家超算中心采用 , 包括DGX A100系统组成的集群 , 共使用近1.3万个A100 GPU , 总算力为:使用64位浮点运算的仿真 , 峰值性能超过250 PFlops(petaflops);使用混合精度运算的AI推理工作 , 利用A100 GPU对稀疏性的支持 , 可以提供惊人的8.07 EFlops(exaflops) 。

DT Value|NVIDIA安培GPU:从TOP500走向云智应用
本文插图

美国阿贡国家实验室部署首批DGX-A100系统
在(北京时间)昨天夜里公布的第55版TOP500榜单中 , 酝酿多年的ARM超算系统Fugaku(富岳)终于登上榜首 , “仓促上阵”的A100则凭借基于DGX A100 SuperPOD快速搭建起来的Selene斩获第7 , 而前10名中的另外两个新面孔都基于V100 , 使得NVIDIA GPU在第一集团中的占比进一步升至六成 。
A100的能效表现更为亮眼:Selene在Green500榜单上坐二望一 , 两者的单位功耗非常接近 , 但是第一名的规模至少小一个数量级 , 在TOP500榜单中的排名低至394位 。 V100也保持了相当高的竞争力——TOP500前10中 , 采用V100的系统 , 仅有1套没进入Green500前10 。
可以期待 , 即将到来的E级(Exa-scale)超算时代 , 前排一定不乏A100的身影 。 不过 , 基于Ampere架构的数据中心产品 , 目光绝不仅限于超算中心 , 面对蓬勃发展的人工智能、数据分析和云计算市场 , NVIDIA给它们赋予的使命是“我全都要!”
平民化:从HPC到ABC
高性能计算可谓计算机界“皇冠上的明珠” , 也为合称“ABC”的人工智能(Artificial Intelligence , AI)、大数据(Big Data)、云计算(Cloud Computing)提供了理论依据和实践基础 。 但是 , ABC在应用场景和使用模式上都演化出了自己的特色 , HPC也有不同的场景细分 , 在HPC市场上取得的成功并不能自然复制到那三大市场上 。 举个比较极端的例子:x86处理器在Top500榜单中占比高达95% , 却越来越不被认为是AI基础架构的主角 。


推荐阅读