『』NVIDIA发布7nm安培GPU!AMD移动CPU性能屠榜

『』NVIDIA发布7nm安培GPU!AMD移动CPU性能屠榜
文章图片

文章图片

【『』NVIDIA发布7nm安培GPU!AMD移动CPU性能屠榜】NVIDIA发布7nm安培架构GPU
NVIDIA在5月14日晚上的GTC 2020线上发布会上 , 正式推出了7nm安培(Ampere)架构GPU , NVIDIA创始人兼CEO黄仁勋表示这是NVIDIA八代GPU史上最大的一次性能飞跃 。
『』NVIDIA发布7nm安培GPU!AMD移动CPU性能屠榜
文章图片

文章图片

首款基于安培GPU的产品是“A100”计算卡 , 并没有像之前产品那样冠以Tesla的品牌序列 , 根据德国媒体从NVIDIA那里得到的消息称 , NVIDIA已经放弃使用了13年的Tesla这个品牌 , 只保留GeForce和Quadro这两个品牌 , NVIDIA解释放弃的理由为和马斯克的电动车品牌撞名了 , 容易混淆 。
新的核心被叫做“A100 Tensor Core GPU” , 突出张量核心的关键作用 , 而核心代号按惯例延续为GA100(G代表图形Graphics) 。根据NVIDIA的说法 , 新显卡带来了5大技术创新:
1、 全新的安培GPU架构 , 540亿晶体管 , 世界上最大的7nm处理器;
2、 第三代Tensor Core AI核心 , 支持TF32运算 , 无需任何代码改变就可以让AI性能提升20倍 , 还支持FP64双精度运算 , 与HPC应用相比带来了2.5倍的性能;
3、 Multi-instance GPU多实例GPU , 简称MIG , 这是一项创新技术 , 可以将一个GPU划分为七个独立的GPU , 针对不同的目标提供不同的运算 , 最大化提高计算效率;
4、 NVLink3.0 , 新一代GPU总线的性能翻倍 , 可以在服务器应用中提供更有效的性能扩展;
5、 结构稀疏性 , 这项新技术liyongAI运算中固有的稀疏性实现了性能翻倍 。
这5大技术创新使得A100加速卡成为苛刻工作负载的理想选择 , 不仅可以用于AI推理、AI训练 , 还可以用于科学仿真、AI对话、基因组、高性能数据分析、地震建模以及财务计算等等 。
『』NVIDIA发布7nm安培GPU!AMD移动CPU性能屠榜
文章图片

文章图片

在规格参数方面 , A100核心采用的是台积电7N工艺 , 也就是定制版的7nm工艺 , 核心面积为826mm2 , 拥有542亿个晶体管 , 108组SM单元、SXM4架构 , 6912个CUDA核心 。Tensor Core数量虽然相比Volta的640个减少到了432个 , 但性能却有大幅增强 , 支持全新的TF32运算 , 浮点性能为156TFLOPS , 同时INT8浮点性能为624TOPS , FP16性能为312TFLOPS , 常规FP32和FP64性能提升到了19.5、9.7TFLOPS 。
A100核心在频率方面有所降低 , 仅为1410MHz , 相比上一代V100的1530MHz降低了不少 , 毕竟核心规模实在太大了 , 功耗已经飙到了400W , 比V100的300/350W功耗高出不少 。
显存方面A100配备的也是HBM2显存 , 频率为2.4Gbps , 位宽5120bit , 相比V100有了全面提升 , 容量也增加到了40GB 。而HBM2显存位宽和频率双双提升的结果就是 , A100核心的显存带宽达到了1.6TB/s , 远高于V100的900GB/s和AMD Radeon VII的1TB/s 。
NVLink3.0带宽为600GB/s , 相比2.0的300GB/s直接提升了一倍 , 以满足服务器领域多卡互联的需求 。
『』NVIDIA发布7nm安培GPU!AMD移动CPU性能屠榜
文章图片

文章图片

『』NVIDIA发布7nm安培GPU!AMD移动CPU性能屠榜
文章图片


推荐阅读