农民黄小放1算力提升 20 倍,秀!黄仁勋烤箱里端出 7nm 芯片,AI

秀!黄仁勋烤箱里端出7nm芯片 , AI算力提升20倍包永刚AI科技评论昨天
农民黄小放1算力提升 20 倍,秀!黄仁勋烤箱里端出 7nm 芯片,AI
文章图片
作者|包永刚编辑|丛末
突如其来的新冠肺炎大流行打乱了众多公司的产品发布计划 , 比如本该在今年3月英伟达(NVIDIA)GTC2020上发布的安培(Ampere)架构曝光多次却一直未发布 。 今天 , 英伟达CEO黄仁勋发布了英伟达新一代GPU架构安培 , 并带来了基于安培架构GPUA100的DGX-A100AI系统和面向边缘AI计算的EGXA100 。
有意思的是 , 受疫情影响 , 已经在家工作四十五天的黄仁勋是在家里的厨房提前录制了演讲视频 , 用三个视频完成了2020GTC的主题演讲和新品发布 。
此次GTC2020最重磅的产品自然是安培架构GPUA100 , 这是目前全球最大的7nm芯片 , 面积高达826平方毫米 , 集成了540亿个晶体管 。 相比Volta架构实现了高达20倍的性能提升 , 并且可以同时满足AI训练和推理的需求 。
由8个安培A100GPU打造的NVIDIADGXA100AI系统单节点性能达到了创纪录的5petaflops 。
农民黄小放1算力提升 20 倍,秀!黄仁勋烤箱里端出 7nm 芯片,AI
文章图片
1第八代安培GPU架构性能提升高达20倍安培是英伟达继2018发布的Turing(图灵)架构之后的最新一代GPU架构 , 也是英伟达推出的第八代GPU架构 。 黄仁勋说:“Ampere架构的突破性设计为英伟达第八代GPU提供了迄今为止最大的性能飞跃 , 集AI训练和推理于一身 , 并且其性能相比于前代产品提升了高达20倍 。 这是有史以来首次 , 可以在一个平台上实现对横向扩展以及纵向扩展的负载的加速 。 A100将在提高吞吐量的同时 , 降低数据中心的成本 。 ”
农民黄小放1算力提升 20 倍,秀!黄仁勋烤箱里端出 7nm 芯片,AI
文章图片
据悉 , 第八代安培架构GPU采用的是台积电7nm工艺 , 使用的是最新的3D封装技术 , 集成540亿个晶体管也让安培架构GPUA100成为了全球最大的7nm芯片 。 除此之外 , A100还有另外四大关键特性:
具有TF32的第三代TensorCore核心 , 英伟达广泛采用的TensorCore核心现在已变得更加灵活、快速且易于使用 。
多实例GPU-MG , 一种全新技术功能 , 可将单个A100GPU分割为多达七个独立的GPU , 为不同规模的工作提供不同的计算力 , 以此实现最佳利用率和投资回报率的最大化 。
第三代NVIDIANVLInk , 使GPU之间的高速联接增加至原来的两倍 , 实现服务器的高效性能扩展 。
结构化稀疏 , 这种全新效率技术利用AI数学固有的稀疏性 , 使性能提升了一倍 。
【农民黄小放1算力提升 20 倍,秀!黄仁勋烤箱里端出 7nm 芯片,AI】对于具有TF32的第三代TensorCore核心 , 黄仁勋解释 , 其功能经过扩展后加入了专为AI开发的全新TF32 , 它能在无需更改任何代码的情况下 , 使FP32精度下的AI性能提高多达20倍 。 此外 , TensorCore核心现在支持FP64精度 , 相比于前代 , 其为HPC应用所提供的计算力比之前提高了多达2.5倍 。
农民黄小放1算力提升 20 倍,秀!黄仁勋烤箱里端出 7nm 芯片,AI
文章图片


    推荐阅读