cnBeta|AMD推出Instinct MI100和Radeon ROCm 4.0


_本文原题:AMD推出Instinct MI100和Radeon ROCm 4.0
AMD在本周的SC20虚拟会议上 , 推出了基于他们CDNA架构的AMD Instinct MI100加速器 。 另外值得注意的是 , 与MI100发布同时进行的还有Radeon Open eCosystem 4.0(ROCm 4.0)Linux版本 。 AMD认为MI100是世界上最快的HPC GPU加速器 , 提供超过10TFLOPS的FP64计算能力 。 MI100额定峰值FP64性能为11.5 TFLOPS , FP32矩阵性能高达46.1 TFLOPS 。 与上一代AMD加速器相比 , 搭配AMD矩阵核心技术的MI100在人工智能训练方面的FP16峰值性能提升近7倍 。
AMD Instinct MI100内建32GB HBM2内存 , 工作频率1.2GHz , 内存带宽为1.23TB/s 。 MI100支持PCI Express 4.0连接 , 内建120个计算单元和7680个流处理器 。 CDNA是Vega架构演化版本 , 而不是针对游戏优化的RDNA/Navi架构 , 考虑到HPC的重点和我们看到Arcturus Linux补丁成熟的时间 , AMD Instinct MI100支持的Linux支持应该是很好的推出状态 , 尽管我们还没能测试加速器以确认其Linux支持状态 。
AMD Instinct MI100使用32GB HBM2内存 , 时钟速率为1.2GHz , 内存带宽为1.23TB/s 。 MI100支持PCI Express 4.0连接 , 可打包120个计算单元和7680个流处理器 。 CDNA是织女星结构的进化 , 而不是游戏优化而不是计算的RDNA/Navi 。 考虑到AMD对HPC的关注以及Arcturus Linux补丁准备在即 , AMD Instinct MI100应该很好的支持到Linux 。
这次推出的ROCm 4.0让它比以往更容易更高效地将NVIDIA CUDA代码库移植到它上面 。 ROCm 4.0被宣传为 "Exascale时代 "的开源平台 , 同时支持OpenMP 5.0行业标准及其HIP接口 , 以及PyTorch和Tensorflow框架等 。 ROCm进化目的是让开发者更容易部署和移植他们的软件 , 使其运行在这个开源计算栈上 , 而不是NVIDIA专有的 CUDA平台 。
AMD还在SC20虚拟会议上表示 , EPYC "Zen 3 "处理器本季度将批量提供给部分HPC和云计算客户 。 AMD EPYC Zen 3 CPU将在2021年第一季度正式发布和上市 。
cnBeta|AMD推出Instinct MI100和Radeon ROCm 4.0
本文插图

【cnBeta|AMD推出Instinct MI100和Radeon ROCm 4.0】cnBeta|AMD推出Instinct MI100和Radeon ROCm 4.0
本文插图

cnBeta|AMD推出Instinct MI100和Radeon ROCm 4.0
本文插图

cnBeta|AMD推出Instinct MI100和Radeon ROCm 4.0
本文插图


    推荐阅读