AMDAMD Radeon Instinct MI100 CDNA计算卡FP32性能超越英伟达A100


近日 , WCCFTech 分享了有关 CDNA GPU 架构的 AMD Radeon Instinct MI100 计算卡的性能参数 。 与英伟达 A100 相比 , MI100 计算卡在 FP32 算力和性价比上都给我们留下了深刻的印象 。 不过另一方面 , MI100 在人工智能(AI)和高性能计算(HPC)上仍被英伟达 Ampere 超越 。
AMDAMD Radeon Instinct MI100 CDNA计算卡FP32性能超越英伟达A100
本文插图
(组图 via WCCFTech)
除了据说来自 AMD官方演示的 Radeon Instinct MI100 幻灯片 , AdpredTV 还展示了英伟达 Volta 和 Ampere GPU 的基准测试对比 。
AMDAMD Radeon Instinct MI100 CDNA计算卡FP32性能超越英伟达A100
本文插图
早前有文章称 , AMD Radeon Instinct MI100 GPU 将于 2020 下半年投放市场 。 不过 AdoredTV 最新分享的幻灯片表明 , AMD 及其合作伙伴还有服务器领域的后续计划 。
【AMDAMD Radeon Instinct MI100 CDNA计算卡FP32性能超越英伟达A100】
AMDAMD Radeon Instinct MI100 CDNA计算卡FP32性能超越英伟达A100
本文插图
首先 , AMD 计划推出一款面向高性能计算的定制服务器 。 其采用了 2P 设计 , 基于双路霄龙 CPU 平台 , 可选上一代 Rome 或最新的 Milan 芯片 。
AMDAMD Radeon Instinct MI100 CDNA计算卡FP32性能超越英伟达A100
本文插图
每颗霄龙 CPU 都通过第二代 Infinity Fabric 互连方案 , 与两块 Radeon Instinct MI100 加速卡连接 。 单卡热设计功耗 300W , 四路配置可提供 136 T-Flops 的 FP32(SGEMM)算力 。
AMDAMD Radeon Instinct MI100 CDNA计算卡FP32性能超越英伟达A100
本文插图
其它规格包括支持 256 GB/s 的 PCIe 4.0 , 四卡组合的内存容量 128GB、带宽 4.9 TB/s。 单卡具有 32GB 的 HBM2e 显存 , 带宽 1.225 TB/s。 标准配置或无缘 XGMI , 并将仅限于 1U 机架版本 。
AMDAMD Radeon Instinct MI100 CDNA计算卡FP32性能超越英伟达A100
本文插图
至于上市时间 , 据说配备 AMD 霄龙(Rome / Milan)的高性能 1U 服务器会在 2020 年 12 月推出 , 基于英特尔至强 CPU 平台的衍生版本也有望在 2021 年 2 月发布 。
AMDAMD Radeon Instinct MI100 CDNA计算卡FP32性能超越英伟达A100
本文插图
其次是一款 AMD Radeon Instinct MI100 3U 服务器 , 其具有更强大的规格 , 比如支持为两颗霄龙 CPU 连接八张 MI100 计算卡 。 基于 XGMI 方案的每组 4 卡可提供双向 100 GB/s 的连接和 1.2 TB/s 的带宽 。
AMDAMD Radeon Instinct MI100 CDNA计算卡FP32性能超越英伟达A100
本文插图
四路 MI100 加速卡的 FP32 算力为 272 T-Flops , PCIe 带宽 512 GB/s。 HMB 显存容量 256GB , 带宽 9.8 TB/s。 基于 3U 外形的机架平台的总额定功率为 3 kW。
AMDAMD Radeon Instinct MI100 CDNA计算卡FP32性能超越英伟达A100
本文插图
为便于评估性能 , AdoredTV 还将 MI100 计算卡和英伟达公司的 Volta V100 / Ampere A100 GPU 加速卡进行了比较 。 后者具有 XSM 的外形尺寸 , 并提供 400W / 250W 两种 PCIe 接口版本 。
AMDAMD Radeon Instinct MI100 CDNA计算卡FP32性能超越英伟达A100
本文插图
基准测试表明 , Radeon Instinct MI100 计算卡的 FP32 性能较英伟达 Ampere A100 方案高出约13%、同时更是 Volta V100 GPU 的两倍以上 。


推荐阅读