驱动之家|Intel发布第三代可扩展至强:八路224核心、唯一数据中心AI CPU


今天 , Intel正式发布了第三代至强可扩展处理器 , 代号“Cooper Lake” , 频率、核心数、内存等提升的同时 , 重点强化了DLBoost深度学习能力 , 是当今全球唯一内置AI的主流数据中心处理器 。
Cooper Lake主要面向四路、八路市场 , 今年晚些时候还将有基于10nm Ice Lake的至强 , 针对单路、双路市场 , 二者互补构成完整的第三代家族 。
至于为何如此划分 , Intel给出的解释是更多客户希望在更多路系统上进行AI强化 。

驱动之家|Intel发布第三代可扩展至强:八路224核心、唯一数据中心AI CPU
本文插图


驱动之家|Intel发布第三代可扩展至强:八路224核心、唯一数据中心AI CPU
本文插图

Cooper Lake仍然采用14nm工艺制造 , 最多28核心56线程(八路就是最多224核心448线程) , 部分型号增加了核心数量 , 同时频率更高 , 基准频率提升至最高3.1GHz , 单核睿频加速最高则可达4.3GHz , 三级缓存最多38.5MB(每核心对应1.375MB) , 热设计功耗150-250W 。
内存支持六通道DDR4 , 最高频率3200MHz , 单路最多12条 , 并支持16Gb高密度颗粒 , 单路最大容量可达4.5TB , 八路就是36TB , 当然也支持Intel自家的Optane PMem傲腾可持续内存 , 而且配合发布了新的200系列 。
技术方面 , 部分型号新增加了Intel Speed Select(SST)技术 , 包括STT Core Power(SST-CP)、SST Turbo Frequency(SST-TF) , 可优化处理资源 , 提升工作负载性能、提高资源利用率、优化平台TCO成本 , 同时支持Intel AVX-512指令集、VNNI/BFloat16深度学习加速指令集 。
由于面向四路、八路系统 , Cooper Lake都内置了六条UPI互连总线 , 最高传输率达10.4GT/s 。
输入输出方面 , 处理器支持最多48条PCIe 3.0通道 , 搭配C620A系列芯片组(包括C621A、C627A、C629A)还可提供最多20条PCIe 3.0、10个USB 3.0、14个SATA 6Gbps , 处理器与芯片组互连通道为DMI 3.0 x4 。
Cooper Lake封装接口自改成了新的Socket P+ , 又称为LGA4189 , 未来的Ice Lake也是这一新接口 , 都不兼容现在的LGA3647平台 。

驱动之家|Intel发布第三代可扩展至强:八路224核心、唯一数据中心AI CPU
本文插图


驱动之家|Intel发布第三代可扩展至强:八路224核心、唯一数据中心AI CPU
本文插图

八路系统结构图

驱动之家|Intel发布第三代可扩展至强:八路224核心、唯一数据中心AI CPU
本文插图

LGA4189插座
AI无疑是这三代可扩展至强的最大特色 , 而且一直在飞速前进 。
2017年的第一点支持AVX-512 FP32浮点格式 , 具备高精度优势 , 得到了24项优化 , 金山云、美的、南京大学、盈谷等中国科技企业、机构等都做了部署 。

驱动之家|Intel发布第三代可扩展至强:八路224核心、唯一数据中心AI CPU
本文插图

2018年的第二代加入了DLBoost INT8整数格式 , 44项优化 , 我们也看到了更多国产机构的名字:科大讯飞、上海交大、京东云、云创大数据、智芯原动、汇医慧影、青云QingCloud、东软等等 。

驱动之家|Intel发布第三代可扩展至强:八路224核心、唯一数据中心AI CPU
本文插图

而在最新的第三代上 , 我们又迎来了新的BFloat16(简称BF16) , 专为AI运算、深度学习等应用而开发 , 一方面适当降低了精度(依然很接近FP32) , 从而提高能效 , 软件应用也不需要太多调整 , 另一方面则大幅提升了AI性能 , 官方宣称相比上代FP32训练性能提升最多1.93倍、推理性能提升最多1.9倍 。
目前 , 支持BF16的第三代至强可扩展处理器已经获得了阿里云、蚂蚁金服、腾讯云、海鑫科金、东软等公司的支持 , 实测显示各项性能提升少则54% , 多则97% 。


推荐阅读