Intel|22年后再战高性能显卡市场 Intel Xe GPU架构详解
作为CPU界的王者,Intel对高性能GPU市场一直没有死心,1998年就推出了i740独显,12年后又推出Larrabee,22年后的今天又重燃战鼓,推出了Xe GPU架构 。Intel重新杀入高性能GPU市场的传闻已久,并挖来了AMD RTG部门前主管、首席架构师Raja Koduri坐镇GPU业务,这次是否会不一样呢?
今天的2020年架构日上,Intel终于详细地解开了Xe GPU的面纱,这里我们就来管中窥豹一探Intel历时多年重新打造的GPU架构 。
文章图片
对于Xe架构,我们之前的报道已经多次提到Intel对它的期望是希望用一种架构去满足多种使用场景,从笔记本到游戏卡再到高性能超算,都是Xe架构,推动GPU算力从万亿次(TFLOPS)向千万亿次(PFLOPS)迈进 。
Intel Xe架构总览:一种架构通杀四方、适应AI、云时代
文章图片
对于Xe GPU架构,官方的定义是“并行矢量矩阵架构”,已经突出了这个架构的特点,那就是高度并行,适合扩展多种场景 。
文章图片
Xe GPU架构有三大重点——软件第一、并行第二,同时适应全新的工作负载,比如AI、视觉云计算等等,这也是Intel作为GPU后来的一个优势,研发GPU架构的时候可以不用照顾太多之前的积累,直接面向未来潜力巨大的场景,比如AI、云计算等等 。
文章图片
Xe GPU希望用一个架构统一所有应用场景,不过实际情况还是很复杂的,不同场景对性能、功耗的要求不同,可以细分为集成+低能耗、中端、发烧级、数据中心/AI、HPC百亿亿次计算等等 。
在这些细分场景中,Intel打造了三种不同的架构——Xe LP低功耗、Xe HP高性能、Xe HPC,不过实际上已经扩展到了四种,后面会再详细说 。
虽然有三四种不同的架构,不过Intel现在做的主要是两种——适用于HPC的Xe HPC及低功耗的Xe LP,后者适合核显、笔记本及低端独显,包括之前曝光最多的DG1显卡 。
Intel Xe GPU架构详解:EU、存储、AI、显示、视频单元全都改了
目前进度最好的还是Xe LP低功耗版,Xe GPU的结构介绍都是基于Xe LP的,具体如下:
文章图片
Xe LP架构简单来说就是在提升FLOPS浮点性能的同时,还要考虑功耗,所以能效很重要,性能及能效兼顾 。
文章图片
提升性能就要提升计算规模,Xe架构在Gen11基础上全面提升了执行单元的规模,EU单元从Ice Lake处理器上的Gen11核显最多64个提升到了96个,每周期Texel纹理、Pixel像素渲染能力也从32、16提升到48、24,总体性能1.5倍于目前Gen11显卡水平 。
考虑到Gen11的规模实际上已经是目前Gen9.5的2倍多,理论上Tiger Lake上的Gen12核显性能是现有核显的至少3倍 。
文章图片
能效方面,在同样的电压下,Xe LP GPU的频率大幅提升,从之前1.1GHz左右提升到了1.7GHz,还有其他手段一起降低了功耗,能效也全面改进了 。
下面就是Gen11与Xe架构EU单元的具体对比了 。
文章图片
文章图片
文章图片
存储单元方面,Xe LP GPU的改变也不小,L1新增了数据是缓存,并支持端对端压缩,L3缓存从Gen11的3MB大幅提升到16MB,同时GTI(Graphics Technology Interface 图形技术接口)带宽翻倍 。
文章图片
在AI上,Xe架构之前的GPU主要是支持FP32、FP16及Int16浮点,而Xe GPU开始支持INT8指令,AI性能是FP32的4倍 。
推荐阅读
- 慧慧动漫屋|24年后大古再唱迪迦主题曲,大古舞姿利索不显老,声音引人泪目
- 一场电影引发的命案!28年后成功告破
- DJ雅清|63年后,老电影《边寨烽火》主演现状,如今达奇王晓棠均86岁
- 腾讯娱乐|“黑豹”扮演者博斯曼与结肠癌斗争4年后过世 年仅43岁
- Intel|英特尔11代酷睿Tiger Lake推广视频曝光
- 颜夕趣史|老农在江边捡到枚“金虎”,卖出1300万,3年后被发现惩罚来了
- 身份|药水哥再战拳王,得知新拳王身份后害怕到下播,难道是生死局?
- 乡间小路发现尸体,21年后真相查出:哥哥与父母吵架,弟弟将哥哥杀害
- 推荐|励志!16岁爬进校园25岁考入大学,10年后他回到“起点”站立支教
- 金融|退休5年后 中国工商银行公司金融业务部原副总经理王英奎被查