20年后重返独显战场!深度分析英特尔Xe GPU战略( 二 )


和去年推出的Gen 11架构一样 , 英特尔Xe-LP架构也能全面支持DirectX 12_1 API 。 此外 , 新架构带来了明显的性能优势 , 借助英特尔10nm Superfin制程工艺实现了更高的频率潜力(最高可达1.7GHz , 上一代仅为1.1GHz) 。
20年后重返独显战场!深度分析英特尔Xe GPU战略文章插图
英特尔Xe-LP iGPU率先应用于第11代酷睿处理器“Tiger Lake” 。 Xe-LP iGPU的顶配版本具有96个执行单元(EU) , 运行速度可达1536 FP16 FLOPS/clock , 每周期Texel纹理、Pixel像素渲染能力也从32、16提升到48、24 。
内存子系统经改进 , 具有新的L1 Data Cache(数据高速缓存)、16 MB L3 Cache , 同时支持端到端压缩及新的Ringbus互连技术 , 与上一代产品相比 , 可将带宽提高2倍 。
20年后重返独显战场!深度分析英特尔Xe GPU战略文章插图
和上一代架构相比 , Xe-LP架构一大更新便是执行单元(EU) 。 全新EU集成了8-wide FP/INT ALU8和2-wide extended math ALU 。 8-wide FP/INT ALU8运算速度可达1 FP32/INT32 ops/clock、2 FP16/INT16 ops/clock和4 INT8 ops/clock , 以更好地处理AI工作负载产生的各类数据 。 同时 , 两个EU共享线程控制(Thread Control) , 从而节省空间 。
20年后重返独显战场!深度分析英特尔Xe GPU战略文章插图
如若所有FP/INT ALU均以1.35GHZ的频率工作 , Tiger Lake的高端Xe-LP iGPU可提供约2.1 TFLOPS的FP32图形处理性能 , 近乎是英特尔上一代Iris Plus G7显卡(1.12 TFLOPS)的两倍 。 此外 , 英特尔还提供了入门版本的Xe-LP iGPU , 入门版本的EU等单元数量较少 , 性能也相对弱一些 。
20年后重返独显战场!深度分析英特尔Xe GPU战略文章插图
Xe-LP GPU还配备了英特尔最新的显示引擎(Display Engine)和媒体引擎(Media Engine) 。 新款媒体引擎具有12-bit end-to-end video pipeline , 可播放BT.2020等格式的视频 , 同时能为最新编解码器(例如AV1)提供硬件加速解码功能 。
由于集成显卡主要用于办公和媒体浏览 , 媒体引擎对集显的重要性不言而喻 , 同时对各类流媒体应用也有不可或缺的作用 。
显示引擎支持四个video pipeline以及eDP、DisplayPort 1.2、HDMI 2.0、Thunderbolt 4/USB4 Type-C输出 , 足以满足当今的集成显卡和入门级独显的需求 。
20年后重返独显战场!深度分析英特尔Xe GPU战略文章插图
三、英特尔集显市占率达70% , Xe-LP市场潜力巨大英特尔将Xe-LP集成显卡和独立显卡的用户群体定位为游戏玩家和创作者 。
游戏方面 , 英特尔在提升硬件性能的同时 , 还努力优化驱动程序等软件表现 。
例如 , Xe-LP驱动程序支持硬件/软件调度代码签名(hardware/software scheduling codesign) , 为基于DirectX 11的游戏增加了灵活性 。 此外 , 这一系列还支持VRS可变帧率渲染 , 根据渲染场景的不同来选择降低或者提升渲染内容 , 以免在次要场景上浪费过多算力 。
同时 , 英特尔还增加了游戏锐化(GS)技术 , 该技术可在分辨率不变的情况下提高游戏图像的清晰度 , 从而节省带宽 , 不过有可能增加GPU的其他部分的负荷 , 用户可以选择自行启用/禁用GS技术 。
Jon Peddie Research的研究指出 , 全球近70%的PC搭载了英特尔的集成显卡 。 因此 , 英特尔一旦过渡到其新的Xe-LP架构 , “吃”内置显卡的游戏必须相应作出调整 。 此外 , 英特尔还可以定制驱动程序 , 保持产品竞争力 。
“ Xe-LP是英特尔显卡战略的第一步 , ”英特尔发言人布鲁斯·费恩伯格(Bruce Fienberg)说 , “它是英特尔系列产品的节能基础 , 同时让英特尔20年来首款独显成为现实 。 Xe-LP面向的集显市场相当庞大 , 每年都有成千上万的新用户 。 Xe-LP将会支持全球大多数人的视觉体验 。 ”


推荐阅读