Imagination|第一次!手机GPU实现了桌面级光追效果( 二 )


1级为现有硬件上的软件解决方案 。性能低,效率低 。
2级增加了用于光线追踪的第一部分硬件 。与1级相比,可以将基本光线追踪效果的效率提高44倍 。
3级增加了用以处理发射光线的硬件,与2级解决方案相比,可大大降低功耗 。
4级增加了相干性聚集功能,针对复杂的桌面级效果大大提升了性能,让其可以在移动端功耗预算下应用 。
5级是一项未来等级,可在场景中实现更大数目的动态目标,并带有额外的硬件加速 。
Imagination|第一次!手机GPU实现了桌面级光追效果
文章图片
Imagination新发布的CXT GPU IP是一个RTLS 4级的光追产品,目前业界的其它移动端解决方案为RTLS 1级 。Imagination能够实现RTLS 4级光追的核心是IMG CXT-48-1536 RT3 内核具有三个光线加速集群(RAC),可提供总体高达1.3 GRay/s的性能,即使在移动设备低功耗的情况下,也能以1080P分辨率实现30~60FPS的实时光线追踪渲染,满足日常游戏高端需求 。
Imagination|第一次!手机GPU实现了桌面级光追效果
文章图片
RAC包含了光线存储(Ray Store)、光线任务调度器(Ray Task Scheduler)和相干性聚集器(Coherency Gatherer),并与两个128宽的统一着色器集群(USC)紧密耦合,着色器集群有高速专用数据通路,可以实现高效且功耗最低的光线追踪部署 。
时昕解释,“很多光追算法用传统的方法实现效率很低,用过专门的硬件单元,比如RAC,效率成倍提升 。”
Imagination给出的数据显示,在光栅化图形处理性能方面,最新的CXT与Imagination的上一代GPU IP相比,计算、纹理和几何性能都提高了50% 。
Imagination|第一次!手机GPU实现了桌面级光追效果
文章图片
功耗方面,得益于低功耗超标量(superscalar)架构可在低时钟频率下提供高性能,从而实现更高的帧率功耗比(FPS/W)效率,Imagination图像压缩(IMGIC)技术也可以大幅降低带宽需求 。
高性能和低功耗看似对立,但实际并不矛盾 。
“以前在复杂场景的光照效果,包括反射、阴影、全局照明等,都要靠着色器一个个去模拟计算,我们的CXT把渲染的负载转移到更为专用的硬件上面,效率更高的同时实现更低功耗 。” Kristof Beets解释 。
当然,讨论光线追踪的性能和功耗不能抛开技术路线 。光线追踪有两种方式来实现,一种是用光线查询的方式,一种是用光线管线的方式,这两种方式都需要计算10亿条及更多数量的光线 。
光线管线的方式是计算光源发射出的光子,碰到场景当中物体的反射、折射等反应,最终达摄像机位或者游戏玩家的眼睛 。光线查询方式就是反过来,从摄像机位或游戏玩家的角度,计算出光源 。
“光线查询浪费的计算比较少,所以有功耗优势,但是技术难度也更大一些 。目前很多宣称有光线追踪技术大部分是用光线管线实现,Imaginatiom同时支持光线管线和光线查询两种方式,客户和合作伙伴可以自由选择 。”时昕表示 。
光追普及的关键是生态
Kristof Beets说,“基于我们十多年在光线追踪方面的投入和积累,我们可以推出RTLS 5级的产品 。之所以现阶段推出RTLS 4级产品,主要是出于市场考量 。我们跟市面上的光线追踪开发者沟通后发现,如果我们成为市场上唯一提供RTLS 5级光线追踪硬件的公司,不会有多少开发者来开发相应的应用 。”
先推出RTLS 4级光追产品培育市场,比如说游戏的3D引擎、游戏开发者,再慢慢把光线追踪市场做大 。Imagination推出GPU IP的同时也推出了软件开发套件PVRTune工具,可以支持开发者查看底层的光线追踪计数器,例如:每秒的光线数、包围盒测试器负载、缓存命中率、每秒遍历(递归)的光线数等,还可以模拟CXT的功能和行为,降低使用者门槛 。
这也容易理解,Imagination在2014年就测试了其光线追踪的技术和硬件,但并没有推出产品的原因也是生态原因 。处理器的成功离不开整个生态,包括接口、工具等 。Imagination作为IP提供商,并不直接出售芯片及解决方案,想要直接推动光线追踪的发展难度很大,只能等有一定的生态基础后,再推出相关产品 。
“在标准化方面,我们大量参与了与微软的沟通和讨论,在此基础上,再继续提升GPU架构 。”Kristof Beets说 。
未来几年,移动市场上的光线追踪产品仍然会在软件层面,直到硬件方案进入市场并呈现出巨大的优势 。


推荐阅读