测评盘点|RTX 3080首测:半价获得比上代旗舰强30%的性能( 八 )


下面简单换算一下:
GA100的晶体管密度在6537万/mm2左右 , GA102是4458万/mm2左右 , 而TU102则是2466万/mm2左右 。
三种工艺的晶体管密度差距比较大 , 不过三星8nm对比TSMC 12nm FFN也有非常大的提升 。
升级了工艺 , 肉眼可见的提升就是提频 , 不过因为GPU BOOST技术的存在 , 在加速的情况下两代的核心频率其实差不了太多 。
测评盘点|RTX 3080首测:半价获得比上代旗舰强30%的性能
文章图片

另外就是能效比方面 , 看上面的图 , 官方称在60fps时 , NVIDIA Ampere能达到Turing的1.9倍能效比 , 实现同样的性能 , 前者只需120W多点的功耗 , 后者则要240W的功耗 , 并且温度低了3°C , 噪音还能减少2dB 。
对比AMD的暴力激进工艺提升(GF 12nm直接升级至TSMC 7nm) , 英伟达这边显然放缓了一下脚步(只从TSMC 12nm FFN升级至三星8nm) , 虽然晶体管密度提升非常可观 , 但没有用上7nm还是让人觉得有些惋惜 , 当然这也可能与TSMC 7nm的产能有关 。
升级GDDR6X , 比肩HBM2显存带宽
测评盘点|RTX 3080首测:半价获得比上代旗舰强30%的性能
文章图片

GDDR6X显存也是RTX 30系新卡算力大幅提升的关键因素之一 , 在更高分辨率、更高光追特效这些高压应用场景下 , 显存的容量和带宽都很容易成为计算的瓶颈 , 所以NVIDIA也首发应用了美光GDDR6X显存 。 GDDR6X的升级重点是加入了PAM4 , 可以大致理解为每周期传输的数据量翻倍 。
测评盘点|RTX 3080首测:半价获得比上代旗舰强30%的性能
文章图片

GDDR6与GDDR6X眼图
官方提供的眼图中可以看到 , 因为拥有4种电平(以250mV为步进) , 对比于GDDR6只能发送两个二进制数据(上升沿和下降沿) , GDDR6X可以在每个时钟周期发送四位二进制数据 。
按照19.5Gbps的显存频率来计算 , GDDR6X能提供最高936GB/s的显存带宽 , 非常接近HBM2的1TB/s带宽 , 对比RTX 2080 Ti上的GDDR6带宽提高了52% 。
使用上GDDR6X , 显存带宽可以提升至HBM2的水平 , 但也不用花费HBM2那么多的成本和技术 , 对消费级显卡来说是一大利好 。
Tensor Core与RT Core齐升级 , 光追不再是鸡肋
光线追踪是RTX 20系主打的新技术 , 它开启了一个画质的新维度 , 能制造出传统的光栅化渲染无法比拟的光线效果 , 但很明显的缺点就是显卡的性能比较难应付当时的光追游戏 , 游戏表现的光追效果不太明显 。
测评盘点|RTX 3080首测:半价获得比上代旗舰强30%的性能
文章图片

影响实时光追性能的主要是RT Core , 第一代RT Core可提供34T的RT性能 , 而Tensor Core可提供DLSS处理能力 , 能提供89T的性能 , 还有一个是传统的SM单元 , 提供11T的FP32计算能力 。
测评盘点|RTX 3080首测:半价获得比上代旗舰强30%的性能
文章图片

在NVIDIA Ampere架构中 , 三种单元的性能都获得了大幅度提升 , 首先是之前介绍的SM单元 , FP32计算性能提升至30T , 幅度2.7倍;然后是RT Core的RT性能提升至58T , 幅度是1.7倍;最后是Tensor Core的Tensor性能提升至238T , 幅度2.67倍 。
测评盘点|RTX 3080首测:半价获得比上代旗舰强30%的性能
文章图片

而虽然RT Core能大幅提升实时光线渲染能力 , 但在RTX 20系上 , 只打开光线追踪的性能表现依然不理想 , 这时就要AI核心Tensor Core提供的DLSS来让运行效率再提升了 。
测评盘点|RTX 3080首测:半价获得比上代旗舰强30%的性能
文章图片

Tug架构的RTX 2080 Super
中 , 使用RT Core渲染一帧图像为19ms , 传统着色器为51ms , 渲染速度提升了2.68倍 。 而在打开DLSS后 , 渲染速度缩短至13ms 。
测评盘点|RTX 3080首测:半价获得比上代旗舰强30%的性能
文章图片

NVIDIA Ampere渲染时间
在NVIDIA Ampere上 , 同样是使用RT Core+Tensor Core , RTX 2080 Super需要13ms , 而RTX 3080可以缩小至7.5ms , 而通过新的并行处理技术 , SM、RT Core与Tensor Core可以同时工作 , 渲染时间更是能缩短至6.7ms , 对比RTX 2080 Super提升高达94% 。
而通过实测 , RTX 3080已经能在绝大部分游戏中 , 满足4K分辨率下光线追踪效果拉满并维持60fps以上帧数的条件 , 从“能玩”到“可以玩” , RTX 30系已经实现 。
PCIe 4.0、HDMI 2.1、RTX IO、Reflex……
PCIe 4.0首发于X570主板 , 并在去年AMD的RX 5000系显卡上适配 , 但即使是系列里最强的RX 5700 XT , 其性能也完全用不上PCIe 4.0 x16的带宽 。
这次的RTX 3080 , 虽然支持PCIe 4.0 , 但理论性能也不能跑满通道带宽 , 这里的PCIe 4.0其实是为以后的RTX IO做铺垫 。


推荐阅读