怎样评价AMD基于Vega 10核心的MI25加速卡?( 二 )


全新Vega架构可使后端渲染单元直接访问二级高速缓存,减少了清空缓存然后在需要的时候又从显存中读回的处理,同样有助于延后式渲染技术的性能提升。
下一代计算单元Vega架构引入了下一代计算引擎单元(NCU),可以支持每个周期 512 个 8 位计算,或者 256 个 16 位计算,又或者是 128 个 32 位计算。可以在单个FP32 ALU内处理一对FP16浮点操作,如果兼容性足够的话,可以打包在一起作为FP32进行处理。尽管AMD对Vega的时钟核心速度三缄其口,下一代NCU无疑为更高的GPU时钟速度和时钟周期内可处理的指令进行了优化。继续等待我们已然可以从各方面曝光的信息窥探到Vega的强悍性能,但纵然是Radeon的骨灰级粉丝也需要继续等待, AMD的Ryzen处理器已经蓄势待发,Vega也不会远了。
【锐VR原创文章,转载须注明来源及连接】

■网友
不了解AMD的构架设计,但是从纯应用角度,AMD构架效率应该比较低, 以矩阵乘这种计算密集度很高很适合向量运算的应用来看,大矩阵,NVIDIA的单GPU效率在80-90%峰值之间(考虑BOOST,NV给出的效率值是不考虑BOOST,实际考虑BOOST效率没那么高),神威那个256核能做到95+%, AMD的GPU通常只能做到50-60%。非常适合GPU的这种高并行度计算都是这个效率(当然这里也有AMD软件支持不力或者没钱做软件支持的原因),其他通用计算领域应该更要打折扣了吧。
■网友
【怎样评价AMD基于Vega 10核心的MI25加速卡?】 MI25肯定是用来做深度学习计算用的,准备搞两块来烧一下


推荐阅读