怎样评价AMD基于Vega 10核心的MI25加速卡?( 二 )
全新Vega架构可使后端渲染单元直接访问二级高速缓存,减少了清空缓存然后在需要的时候又从显存中读回的处理,同样有助于延后式渲染技术的性能提升。
下一代计算单元Vega架构引入了下一代计算引擎单元(NCU),可以支持每个周期 512 个 8 位计算,或者 256 个 16 位计算,又或者是 128 个 32 位计算。可以在单个FP32 ALU内处理一对FP16浮点操作,如果兼容性足够的话,可以打包在一起作为FP32进行处理。尽管AMD对Vega的时钟核心速度三缄其口,下一代NCU无疑为更高的GPU时钟速度和时钟周期内可处理的指令进行了优化。继续等待我们已然可以从各方面曝光的信息窥探到Vega的强悍性能,但纵然是Radeon的骨灰级粉丝也需要继续等待, AMD的Ryzen处理器已经蓄势待发,Vega也不会远了。
【锐VR原创文章,转载须注明来源及连接】
■网友
不了解AMD的构架设计,但是从纯应用角度,AMD构架效率应该比较低, 以矩阵乘这种计算密集度很高很适合向量运算的应用来看,大矩阵,NVIDIA的单GPU效率在80-90%峰值之间(考虑BOOST,NV给出的效率值是不考虑BOOST,实际考虑BOOST效率没那么高),神威那个256核能做到95+%, AMD的GPU通常只能做到50-60%。非常适合GPU的这种高并行度计算都是这个效率(当然这里也有AMD软件支持不力或者没钱做软件支持的原因),其他通用计算领域应该更要打折扣了吧。
■网友
【怎样评价AMD基于Vega 10核心的MI25加速卡?】 MI25肯定是用来做深度学习计算用的,准备搞两块来烧一下
推荐阅读
- 聪明人养花,这3种“花”怎样也要养一盆,每年能省不少医药费
- 互联网怎样解决“家政服务上门速度慢”的问题
- 怎样看待从1月8号起,QQ钱包开始提现收费
- 银行it人怎样转型
- 汽车|冬天怎样让车内温度快速升高?座椅加热的最佳使用方式二,外循环的作用总结
- 怎样进入通信行业
- 怎样评价扶他柠檬茶的小说《云养汉》的结尾
- 怎样成为一名合格的Python程序员?
- 怎样评价华为、诺基亚、中兴中标中国移动高端路由交换设备扩容集采
- 怎样评价类似前橙会、百老汇、南极圈这样类型的离职帮抱团,对企业的积极意义和消极意义