ARM|ARM连发四款Mali GPU：一律全新架构、性能飞跃最多6倍 GPU|Mali-G710|Mali-G610|

除了面向64位移动计算的Cortex-X2、Cortex-A710、Cortex-A510三款全新CPU IP，ARM今天还带来了多达四款新的移动GPU IP，同样启用新的命名规则，分别是Mali-G710、Mali-G610、Mali-G510、Mali-G310 。
G710、G510、G310分别定位旗舰、主流、入门级市场，依次取代现有的G78、G57、G310 。
G610其实和G710是一回事儿，只是核心数较少时单独使用的名字。

文章图片

文章图片
这是ARM Valhall GPU架构的第三代产品，也是第一次完整覆盖高中低端各个领域。
搭配同时发布的Cortex-X2/A710/A510 CPU、CoreLink CI-700一致性互连技术、CoreLink NI-700芯片网络一起，它们可以构成完整、强大的SoC解决方案。

文章图片

文章图片
虽然架构变化不大，只是继续优化提升，但是这一代Mali GPU的性能进步还是很可观的：
【ARM|ARM连发四款Mali GPU：一律全新架构、性能飞跃最多6倍】G710号称综合性能提升20％、机器学习性能提升35％、纹理性能提升50％、能效提升20％。
G510综合性能提升100％、机器学习性能提升100％、能效提升22％。
G310虽然定位最低但变化最大，号称纹理性能提升多达6倍、Vulkan性能提升4.5倍、安卓UI内容性能提升2倍。

文章图片

文章图片
G710的执行引擎设计和G77、G78十分相似，变化更多是一些细节。
wavefront/warp大小从8翻番到了16，而且每个执行引擎有两个数据路径，最终形成每个核心32个FMA 。
ISA指令集也有了不小的改进，可以更好地满足Vulkan等现代GPU的需求，但暂无细节。
G710还新增了一个执行引擎，每个着色器核心的计算性能因此翻番，同时每核心每时钟周期的不同吞吐量也有4倍、8倍的增加。
纹理单元也是全新的，每时钟周期可以处理最多80亿纹理，再加上面积优化，单位密度纹理性能提升了50％。
16宽度执行单元单实例变成了4宽度四实例，整体吞吐量不变，但是资源分配更合理，效率更高。
新的执行引擎每核心每时钟周期FMA翻了一番，同时功耗也优化降低了20％。
另外，传统的工作管理器(Job Manager)变成了新的“指令流前端”(Command Stream Frontend)，负责调度和处理draw-call，还第一次带来了固件层，与硬件紧密配合处理主机需求。
G710可以配置8-16个不同核心数，G610则是最多6个核心，另外二级缓存可以配置2个或4个区块，每个区块256KB或者512KB，也就是整体最小512KB，最多2MB 。

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片
G510支持2-6个核心配置，每核心每执行单元的配置也可以定制，纹理单元也大大加强。
执行引擎还是2个，但也可以配置为只用1个，每时钟周期64 FMA会因此减少到48 FMA 。

ARM|ARM连发四款Mali GPU：一律全新架构、性能飞跃最多6倍

推荐阅读

中国国情专访郑松刚丨数字化平台助力玛斯特实现更大价值

孙悟空为啥非要弄死白骨精？他到底看见了啥！

大卫聊科技中国移动已经开始行动，“套路”流量套餐不存在了，工信部出手

认购|德利股份中签号出炉共2万个

试航|中国速度惊人！第5艘055大驱开始试航，未来建造多少艘才够用？

「首日」南非实施全国范围“封城”首日

iphone12和xr大小，iphone12和xr尺寸对比？

的订单|印媒：疫情后的武汉经济复苏，各行步调不同

地理|地名何以成为“话题王”

虫牙怎么治如何预防虫牙

Elasticsearch 性能优化详解

青军志|大批穷人为减轻负担，开始''卖女儿''了，印度疫情失控

蓝多多美国也许并不是人们想象中的天堂

达州晚报：父母花光所有积蓄寻找无果！就在10多天前…，宣汉小伙失联11年

一兆等于多少亿? 1兆等于多少

科学深圳先进院在磁共振快速三维成像研究中获进展

【寄曲束竹令】女性不想变黄脸婆，推荐四种食物，补血养颜，排毒护肤，好处多多

AMD京东巅峰对决 7nm锐龙笔记本新品来袭

「市县」广东未来三天多云为主昼夜温差大明后天早晚有雾

爆发流天使拒绝刮痧 lol天使出装