『中国电子报』华为芯片和硬件战略Fellow艾伟:把握ARM架构未来黄金十年


在3月27日举办的华为开发者大会上 , 华为芯片和硬件战略Fellow艾伟分析了新时期算力架构的发展趋势 。 他认为未来十年是属于ARM架构的黄金十年 , 而且会重写X86的辉煌 , 而华为现在能够提供基于全ARM的开发平台 , 希望工程师们在新的计算架构中建立自己的新技能 。

『中国电子报』华为芯片和硬件战略Fellow艾伟:把握ARM架构未来黄金十年
本文插图

ARM正在重演X86的辉煌历史
艾伟说 , 从2000年到2020年算力架构在发生变化 。
第一 , 2000年X86占据市场第一的份额 , 总算力输出达到了70% 。 到了2020年 , 算力架构发生了逆转 , 世界上最大算力架构变成了ARM平台 , 基于ARM指令的处理器总算力输出达到了全球82% 。
第二 , 上游产业产生端到端变化 。 一是半导体先进工艺的发展 , 已经不再由PC机牵引 , 而转向了ARM架构的智能手机 , ARM成为半导体产业的主要驱动力 。 二是基于ARM的产品形态更加丰富多彩 , 在这种情况下 , 软件工程师就拥有了一个更加开放、多样化的创新平台 , 现在ARM平台上的软件越来越多 。
艾伟表示 , 人们的质疑点是ARM现在还是下里巴人 , 性能比X86要低 。 但追溯历史 , 可以看到当年X86与UNIX相比 , 性能也要逊色 , 但自PC机从上世纪80年代开始兴起之后 , 1993年基于X86架构的PC机的总算力输出超过了基于UNIX的大型机和小型机 。 1998年英特尔推出的至强处理器达到服务器水平 , 量变转化成质变 , 到现在X86依然占据整个数据中心90%以上的市场份额 , 整个替换过程是颠覆性变化 。
如今 , 这个历史可能会再次被重复 。 而主角换成了ARM 。
2007年智能手机上市 , 很快到了2013年 , 智能手机的算力输出超过了X86 , 2019年 , 基于ARM架构的鲲鹏920处理能力达到了高端服务器的水平 。 从量变到质变的故事会再次发生 。
工程师要在新计算架构中建立技能
“对于每一位工程师来说 , 在这个时候需要把自己的技能转移到新的计算架构中去 。 ”艾伟这样建议 。
目前半导体的摩尔定律遇到了瓶颈 。 以前处理器主频升高会使性能越来越好 , 但当处理器性能达到一定水平时 , 再提高主频会碰到巨大的功耗约束 。 如何突破这个瓶颈 , 继续提高CPU的算力呢?
艾伟说 , 我们已经看到了一条路径——多核并行 。 这个路径在ARM架构上走得比较快 。 从手机看 , 很早就实现了四核到八核的处理器;从服务器来看 , 华为推出第一代鲲鹏910时 , 推出了32核的处理器 , 去年发布的鲲鹏920 , 再次把处理器CPU核数提高到64核 , 其中CPU的核心架构也是华为自研的 。
“这种情况带来整个产业趋势的变化 , 我们看到现在不只是华为 , 已经上市的多个ARM处理器都在增加更多的核数 。 ”艾伟说 。 其中也包括英特尔、AMD 。 利用多核处理器提升算力 , 软件工程师也因此面临新挑战 。
除了处理器的多核趋势 , 新的计算架构里 , 还需要一个高速低时延的总线 , 能够实现更加快捷的访问数据、访问外设、访问网络 。 所以最底层的物理技术也要提升 。 艾伟说 , 鲲鹏920支持8通道内存访问 , 整个性能提升了64% , 可以用更多的数据及时喂养给CPU做计算 。 华为提供了PCIe4.0总线性能 , 支持64G总线性能 , 可以用更多的方式连接外设和网络 。
“当我们把先进半导体工艺、多核架构、高速内存访问、高速总线连接在一起 , 我们为整个软件产业提供了更加开放而且持续实现性能提升的平台 。 ”艾伟说 , “这个平台意味着我们仍然可以获得更加廉价充沛的算力支持 。 ”
半个世纪以前的大型机和小型机时代 , 用户少、应用数目少;PC机时代 , 每年可以达到上亿新增用户 , 应用数目达到十万级别;智能手机时代和云手机时代 , 用户数增长达到了十亿级别 , 软件达到了百万级别 。 艾伟说 , 所有这些上层应用的繁荣、软件的繁荣 , 都是从底层开始改变 , 让单位成本所购买的算力 , 提升了十亿倍 , 这是一个非常惊人的数据 , 而且今后华为还会持续提升性价比 , 提供更加充沛的算力 。


推荐阅读