赛灵思姚颂:数字AI芯片进步趋缓,颠覆式创新难 | GTIC2020( 三 )


对于终端市场来说 , 一定是高集成度的方式比分立器件的方式占优势 , 所以对于终端市场一定要考虑全面 , 而不能仅仅考虑AI这一个IP 。
第三 , 软件生态才是AI芯片的核心壁垒 。
英伟达创始人兼CEO黄仁勋最近开发布会时说 , 英伟达已经有180万的开发者、30万个开源项目 , 99.99%的初学者在学AI时一定会买一块GPU , 下载一些Github上的开源项目做试验 。 这是英伟达最终的一个护城河 , 它会有源源不断的开发者加入 , 开发者又会为生态贡献新的项目 , 如果开发者没有达到一定数量 , 则很难突破AI芯片的生态壁垒 。
姚颂说 , 这与滴滴、淘宝以及其他互联网平台是一个逻辑 , 一边是商家一边是用户 , 一边是开发者一边是使用者 , 这是一个闭环软件生态的逻辑 , 是最核心的壁垒 。
在单纯的数字芯片领域、单纯的学术研究做微架构迭代的领域 , 数字集成电路领域从2016年开始至今没有见到特别大的创新 。
赛灵思姚颂:数字AI芯片进步趋缓,颠覆式创新难 | GTIC2020文章插图
2016年至2019年AI芯片能效指标变化
上图中显示的是从2016年至2019年的AI芯片能效指标变化 , “方形”是实际量产的产品 。 这个图越往上代表性能越好 , 越往右是功耗越高 , 因此在这张图中 , 越偏向左上角意味着性能越好 。
而实际上大量的“方形”都落在了图的右上角 , 处于1~10TOPs/W的两条线之间 , 现在性能比较好的产品基本上在1~2TOPs/W的区间内 , 这几年在量产级别上没有见到特别大的变化 。 行业内有很多工程在往产品方向走 , 但是通用的微架构迭代的进步已经趋缓 。
此外 , 姚颂一直在关注的一个重点在于 , 芯片越来越贵 , 导致了一个较大的问题:业内原来很期待在行业中出现一个“破坏性创新”的事 , 也就意味着想要用很低廉、便捷的方式实现原来高端产品的能力 。 比如业内希望AI芯片以低价、便捷的方式实现GPU的功能 , 而现在看起来 , 实现这一愿景很困难 。
在如今所处的时间点 , 摩尔定律还没有死掉但是越来越贵 。 一颗7nm芯片的流片需要3000万美元左右 , 再加上IP、人力的成本 , 甚至需要大几千万甚至是上亿美元 , 需要卖出很大的量才能收回成本 。 对于初创公司来说 , 这是一个难点 。
赛灵思姚颂:数字AI芯片进步趋缓,颠覆式创新难 | GTIC2020文章插图
数字AI芯片可能不存在颠覆式创新的大机会
有些芯片公司 , 比如壁仞科技 , 融了很多资金 , 能够做两颗、三颗甚至更多芯片;而有的公司如果没有资金 , 则无法参与到行业正面战场的竞争中来 。
这个市场已经发生变化 , 随着摩尔定律的变化 , 在正面战场上 , 我们得想一些其他的办法 , 可能不能单纯依靠架构的优势取得几倍的性能提升 , 业界也需要找到一些新的底层技术迭代 。
比如做存内计算的知存科技就属于这一类 , 它将计算和存储放在一起 , 将计算放在Flash中 , 就可以减少存储的搬运 , 突破卡在存储的瓶颈;再比如法国有一家叫UpMem的企业把计算放到DRAM中 , 还有比如普林斯顿大学教授的小组把计算放到SRAM中 。
另一种技术路线 , 光计算 , 也是业内非常看好的方向 。 用两束光的光强表示两个数值 , 通过一个干涉仪发生干涉行为 , 它出射的强度就是两个光强相乘 , 再乘以他们相位差的cos(余弦) , 这样就相当于用光的干涉直接完成了乘法 , 这种操作速度很快、功耗也很低 , 但也有很大的问题 。
因为所有的物理器件都不是理想的器件 , 光每经过一个干涉仪可能要损耗千分之一的强度 , 如果想要做一个64X64的阵列或是128X128的阵列 , 每做一个计算的过程中 , 每束光要通过几百个干涉器 , 数值就变了 。
目前国际最好的水平也只能在64X64阵列上保证8bit信息量是不变的 , 因此这种方式无法在高精度、大阵列的要求下施行 , 也从而没办法实现特别大的性能 , 因此这也是一种还在开发中的路线 。


推荐阅读