谷歌|为AI而生的IPU芯片,或挑战GPU的霸主位?( 三 )
文章图片
文章图片
由4个IPU芯片构成的IPU-M2000系统 , 可以提供大约1 PetaFLOPs的算力 。基于IPU的多层级存储结构 , 与IPU Exchange Memory等技术优化 , 整体与GPU的HBM2存储比较 , 可以提供超过100倍的带宽以及大约10倍的容量 , 可以适用于更复杂的AI模型和程序 。
文章图片
文章图片
计算加上数据的突破可以让IPU在原生稀疏计算中展现出领先GPU 10-50倍的性能优势 , 在通信上 , Graphcore专为为AI横向扩展设计了IPU-Fabric , 解决数据中心大规模计算横向扩展的关键问题 。Graphcore将计算、数据、通信三者的突破技术结合 , 构建了大规模可扩展的IPU-POD系统 , 最终可以提供一个AI计算和逻辑进行解耦、系统易于部署、超低网络延时、高可靠的AI超算集群 。
可以预计 , 未来IPU在各类AI应用中将具有更大的优势 , 而这也必然会引起英伟达的注意 。那么 , 相较于英伟达GPU所占据的AI行业生态位的霸主地位 , IPU会有哪些前景 , 也会遭遇哪些困境呢?
走向通用AI计算的“另辟蹊径”
如果回顾下AI芯片的发展经历 , 我们看到在经过这几年专用AI芯片的井喷之后 , 也开始面临一个尴尬困境 , 那就是ASIC芯片的灵活性或者说可编程性很差 , 对应的专用AI芯片只能应对一种算法应用 , 而算法本身则在3-6个月的时间就有可能变化一次 , 或许出现很多AI芯片还未上市 , 算法就已经发生进化的问题 , 一些AI芯片注定无法生产 。当然 , 专用AI芯片的优势也很明显 , 在性能、功耗和效率上远胜更加通用的GPU , 对于一些非常具体的AI应用场景 , 这些专用芯片就具有了巨大的收益 。
从专注图像渲染崛起的英伟达的GPU , 走的也是相当于ASIC的技术路线 , 但随着游戏、视频渲染以及AI加速需要的出现 , 英伟达的GPU也在向着GPGPU(General Purpose GPU)的方向演进 。为保持其在GPU领域的寡头地位 , 使得英伟达必须一直保持先进的制程工艺 , 保持其通用性 , 但是要牺牲一定的效能优势 。
这给后来者一定的启发 , 那就是AI芯片既要具备一定的灵活的可编程性(通用性) , 又要具备专用的高效性能优势 。这为IPU找到了一个新的细分市场 , 也就是介入GPU不能很好发挥效能的神经网络模型 , 比如强化学习等类型 , 同时又避免的专用AI芯片的不可扩展性 , 能够部署在更大规模的云计算中心或超算中心 , 对新算法模型保持足够的弹性计算空间 。
目前来看 , IPU正在成为仅次于GPU和谷歌TPU的第三大部署平台 , 基于IPU的应用已经覆盖包括自然语言处理、图像/视频处理、时序分析、推荐/排名及概率模型等机器学习的各个应用场景 。
典型的如通过IPU可以训练胸片 , 帮助医学人员快速进行新冠肺炎的诊断;如在金融领域 , 对涉及算法交易、投资管理、风险管理及诈骗识别的场景进行更快的分析和判断;此外在生命科学领域、通信网络等方面 , 都可以同IPU实现高于GPU性能的AI加速 。
文章图片
文章图片
(NLP模型参数的指数增长)
当然 , IPU想要在AI计算中拥有挑战GPU地位的资格 , 除了在性能和价格上面证明自己的优势之外 , 还需要在为机器学习框架提供的软件栈上提供更多选择 , 获得主流AI算法厂商的支持 , 在标准生态、操作系统上也需要有广泛的支持 , 对于开发者有更方便的开发工具和社区内容的支持 , 才能从实际应用中壮大IPU的开发生态 。
推荐阅读
- 科学|陈根:交织着“记”与“忘”的记忆,是如何发生的?
- 恒星|哈勃望远镜拍摄NGC 1365星系恒星诞生的壮丽景象
- YouTube|谷歌极力推动YouTube用户变现:在视频中加入商品链接 从交易中抽成30%
- |谷歌、苹果教你如何优雅地干掉竞争对手
- 谷歌|摄像头模块化!vivo分离式镜头斩获红点设计概念大奖
- 青年|余生的路, 我愿意与你一起走下去
- 谷歌,Android系统|谷歌助手现在可以为Android应用的操作创建自定义的快捷方式
- 谷歌|谷歌助手现在可以为Android应用的操作创建自定义的快捷方式
- 情感|古天乐接济78岁老戏骨,善良,将成为你人生的助力
- 谷歌|vivo WATCH评测:颜值拉满,玩法也足够多样