光子算数白冰:详解光子AI芯片落地进展与研发路径|GTIC2020


光子算数白冰:详解光子AI芯片落地进展与研发路径|GTIC2020文章插图
芯东西(公众号:aichip001)
编辑 | 心缘
GTIC2020全球AI芯片创新峰会刚刚在北京圆满收官!在这场全天座无虚席、全网直播观看人数逾150万次的高规格AI芯片产业峰会上 , 19位产学界重磅嘉宾从不同维度分享了对中国AI芯片自主创新和应用落地的观察与预判 。
在峰会下午场 , 光子算数创始人兼CEO白冰以《AI芯片的另一条路:光子芯片》为主题发表演讲 。
光子算数白冰:详解光子AI芯片落地进展与研发路径|GTIC2020文章插图
光子算数创始人兼CEO白冰
光子算数是国内少有的光子AI芯片赛道玩家 。 在演讲中 , 光子算数CEO白冰主要探讨了光学芯片的工程化进展、市场定位及目标客户、具体研发实施路径及相关适配算法等话题 。
白冰提到 , 当前光学AI芯片仍处于较早期阶段 , 光子算数已做出测试级产品 , 于今年交予部分服务器厂商客户进行测试 。
以下为白冰演讲实录整理:
一、光学芯片工程化进展 , 已至测试阶段与常规数字芯片不同 , 白冰所创立的光子算数 , 采取了另外一条技术路线——光子芯片 。
白冰说 , 用光学做计算处于比较早期的阶段 。 目前光子算数团队已将其做成测试级的产品 , 并于今年放至服务器厂商客户处进行测试 。
作为一家初创公司 , 光子算数和大学、研究所等几家单位共同工作 。 其早期样片集成了几百个不同的光学单元 , 比如有电光转换 , 把电信号加载到光载波 , 然后通过传播到片内的光学组合 , 完成一些特定的函数变换 。 跟传统的计算特征不同 , 它不是面向加减乘除 , 而是直接完成一个复杂的变化过程 。
这被称为可编程光子阵列芯片FPPGA(Field Programmable Photonic Gate Arrays) , 其中的光学单元可以通过电控 , 控制重新的连接组合方式 , 实现不同的复杂函数 。 也就是说 , FPPGA具有可重构的特性 。
光子算数白冰:详解光子AI芯片落地进展与研发路径|GTIC2020文章插图
光学芯片加速的不是完整算法 , 和所有的数字芯片一样 , 光学芯片面向复杂函数做加速计算 , 其计算对象是特定算子 。 光的劣势在于不是特别灵活 , 但是在某些函数上有优势 。
整个系统是光电混合的 , 数据在光电两部分中完成一个流动 , 执行一个完整的计算过程 , 由光学、电学芯片组构成光电混合AI计算硬件系统 。
光电混合系统仍要做到软硬协同 , 开发适合光学加速的算法 , 使得光电混合系统的硬件物理架构与算法的运算/访存特征相匹配 。
光子算数白冰:详解光子AI芯片落地进展与研发路径|GTIC2020文章插图
从技术架构图可以看到 , 左边是电学部分 , 包含逻辑控制、缓存等 , 以及专用的定制化IP 。 考虑到与光学芯片匹配 , 这些IP与传统的数字IP不一样 , 需要定制化开发;右边是光学模组 , 除了光学计算芯片外 , 还有一颗DFB激光器芯片 , 还有驱动、TIA以及小型的控制、电源芯片等组件 。
中间采用热插拔的方式 , 跟通信模块一样 。 之所以选择这一方式 , 是因为光子算数团队考虑到光芯片、电芯片放到一起 , 可能卖不出去 , 因为很难拼得过GPU , 考虑到其产品定位 , 因此做成插拔型 。
光子算数与高校一起打造了面向服务器的光电混合AI加速计算卡 , 目前已完成一些定制化加速任务 , 包括机器学习推理、时间序列分析等特定任务 。 白冰说 , 计算卡现在的性能可用 , 不过还比较初步 , 能做到36路1080P视频同步处理 , 功耗不到70W , 算力资源相对有限 , 混合精度下峰值算力接近20TOPS , 光部分为低精度 , 电部分为高精度 。


推荐阅读