芯片|为什么AI芯片“凉了又热”?( 二 )


为此,嘉楠推出了勘智K510边缘推理芯片,CPU依旧采用RISC-V(双核64位),全新的KPU将AI性能提升至3TOPS,支持TensorFlow、PyTorch和ONNX 模型导入,配合KPU为AI加速还增加了DSP 。
芯片|为什么AI芯片“凉了又热”?
文章图片
另外,勘智K510支持三路传感器输入1080P视频,拥有众多高速和低速接口,其中高速接口DDR PHY和MIPI RX/TX DPHY均是嘉楠完全自主知识产权的IP 。
从推出的时间看,勘智K510比嘉楠的产品路线图晚了半年多时间 。据雷锋网了解,其中的原因包括这是嘉楠第一个比较大规模的AI芯片,几乎重新设计了AI加速单元KPU,高速接口也是完全自研,再加上产能紧缺等多重因素,导致勘智K510推出的时间比预期晚一些 。
“产品更早推出肯定会更好一些,但稍微晚一点也有好处 。我们推出第一款AI芯片的时候,绝大部分中小客户只能用原厂的芯片做一些嵌入式的开发 。今年有能力开发AI芯片的客户多了很多,许多客户还有自己的AI算法 。市场在成熟,应用场景也在不断增加,这对我们产品的推广是好事 。”张楠赓如此解释 。
与传统的功能芯片不同,AI芯片的开发者并不知道自己明确的需求,这对要预测未来三到五年市场需求的AI芯片公司来说,定义产品难度更大 。但比较明确的是,随着AI应用复杂程度的增加,对AI的算力需求也随之增加,提升AI性能成为关键 。
“勘智K510的KPU相比上一代基本是重新设计 。原来的KPU比较简单,如果用第一代架构进行等比放大提升性能会有很多问题 。新设计的第二代架构更加通用,可伸缩性更好,很容易实现零点几TOPS到几TOPS的算力,同时兼容性也更好 。”张楠赓表示 。
芯片|为什么AI芯片“凉了又热”?
文章图片
提升AI性能的同时,勘智K510的视觉性能也有了显著提高,集成了最新一代图像处理单元和3D ISP模块,支持深度摄像头TOF传感器,可以在无需软件参与的情况下自动解析和提取深度图像,加速3D图像处理 。
张楠赓指出,勘智K510是一款中高端算力芯片,视觉硬件配置也是这款芯片的重头戏,同时支持最多3个摄像头的输入,其中一路支持3D功能,也是迎合市场需求,能够满足比如活体检测等需求 。勘智K510也能够应用于高清航拍器、视频会议、机器人、STEAM教育、工业相机和辅助驾驶等场景 。
雷锋网注意到,勘智K510在降低功耗方面从多角度入手,比如通过NoC总线架构解决庞大时钟树带来的芯片大功耗和大面积问题;KPU根据不同层级的带宽、计算和存储需求的调整,提高数据的复用率降低芯片功耗;还通过支持语音VAD功能,满足低功耗设计需求等 。
不过,能够将嘉楠的AI芯片推向更广阔市场的关键是RISC-V 。
冲向万亿美元的AIoT市场
“易用性非常重要,开发者如果使用CPU或者DSP就能实现功能,能够降低开发成本和加速产品上市时间 。”张楠赓说,“这也是我们在双核64位RISC-V CPU基础上增加DSP的重要原因 。”
芯片|为什么AI芯片“凉了又热”?
文章图片
更强的CPU性能对于一款SoC的重要性也越来越高 。“有一个很有意思的现象,5年前,业界很多人认为SoC中的CPU的作用会被弱化,大部分的任务都会用硬件加速器处理,包括AI应用 。但这两年,无论是手机还是PC,CPU的竞争越来越激烈,绝大部分的任务还是在CPU上完成,CPU又变得很重要,所以对CPU的性能需求也大幅度增加 。”张楠赓表示 。
“我认为,未来几年桌面级和移动端先进的技术和架构会迅速下放到原来的MCU中,这个变化可能要到将来3-5年才能看到 。”他作出预测 。
CPU在SoC中的重要性又变得重要,意味着CPU的性能和易用性成为竞争的关键 。在AIoT市场,虽然统治移动市场的Arm占据优势地位,但最近两年RISC-V指令集芯片在这一市场进展迅猛,在对软件支持要求不高的应用中,RISC-V已经被大量应用,但需要更高性能和更多软件支持的应用就面临挑战 。
实际上,勘智K510的CPU是嘉楠自研 。“第一代产品我们用的是RISC-V开源内核,明显的优势是不需要买版权节省成本,但漏洞也比较多 。新一代的勘智AI芯片之所以选择自研,主要还是因为我们的需求超过了开源内核的需求 。”张楠赓解释为何开始自研RISC-V CPU 。


推荐阅读