AI驱动计算架构向ASIC演进 嘉楠科技发布二代AI芯片勘智K510
发表于 2021-07-12 15:19:28

自2016年起,AI算法的突破深刻影响了计算架构的演进。面对计算密集型场景,通用处理器的计算效率已无法跟上算法迭代速度,取而代之的则是异构计算体系。尤其在推理场景中,ASIC凭借最高的计算效率拔得头筹,正成为边缘AI场景中计算架构的领头羊。

作为一家ASIC芯片设计公司,嘉楠科技已从事5年边缘AI芯片研发。本届世界人工智能大会,嘉楠科技首次发布勘智AI系列的新款芯片勘智K510,其中加入了自主研发的神经网络引擎GNNE,提升3倍算力,目标场景为智能家居、车载后装、智慧零售和智能社区等。

AI驱动的算力演进:从通用到专用

过去5年中,算力演进的主要方向集中于服务器端,结合传统处理器与图形计算引擎,英伟达率先发现了大规模并行计算的方法,使算法训练的效率获得数量级提升。

AI算法训练需要进行大量矩阵乘加运算。面对这一应用场景,传统的处理器CPU处理能力显得捉襟见肘,其原因在于CPU的设计针对串行程序进行了大量优化,用来处理预测分支、乱序执行和多级流水等复杂的控制逻辑。因此CPU中很大一部分硅面积为存储和控制单元,负责逻辑运算的ALU只占据很少一部分。

与之相反,GPU核心中大部分是逻辑运算单元,拥有大量并行处理数据的能力。如果在TensorFlow中分别用CPU和GPU进行矩阵乘运算,GPU的效率可以达到CPU的千倍以上,这也由此拉开了AI领域异构计算的序幕。

异构计算的另一个分支是FPGA。对终端和软件应用公司而言,GPU的架构是固定的,其支持的硬件原生指令也是固定的,无法根据实际的场景进行调整。FPGA的可编程性能对此做了很好的弥补,多数公司都用它来做前期算法的验证。

从GPU和FPGA这两个例子可以看出,AI算法模型一直在驱动计算架构的演进。GPU弥补了传统处理器的算力短板,而根据不同算法调整硬件资源又催生了FPGA。从长期而言,随着AI算法趋于成熟,计算架构将从FPGA过渡到ASIC,即专用计算。谷歌的TPU已经证明了ASIC架构的巨大潜力。在使用TPU之前,AlphaGo曾内置1202个CPU和176个GPU,而2015年AlphaGo部署的TPU仅有48个。

算力的部署:从云端走向边缘

ASIC芯片计算效率最高,适合于推理计算场景。区别于算法训练,推理计算是根据成熟的模型对输入数据给出精准的预测结果。而随着算法模型逐渐趋同,彼此的差异局限于参数优化,推理计算在AI场景中的地位正越来越高。与此同时,算力的部署逐渐从云端向边缘迁移,边缘智能迎来新的发展机遇。

AI的典型应用场景主要为训练和推理。由于对数据的高吞吐,算法训练通常部署在云端服务器进行,需要调用大量计算资源来实现参数的优化。边缘计算场景由于更加靠近应用现场,没有数据中心的算力条件,对时延和设备的功耗都要求严苛。

在云边协同的框架下,设备对原始数据的预处理,不仅能有效降低数据中心的载荷,以及数据传输的带宽成本,也有利于客户业务数据的脱敏。可以说,边缘计算是一种更加敏捷和经济的计算方式。

随着物联网在终端市场展开,第二轮数据爆发周期已经开始。据IoT Analytic调研,2020年全球AIoT设备连接数已经超过非AIoT设备连接数,云边协同处理数据成为必然。另一方面,剪枝、知识蒸馏等算法的出现,也在技术上为算法模型在设备端的部署提供可能。

物联网市场尚处发展早期,虽然谷歌、英伟达等AI巨头将其版图延伸至边缘计算领域,打造覆盖云边端的全栈布局,但尚未形成诸如云端训练市场的垄断态势。在多元化的物联网市场,国内已涌现出一批以嘉楠科技为代表的边缘AI芯片厂商。

嘉楠科技:专注边缘AI芯片自主研发

嘉楠科技在过去8年中积累了大量ASIC芯片设计经验和知识产权,涵盖算法开发和优化,标准单元设计和优化,低电压和高能效操作,高性能设计系统和散热等芯片设计底层共性技术领域。

图片1.png

2016年,嘉楠科技正式成立AI芯片部门,启动边缘芯片研发项目——勘智AI。研发团队在ISA选型、功耗和功能设计上都全面瞄准边缘AI,并在一开始就确立了依托开源架构研发自主IP核的技术路线。历经两年打磨,嘉楠科技研发业内首款RISC-V架构商用边缘AI芯片勘智K210,广泛应用于智能抄表、智能门禁、AI STEAM等场景。

本次发布的K510则是勘智AI系列的新款AI芯片,其最大特点就在于团队自主设计研发的IP核KPU2.0。结合动态3D PE阵列和GLB设计,KPU2.0独创的计算数据流技术提升3倍算力。同时,芯片在硬件配置上大幅优化视觉子系统能力,经典算法mobilenetv1运行帧率提升12倍,多款视觉算法帧率业内领先。

针对芯片的算力和功耗设计,K510的目标场景主要包括智能家居和高清航拍、视频会议、机器人等领域。

嘉楠科技拥有完整的封装、散热和量产工艺团队和丰富的大规模量产经验。截至2020年12月31日,嘉楠科技共完成了14次ASIC的流片,成功率均为 100%。同时,嘉楠科技与业内多家巨头晶圆厂均有合作关系,确保了稳定的产能保障。

【免责声明:CSDN本栏目发布信息,目的在于传播更多信息,丰富网络文化,稿件仅代表作者个人观点,与CSDN无关。其原创性以及中文陈述文字和文字内容未经本网证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。凡注明为其他媒体来源的信息,均为转载自其他媒体,转载并不代表本网赞同其观点,也不代表本网对其真实性负责。您若对该稿件由任何怀疑或质疑,请即与CSDN联系,我们将迅速给您回应并做处理。】

CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
微博关注
【免责声明:CSDN本栏目发布信息,目的在于传播更多信息,丰富网络文化,稿件仅代表作者个人观点,与CSDN无关。其原创性以及文中陈述文字和文字内容未经本网证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。您若对该稿件有任何怀疑或质疑,请立即与CSDN联系,我们将迅速给您回应并做处理。】