草帽王子 发表于 2021-7-11 15:12:34

低调的国产RISC-V芯片玩家

本帖最后由 草帽王子 于 2021-7-11 15:12 编辑

凭借其开源、灵活、可定制和简约的特性,RISC-V自面世以来,就受到了行业先进的关注。进入最近几年,因为性能、参与者以及相关产品和工具的成熟,RISC-V进入了全面爆发前夕。据分析机构Semico Research预测,预计到2025年,市场将总共消费624亿个RISC-V 内核,这个新兴的技术将会在包括计算机,消费者,通讯,运输和工业市场在内的多个细分市场获得广泛认可。


在这个巨大市场潜力的推动下,IP厂商、工具厂商、芯片厂商和系统厂商都争先恐后地涌入这个赛道,其中不乏一些拥有深厚行业积累的厂商。如以ASIC芯片起家的嘉楠科技(以下简称“嘉楠”),就是当中一个重要的低调参与者。


一、从ASIC到RISC-V

众所周知,纳斯达克上市的嘉楠科技在ASIC芯片设计方面有深厚的积累,公司在芯片的前后端设计以及流片方面也有丰富的量产经验。早在2016年,嘉楠就成为了国内前十实现10nm芯片量产的公司。也就是从这一年开始,嘉楠开始了在边缘端AI芯片的探索。

据嘉楠科技董事长兼CEO张楠赓先生介绍,因为ASIC芯片对于计算效率的要求趋近极致,这就需要嘉楠一直在ASIC芯片设计中寻求算力与功耗之间的最佳平衡。因为这个研发过程对技术要求比较高,这无疑间就磨炼了公司的研发团队。与此同时,公司还发现,ASIC在计算效率上相比传统架构有了数量级的提升,这就为嘉楠后续进军RISC-V市场埋下了伏笔。同属计算密集型应用场景的边缘AI芯片就成为了嘉楠的目标。

经历了一番综合考量,嘉楠把目光投向了基于RISC-V的边缘端AI芯片。

嘉楠科技董事长兼CEO张楠赓先生
如前文所述,RISC-V架构的一个备受关注特点就在于可定制性,而这些定制就需要开发者对ASIC有深刻的了解,这正是嘉楠所具备的。张楠赓进一步指出,RISC-V拥有几个其他ISA所不具备的优势:

首先,从成本角度看,RISC-V开源免费的特性对于芯片创业公司而言非常友好。选择这一架构,意味着嘉楠可以在AI芯片研发过程中节省大量的IP授权成本,将资源投入到最核心的技术研发,帮助公司加快芯片的迭代速度,灵活应对市场环境的变化。

其次,从技术趋势角度看,RISC-V架构开源、精简和模块化的理念符合未来的技术发展趋势。计算体系结构宗师David Patterson(RISC-V的创始人之一)在ACM通讯上发表的论文中就指出了计算机体系结构的两个机遇,其中一个就是开源的指令集ISA,创建一个“面向处理器的Linux”。从目前来看,RISC-V无疑是开源指令集架构中最成功的一个。

第三,从开发角度看,RISC-V不需要像Arm一样考虑向后兼容,没有历史包袱,基础指令只有几十条,学习门槛相对较低;另一方面,RISC-V支持开发者按需拓展指令,这为芯片研发提供了更高的自由度。

第四,从性能角度看,RISC-V架构内核的性能可与ARM内核性能抗衡。

第五,从IP开发角度看,嘉楠从一开始就坚持IP核心自主研发的技术路线,RISC-V架构则提供了这一可能。嘉楠还能以SoC的形式将RISC-V CPU与自主研发的加速器组合在一起,为客户提供边缘侧的芯片解决方案。在这一过程中,公司可以把更多精力放在IP核的迭代,而不用考虑可能面临的授权风险。

从市场发展现状看来,嘉楠打造端侧RISC-V AI芯片的做法也是一个明智的决定。

熟悉行业的读者应该知道,根据应用场景的不同,AI芯片的可以粗略划分为模型训练和推理计算。其中模型训练市场已出现巨头垄断的态势,GPU巨头英伟达不仅在硬件方面建立起技术领先优势,而且结合图形计算平台构建了强大的软件生态壁垒,那就意味着这个市场给新晋者的机会并不多。反观推理芯片组市场,则还处于发展早期,特别是边缘侧市场,不同场景对芯片的要求存在差异化,给AI芯片公司留下了更多空间,因此嘉楠一开始就专注于边缘推理芯片的研发。

同时,在边缘侧市场,可穿戴设备、摄像头和传感器等联网设备越来越多。不同物联设备对功耗和算力的要求不同,这就决定很难用单一架构适配所有场景。架构的竞争归根结底是生态之间的竞争。虽然ARM仍然是移动端市场的主流,但RISC-V开源和模块化的特点允许像嘉楠这样的芯片公司基于RISC-V进行定制化的设计,拥有更大的自由度。

此外,从目前的市场环境看,Arm正成为巨头公司争相收购的目标,这对于IP授权的独立性造成了很大威胁。而如果很多组织使用RISC-V设计处理器,就可以在更大层面上推动芯片的创新。所以长期来看,RISC-V的价值在未来会更加凸显,从而为嘉楠带来更多的市场机遇。

奔跑在这条全新的赛道上,自主研发的IP成为了嘉楠最重要的底气之一。


二、从K210到K510

在拍板进军RISC-V之后,嘉楠就一直坚持依托RISC-V架构,自主研发IP核心的技术路线。

张楠赓表示,公司这样做有三方面板的优势:一方面是为了把核心技术握在自己手里,避免可能面临的授权风险;另一方面,自主开发核心从长期来看可以降低研发成本,并加快芯片的迭代速度;第三,自研可以形成嘉楠自身的芯片设计方法体系,确保核心技术和研发理念的传承。

本着这样的研发思路,嘉楠迄今已经推出了两代自主研发的IP核心,分别为KPU(Knowledge Process Unit)和KPU2.0。这是专门为机器视觉任务设计的神经网络加速器。因为异构计算是目前针对深度学习的主流硬件方案,为此在结合CPU与KPU加速器后,嘉楠能更好地提升芯片在视觉算法模型上的性能表现。


落实到芯片方面,嘉楠在2018年就推出了公司的第一代产品勘智K210。这款产品在过去几年里也在包括智能园区、智能家居、智能能耗和智能农业在内的多个场景中发挥了重要的作用,公司也与一些行业头部公司开发了智能产品。今年,嘉楠就作为全国大学生OS设计大赛唯一的技术支持方,也为大赛提供勘智K210和开发板作为评估工具。与勘智K210甚至还在美国和日本等国际市场上率先打开局面。

但张楠赓指出,即使K210在不少领域表现抢眼,但由于该芯片的研发时间较早,在算力规划上没有考虑到后来才出现的算法模型,导致产品在应用场景的拓展上受到限制。为此,嘉楠在日前又顺势推出了新一代的中端芯片K510。


据介绍,在全新的勘智K510芯片,继续沿用了双核RISC-V CPU架构中,但嘉楠围绕RISC-V CPU子系统进行了优化。例如该CPU集成了64位的数字信号处理器DSP,配合自主研发的KPU2.0核心为AI应用加速。

此外,DSP内部还设计了专用的本地存储,进一步提升DSP的实际运算性能。研发团队还在双核CPU和DSP之间设计了专用的mailbox模块用于通信,方便软件灵活掌控整个系统。


K510同时还在总线架构、IP核心与视频子系统等多个方面也推出了全新设计。这使其算力相比一代芯片提升了3倍,经典视觉算法mobilenetv1帧率大幅提升,自研高速PHY接口理论带宽也做到了10GB/s,8位数据压缩率更是高达50%以上,极大优化了勘智AI系列在机器视觉场景的应用性能。

为了进一步解决大功耗和大面积的问题,嘉楠在K510芯片上更是采用了NoC总线架构,让每个IP工作在特定的时钟域,解决庞大时钟树的困扰。

在K510的视觉硬件配置上,嘉楠也进行了大幅优化,使其能够支持MIPI CSI2 和DVP接口,可同时支持最多3个摄像头输入。芯片内部还集成了3个图像处理单元ISP, 其中一个ISP支持3D 功能,无需软件参与,硬件完成深度数据的提取和加工,相比软件处理深度信息方式不但节省了巨大的CPU开销,性能上也会有很大提升。


嘉楠同时还提高了K510在摄像头输入接口设计的灵活性,让其既可以硬件流水线方式将摄像头输入送至ISP硬件,也可以把输入图像写入DDR,ISP再通过线下方式读取DDR内的图像完成后续处理。满足用户可以在中间加入定制化的处理需求,或者对定制化的数据进行ISP处理。

值得一提的是,通过融合公司在算法、软硬件和编译器的最新设计,嘉楠推出全新的KPU2.0,集中突破AI芯片设计中广泛存在的“存储墙”和“性能墙”的问题。为了提升计算效率,KPU2.0采用了动态3D PE阵列,第三个维度支持多种方式共享传递数据,并实现多个维度上的计算映射,提高PE阵列的利用率。同时也可以动态开启或关闭每一个2D阵列,并根据不同层级对带宽和计算资源的需求进行调整。


据了解,通过动态3D PE阵列,K510支持多种方式共享传递数据,灵活支持多个维度的计算映射,提高PE阵列利用率。采用GLB(Global Local Buffer)设计,通过可配置的SRAM阵列实现,灵活配置以满足不同数据类型在不同层上的带宽和存储需求,并提升内部RAM的利用率。结合动态3D PE阵列和GLB设计,嘉楠还独创了计算数据流技术,在计算卷积时不需要进行数据重排;通过多级存储设计提升卷积计算的数据复用率。


此外,KPU2.0还搭载了可重构的SIMD加速单元,通过创新的meshnet网络可以灵活配置支持各种激活函数、pooling和resize等算子。

作为一款定位于中高端边缘推理芯片市场,K510无论在核心架构还是外部设备接口方面,都对芯片的视觉处理能力进行了大幅优化。这就使得这个芯片能够在高清航拍、高清视频会议、智能家居、各类机器人以及车载后装智能终端等市场发挥其功用,并占领一席之地。根据公司的规划,未来几年会有多款勘智芯片亮相,助力多个不同的应用和市场。



三、与全球开发者共同推进RISC-V

虽然在包括嘉楠在内的多个厂商的推动下,RISC-V取得了长足发展。但从过往的历史看来,任何一款架构的普及都需要时间。如PC时代的x86架构统治了指令集架构市场几十年,后PC时代才迎来Arm架构的崛起,Arm也用了几十年,才走上了巅峰。换而言之,计算负载的变迁需要经过一个长时间的生命周期。也就是说我们现在虽然已经进入了万物互联时代,给RISC-V创造了机会,但这个新兴指令集来说,也只是迈出了第一步。

再者,现在的指令的发展趋势是开放度越来越高。如Arm崛起的原因很大程度上是因为它引入了更多的市场参与者。同样地,我们也将看到RISC-V作为开源架构标杆对于新一代芯片设计厂商的吸引力,也许未来的英伟达、英特尔就会从这个生态中诞生。为此嘉楠也会持之以恒地投入其中。

张楠赓同时还强调,RISC-V生态还在持续壮大,特别在边缘侧场景中,因为很多业内通行的设计标准和协议标准尚未统一,所以在百家争鸣的现阶段中,探索自己独特的技术路线更有意义,这也是作为RISC-V的坚定支持者嘉楠所践行的。

“但我们也应该认识到,将芯片转化为智能产品需要一个过程。与软件不一样,硬件是一段漫长的旅程、很花时间。需要先完成原型,然后客户进行测试,可能还要进行一些反复开发,所有这些事情都会比在Linux上debug花更久时间,也需要在生态上花费更多心思”,张楠赓补充说。

基于以上考虑,嘉楠会坚持依托RISC-V架构进行自主IP核研发的技术路线,为市场带来性能表现更优的芯片。同时,公司也会在软件方面发力,给客户带来更方面的研发体验。


据介绍,通过公司采用统一的AI编译器,勘智系列KPU能支持 TensorFlow、PyTorch和ONNX 模型导入。支持算子融合、稀疏压缩和量化等优化手段,对模型的延迟和带宽进行深度优化。K510同时还支持丰富的网络模型算子,当中包括常见的 CNN、RNN 算子和各类向量计算和数据处理操作。


“嘉楠的成长受惠于开源,公司也将全面拥抱软硬件开源战略。嘉楠已经决定把公司在硬件模块、软件算法的积累,以及芯片手册等基本资料去阿奴共享出来给开发者使用,与全球的开发者共同推进RISC-V生态的繁荣。”张楠赓说。在他看来,推动RISC-V产业的发展,除了有利于公司本身以外。这于中国芯片产业来说,也是有百利而无一害的。

过去,芯片设计有时需要上亿研发费用,投入上百人,但这是中小企业不易承担,而且也不一定能掌握发展的主动权。但开源的RISC-V芯片设计能将芯片设计门槛大大降低,让3到5人的小团队在3到4个月内,只需花几万元便能研制出一款有市场竞争力的芯片,从而将促进芯片产业的繁荣,能更好地支持人工智能等新一代信息技术和数字经济的发展。

张楠赓认为,芯片产业最关键的是人才。在芯片设计门槛降低之后,将会吸引到更多的人才投入这个行业,这有助于奠定本土芯片产业长远发展的人才基础;另一方面,因为x86和Arm架构自身比较封闭,不容易进行创新。

“有了RISC-V之后,本土的一些架构创新的成果也容易以开源的形式进行推广,有助于打造中国在开源芯片领域的话语权。”张楠赓强调。


页: [1]
查看完整版本: 低调的国产RISC-V芯片玩家