中科昊芯李任伟:RISC-V——破局DSP芯片自主研发的新路|GAIR 2021
本帖最后由 塞巴斯蒂安 于 2021-12-30 19:46 编辑始于2016年的“全球人工智能与机器人大会”(GAIR),历经五年,见证数次潮水的转向,成为目前为止粤港澳大湾区人工智能领域规模最大、规格最高的学术、工业和投资领域跨界盛会。
在2021年12月10日举办的第六届全球人工智能与机器人大会(GAIR 2021)“集成电路高峰论坛:国产高端芯片之路”论坛上,多位业界大咖分享了RISC-V在中国MCU、DSP、AI边缘芯片等方面的应用与发展。
中科昊芯创始人兼董事长李任伟为我们带来了《全球首款RISC-V DSP芯片在工业领域的实践与突破》主题演讲,分享了整个RISC-V芯片领域的最新进展,以及中科昊芯在RISC-V DSP芯片研发、应用方面的最新成果。
李任伟在演讲中提到2020年我国DSP芯片需求超过34亿颗,但国内生产的DSP不到1亿颗,当中的巨大缺口源于美国芯片巨头们对于DSP领域规则制定及生态的把控,令过往其他玩家鲜有机会。
而开源的RISC-V为国产DSP芯片的突破带来了新机遇,李任伟认为,基于RISC-V研发DSP芯片,能够在解决知识产权问题的同时也解决应用生态问题,是一条可行的新路——而中科昊芯正走在这样一条新路上。
据了解,中科昊芯2016年开始RISC-V处理器核的研发,2019年开始专注于RISC-V DSP的研发,目前已陆续推出数款RISC-V DSP芯片,并与白色家电、工业变频等领域的头部客户达成合作,出货量达数十万颗规模。
以下为李任伟现场演讲的全部内容,现作了不改变原意的编辑与整理:
感谢大会的邀请,今天我代表中科昊芯把我们这几年在RISC-V方面的一些探索和成果与大家进行分享。
RISC-V炙手可热,自研DSP亟待破局
RISC-V基金会在2015年底正式成立,到今天为止已经有来自超过70个国家的2000多位会员。目前全世界范围内累计已经产出超过20亿颗RISC-V核,从嵌入式汽车到超大规模的人工智能,从5G到高性能计算,RISC-V在各行业已经得到了广泛的应用。有机构预测2025年全球市场RISC-V核产量会超过600亿颗,其中在工业应用领域会超过167亿颗。
在RISC-V基金会官网上可以看到,目前全球范围内RISC-V芯片已经有包括SoC、IP以及FPGA等多种形式,目前已经有近100款不同门类及型号的RISC-V芯片应用于云端、移动、高性能计算和机器学习等多个产业,未来将有越来越多的芯片企业和终端企业加速在RISC-V方面的布局。
2021年RISC-V在处理器方面也有了很多新的进展:
像英特尔已经宣布开发RISC-V处理器,明年会首发7纳米的RISC-V处理器;国内阿里推出号称全球最强的RISC-V芯片玄铁910已经流畅运行了安卓系统,并宣布开源四个系列的IP核。
高性能的RISC-V处理器方面,还有一个已经开源的是中科院推出的香山处理器,第一代的内核被命名为雁栖湖,流片测试的效果不错,名为南湖的第二代内核也已经在开发。
而中科昊芯在今年4月份的时候也推出了第一款基于RISC-V的DSP芯片,目前主要应用在工业领域。
说到DSP,它不像一些ARM架构芯片——不管是CPU还是MCU,也不像大家熟悉的FPGA和GPU,其实DSP在各行各业里面应用还是比较广泛的,每个人的手机里面肯定都有一个DSP,只是它的存在形式不一定是单芯片,有可能以IP的形式存在。
2020年我国的DSP芯片需求超过34亿颗,但是据统计目前国内生产的DSP不到1亿颗,这中间有着巨大的缺口。造成缺口的原因是什么?是DSP基本上一直被美国的TI、ADI等公司主导,规则由他们定义,生态又比较封闭,不对外授权,这使得世界上其他的玩家不太好进行DSP产品的开发。
RISC-V+自研DSP指令,中科昊芯的DSP研发之路
中科昊芯核心团队已经十几年从事DSP以及通用处理器的研发,在处理器的设计、验证、平台方面积累了比较丰富的经验。入局RISC-V之前我们也自主设计过ARM核,现在RISC-V的核同样是自主研发的。
2016年开始中科昊芯就已经在进行RISC-V处理器和RISC-V核的研究。2019年1月获得投资后开始公司化的运营,专注于做数字信号处理器也就是DSP的研发。后来又分别在2020年、2021年初获得了九合创投、红杉中国和立创商城的投资。去年年底发布了两款RISC-V DSP产品,今年成功量产供货。
中科昊芯在RISC-V研发方面最主要的成果之一是研发出了H28x RISC-V DSP核,我们采用RISC-V最基础的47条指令,再结合自研提取的近百条DSP指令,最终完成了H28x RISC-V DSP核的研发。
至于为什么用47条指令?这是RISC-V基金会要求的必须选项。只要使用47条指令,基本上生态开源的很多东西都能够用起来,有了这个基础我们后面做的很多工作都会比较方便。
这也是H28x DSP核的特点,基于RISC-V开源指令集架构,再加上我们自研的专有DSP指令集,既能够突破知识产权方面的问题,也能够解决应用生态问题。
H28x DSP核其实是数学型的优化型内核,计算能力有很大的增强。通过我们的优化,这款内核在矢量计算、变换、边缘化三角函数等数学运算上较国外同类型号有比较大的提升
打破巨头垄断,HX2000系列横空出世
基于H28x的DSP核我们又研发出了Haawking HX2000系列DSP芯片。由于整个DSP市场都已被国际巨头所垄断,我们为了快速切入市场,必须开发出对标的产品并在性能上全面超越竞品,当然硬件上为了用户使用替换方便,我们仍采用跟国际友商同型号的封装可以直接替换,横向对标ARM M4在成本和功能上也具有优势。
目前已经量产的型号是HXS320F28027和HXS320F28034,另有多款产品正在研发当中,这些型号陆续都可以实现量产,基本上覆盖了友商DSP 90%以上的应用市场。
提到目前已量产的HXS320F28027和HXS320F28034,下图可以看到主频比友商提高较多,片上的存储——不管是Flash、SRAM还是ROM都比友商高很多。为了满足国内客户的需求,我们增加了eQEP、DMA等,友商有的一些优秀特点我们也得以继承并进一步发展,所以在高精度的PWM、ADC等方面有非常优异的表现。
用途方面,HX2000系列是面向工业控制等领域专业的DSP,它在数学函数支持方面有比较优异的特性,同时有比较丰富的实时控制的接口,也有比较完整的软件。工业芯片不单单对性能有要求,对芯片的可靠性、环境适应性也提出了比较高的要求。
除了芯片本身对于数学函数的支持优化,我们还提供了一整套的函数库、算法库,通过软硬件结合的方式进一步挖掘芯片的性能,经过软硬结合的加持,对比国外竞品HX2000系列的运行速度提升在50%到110%不等。
下方展示的是HX2000系列提供的实时控制外设类型,有增强型的脉宽调制模块、增强型的捕获模块,有高性能的HRPWM和HRCAP模块,也有各种常用接口。新开发的产品会增加eCAN,一部分面向的是需要快速切入用户的存量市场,另一部分则是面向增量市场。
这些实时外设具备专业化的设计,功能全面可以适应各类算法,并且尽可能地硬件化以减少软件的配置。另外在现有产品的基础上,我们还将与国内的头部企业一起定义一些更加满足国内市场需求的领域专用产品。
当然DSP只有芯片本身是远远不够的,还必须有完整的集成开发环境。中科昊芯通过一段时间的积累以及与行业客户的深度合作,为了让用户比较快速地上手,我们开发了一个HAAWKING IDE,目前采用了SEGGER的实时运行库,对代码容量有非常大的提升。
下方是HAAWKING IDE的界面图,基于开源的Eclipse开发。当然我们并不是将开源方案拿来就用,还增加了近百条DSP指令,经过大量的优化、修改、调试,最终才做出一个性能各方面比较稳定、对用户比较友好的IDE,包括连接器、调试器,目前用户反馈都还不错。
Flash烧写方面我们也提供了串口烧写,Haawking HX-Flasher可以支持串口烧录、加密解密、OTP烧写、量产烧录,跟国内几家离线下载器的开发商有合作,可以同时支持一拖二、一拖四、一拖八的离线下载。
下面是几个领域应用方案的简单举例:
首先是步进电机方案,中间这台是基于中科昊芯方案的电机,由右下角的正弦波可以看到整体的振动、噪声相比竞品较小,且输出力距准确,可调范围大;该方案已经导入数十家用户的供应链。
下图是直流无刷电机的方案:
下图是伺服系统的方案,启动非常平滑,响应速度快,定位准确,而且抖动的力距效果也非常好。
目前Haawking DSP芯片应用的领域主要是在白色家电、工业变频、伺服系统、数字电源还有储能方面,在上面所列的每一个领域,我们也都跟领域内的头部客户开展合作,产品导入多家头部客户的供应链。
由于产品今年刚刚面市,也受今年供应链产能所限,目前的出货量大约在几十万颗的规模,明年可能会有比较大的提升。
感谢各位。
完
页:
[1]