睿思芯科王卫:架构自由创新是RISC-V的关键优势
本帖最后由 sky 于 2020-12-13 19:40 编辑2020 年 8 月 7 日,全球人工智能和机器人峰会(CCF-GAIR 2020)正式开幕。CCF-GAIR 2020 峰会由中国计算机学会(CCF)主办,香港中文大学(深圳)、雷锋网联合承办,鹏城实验室、深圳市人工智能与机器人研究院协办。从 2016 年的学产结合,2017 年的产业落地,2018 年的垂直细分,2019 年的人工智能 40 周年,峰会一直致力于打造国内人工智能和机器人领域规模最大、规格最高、跨界最广的学术、工业和投资平台。
2020年8月8日上午,来自学术界、工业街、投资界的重磅嘉宾齐聚CCF-GAIR 2020 AI芯片专场共同探讨新基建浪潮下AI芯片发展的绝佳机遇。
睿思芯科副总裁王卫在《领域架构促进人工智能发展》的演讲中指出,在人工智能时代,算力提升遇到巨大挑战,伴随工艺进步速度下降,传统的提升性能方法也逐渐下降,需要在芯片体系架构和计算体系架构上有所创新。RISC-V发明人David Patterson认为,RISC-V这一新新指令集将促进未来芯片架构的发展,实现算力提升。
王卫从AI芯片的发展历程与设计时需要考量的因素、AI算力在RISC-V指令集中提升的体现、RISC-V的特点与发展等方面解释了RISC-V对人工智能发展的推动作用。
睿思芯科副总裁王卫
以下为王卫的主题演讲内容,本文做了不改变原意的编辑与整理:
我们公司是一家专注于做RISC-V开源指令集芯片的公司,我们也试图通过观察整个芯片的发展历史展望未来,了解做AI芯片应该研发的方向,以及整个行业芯片体系结构的发展方向。今天主要分享一些对未来AI芯片发展方向和趋势的思考。
一、寻找提升算力的新思路
今天,大家所提的AI,主要是针对神经网络这种特定的算法。从基本的原理和算法来讲,大概30年前,就已经有基本的框架了。但为什么直到最近几年,大概是从2012年开始,AI才真正得到了爆发式的应用,并在实际中有所体现,这主要是因为算力的增长。
很多业内的权威专家都在探讨算力、算法和数据这三个方面哪一个更重要一些,其实三方面都重要。从历史发展看,有了算法,如果没有足够的算力支撑,就没有办法在实践中得到真正的应用。有了算法和算力,必须要有大量的数据才能够得到我们想要的结果,所以这三者的关系应该是缺一不可的,不过这三个方面的发展程度此起彼伏,在不同的阶段有不同的发展方向,某一方面可能会走得快一点,但很快它也会驱动其他几个方面共同发展。
有了算法,只有算力跟上,才能真正发挥作用,对整个社会产生实际意义。目前在算法提升的道路上,遇到了巨大挑战。在芯片性能的发展中,最早是摩尔定律预言整个工业界都会按照一定的速度稳定地向前发展。但同时,为了保持摩尔定律的发展速度,除了工艺上的进步,还包括体系结构等其他方面的进步。例如,为了保持算力的增长速度,从最早的单核代多核并行运算,又到串并行协同运算,算力持续增长。但最近几年,现有的思路方法几乎在提升算力上失效,需要新的思路来替代,即芯片体系架构和计算体系架构的创新。
二、谷歌TPU带来的启发
以谷歌为例,谷歌无论是在硬件还是在软件上都有强大的基础,他们做出一个芯片可能一开始效果并不好,但是后来通过不断挑战算法,以达到算力的巨大提升。如果设计芯片时,一开始就将它的体系结构和算法有效结合,最终设计出来的芯片肯定就有更好的表现。
这里引用的人工智能发展史上的里程碑芯片,即谷歌的TPU,它也是整个行业里第一款公开且引起大众关注的AI芯片。至今为止,行业内很多AI芯片的基本结构,就是它的基础上发展过来的,具有代表性意义。这其实体现了Domain specific architectures(特定领域的体系结构)的强大力量,因为它是特定地为神经网络算法加速去设计的一种芯片硬件结构,通过对这个特定目标的机制优化,做出来一个性能好、算力强大,在功耗和能耗比上也在当时达到很好的指标的芯片。当然,后续又有很多初创公司或成熟公司,飞速地发展他们的产品、技术,更多、更强、更好、的芯片便涌现出来。
谷歌TPU到了第三代,比第一代有很大的进步。TPU3采用水冷技术降低能耗比,为什么会用到水冷技术?因为空气的散热能力有限,单纯用风扇无法散走足够的热量,必须采用水冷方式才能保证芯片正常工作。但这一芯片主要应用于数据中心,需要非常好的环境、相对较高的成本,才能保证有效降低能耗比的条件。当应用到终端或边缘端,不太可能有这些条件提供保障,因此在设计终端芯片和边缘端芯片时,思路会有所不同。
三、架构自由创新是RISC-V的关键优势
在具体的实现方式上,RISC-V发明人David Patterson认为,RISC-V指令集会促进未来芯片架构的发展,真正释放芯片设计的巨大潜力,让更多的人能够在专属领域内实现软硬结合,设计出合适的架构。
RISC-V作为一个计算机体系架构,是近期非常热门的话题,RISC-V的特点是什么?开源的、免费的、低成本的,是RISC-V的绝对优势。如果从芯片的体系结构角度而言,其最大的优势则是像乐高积木一样的模块化结构。RISC-V把指令集中的不同功能子集分得很细致,不同的模块之间可以自由地排列组合,而且整个指令集中预留了大量自动指令集,可以让客户在芯片层面结合子集的算法和应用需求,定制一个对应自己专属场景最有用、最优化的命令。这也是Domain specific architectures的经典体现。
因此,RISC-V最关键的技术优势在于可以在架构上自由创新。在RISC-V指令集中,AI算力的提升体现在其向量扩展指令集方面,规定了跟CPU本身高度耦合的扩展指令集,可以通过向量的扩展指令集的运算,从硬件上加速各种矩阵乘加的运算。目前所有的深度学习,对算力要求最高的是各种矩阵运算,恰好能够在RISC-V指令集中实现。
另外,由于RISC-V是开源的,会吸引更多人加入这一体系结构中,去研发、去竞争,带来更多创新,推动自主可控的新基建。
对于RISC-V,大家更多的是在强调其在终端或边缘的应用。事实上,RISC-V本身没有适用于终端或者云端的属性,RISC-V也可以在云端,在高性能、大规模运算上发挥优势。但作为指令集,越复杂的应用对整个生态的依赖程度越高,包括编译器、工具链、具体架构的设计,相对云端而言,边缘端对生态的依赖程度更低,因此RISC-V在云端的应用会晚于在边缘端的应用。
四、开源架构更需国际协作
RISC-V的发展非常迅速,RISC-V基金会已有500多个成员,包括全球各地的软件公司、芯片公司、服务商、云服务提供商等,中国也有非常多的公司在积极地参与RISC-V开源组织。在软件方面,开源的东西有越多的人参与,它的发展速度就越快,甚至会呈指数级发展,RISC-V也是如此。
我们对RISC-V的认知是结合了所有的开源项目,包括硬件、软件,它必然需要国际上的协作,在一个特定的小圈子里,在特定地域范围内做开源,最终是不可能成功的。如果你希望享受开源的成果,就应该更积极地去参与,更积极地对整个社区有所贡献。
所以目前国内已经有很多公司在积极参与RISC-V基金会的活动。包括我们公司的创始人谭章熹博士,本身就是RISC-V基金会董事会的成员之一,也非常积极地把我们所做的RISC-V方面的一些研究成果、生态环境的促进工作往前推进,希望更加积极地回馈RISC-V社区,也希望更多人加入到RISC-V开源社区中来,希望未来RISC-V、x86、ARM能够形成三足鼎立的格局。
尤其是对中国而言,新基建下,一个开源的、开放的,充分国际合作且无人能阻止的平台,我们认为意义重大,对它的发展抱有非常大的信心。因为我们也看到在短短一年之内,在中国整个领域相关的公司和产品都发展得非常迅速,我们也希望对整个发展做出贡献,希望跟更多业界的同仁们合作,如果大家希望在RISC-V基金会能有更多的反馈,我们也非常愿意进行这样的合作。
注:文中配图雷锋网获演讲者授权使用。
页:
[1]