圆桌|“推理>训练”,RISC-V在边缘计算领域有哪些发展机遇?

硬件是与非 2024-08-22 20:56:57

虽然RISC-V的诞生已经有10多年,但站在5年前,我们仍然觉得RISC-V是一项新技术,因为它没有产品落地。今天五年过去了,RISC-V的势头已经逐渐清晰,赛道也慢慢跑出来了。 在第四届滴水湖中国RISC-V产业论坛上,除了像往年一样跟踪上一年推介的10款产品落地情况,并推介当年最有希望量产落地,且具有代表性的10款产品以外,同期还举办了以《RISC-V在边缘计算领域的发展机遇》为主题的圆桌论坛。

图 | 《RISC-V在边缘计算领域的发展机遇》圆桌讨论现场,来源:芯原

论坛由中国RISC-V产业联盟理事长、芯原股份创始人、董事长兼总裁戴伟民主持,并邀请到了英特尔亚太研发有限公司研发总监段建钢,达摩院(上海)科技有限公司研发总监 梁中书,中国RISC-V产业联盟秘书长、芯来智融半导体科技(上海)有限公司CEO彭剑英,芯原股份高级副总裁、定制芯片平台事业部总经理汪志伟,北京大学讲席教授、RISC-V国际基金会人工智能与机器学习专委会主席谢涛,乌镇智库理事长张晓东六位重磅嘉宾,共同探讨RISC-V的现状、发展趋势,以及更适用于中国RISC-V发展的道路选择。 下面整理了本场圆桌论坛的重点对话情况: 戴伟民:在万物智联时代,如何看待“RISC-V+AI”、“AI+RISC-V”的道路?谢涛:“RISC-V+AI”就像是从RISC-V大房子“长”出来的小房子,因为有些功能需要大房子和小房子协同才能把任务做好,而这个小房子就相当于“撑”起整个设计的加速器。 而“AI+RISC-V”就像是CPU和协处理器的关系,协处理器可能有很多个,从而组成一个集群的概念。戴伟民:在AI领域,我们是否可能借助RISC-V来解决生态的问题,就像Android一样发扬光大?张晓东:我们要去挑战CUDA生态,用开源挑战闭源,做一个全新的生态,存在哪些挑战呢?我观察到一个现象,有一些做得好的,往往是先有需求和产品,而后在产品和需求的基础上去建设标准,这样的标准往往更容易成功。如果我们现在凭空制造一个标准,然后希望拉产品的人来做,这个挑战是相当大的。 此外,我最近观察到几个现象,AI生态有好几个类别,今年年初的时候英特尔推了自己的AI PC,但微软出来说,“你的东西不是AI PC,是不是AI PC我说了算”,于是微软定义了一个它自己的AI PC标准。那么,接下来苹果也可能有所谓的“苹果AI生态”,谷歌也有自己的生态。所以,在一个操作系统或者更大的应用层面上,它会构成一个生态,那个生态如果起来了,未来会和我们刚才说要打造的“AI+RISC-V”间存在怎样的关系呢?是RISC-V为其提供武器,还是说在做了一些事情后就被其撇开?事实上,当前CUDA还主要应用在训练侧,在端侧的推理应用不是很多,但两、三年后,推理可能是训练体量的10倍及以上,带来更大的影响力,这又将会是一个怎样的动态关系呢?我也想请教一下谢老师。谢涛:确实这些问题都很关键,我们要去推标准,可能有一些标准是偏学术机构或者说企业没有深度参与的。但RISC-V国际基金会推标准时采取的是“自底向上”的策略,标准是以企业为核心的行业共识,我们的目标不是标准本身,我们把标准当作手段,推成标准之后就会把更新迭代和维护的工作交给各大国际开源主流社区,所以这个标准是经得起推敲的,也是有极大吸引力的。通常,AI芯片公司中2/3的工程师是软件工程师,如果跟随成熟标准,就可以借力减负,减少公司在软件方面的成本投入。 第二个问题,CUDA生态是英伟达推行的,然而包括AMD、谷歌、微软在内的科技巨头都不希望英伟达一家独大,确实英伟达的产品又贵又难买到。而RISC-V不是排他的思路,包括英伟达也想去拥抱它。支撑英伟达GPGPU芯片的开源的系统软件栈就像是一个“大烟囱”,现在也有一些国际公司很看好Triton生态,希望把它做成“小烟囱”,当RISC-V把大家团结起来,就可以形成另外一个平行的“大烟囱”。戴伟民:英特尔是x86的代表,为什么也会支持RISC-V,并且在早期就做出了很大的贡献?段建钢:我们实际上是在寻找一个交集,AI有单独的一个范畴。我们经常碰到一个问题,当我们要做一个GPGPU,就会有很多人提出质疑——为什么是RISC-V和AI的结合?事实上,AI是一个不断发展的领域,未来的AI会是什么样子,还没有很好的定义,这意味着可能有更多的创新机会。 但我们知道,对于AI来说,它需要的是一个很大的软硬件结合的优化解决方案。从软件方面来看,新的Triton或者PyTorch等新的编程语言出现,是为了更直接、方便地去开发一些算子。 当然,这些尝试不一定能够成功,最终成功与否还要看工业界的发展、生态的发展,以及社区的努力。戴伟民:梁中书是阿里巴巴的技术专家,也曾就职于英伟达,你对这个持什么观点?梁中书:毫无疑问RISC-V现在最重要的方向就是AI。早年的AI主要聚焦在“训练”方面,但未来几年,“推理”的需求会更旺盛,“RISC-V+AI”的趋势是非常明显的。那么,如何做好“RISC-V+AI”生态呢?从硬件的角度来看,我们都在追求算力的能效比,所以AI的算力必然会走向端用化。 当然,目前业界最主要的还是“紧耦合”的模式,但未来AI大算力芯片应该是“松耦合”的状态,也就是“RISC-V+相关AI加速器”。换言之,AI某种程度上很可能是个性化的应用,它需要支持好“加速”模式,而一个高效、完整的扩展指令接口,包括工具链的支持、相关基本软件库的适配,可以助推“松耦合”AI大算力芯片的发展。投票问题:预计RISC-V+AI生态何时可以“撼动”或者达到CUDA生态的规模?

段建钢:我觉得要看我们怎么定义“撼动生态”,这个比较含糊。因为从用户的角度来讲,其实越往上用户越多,现在最能赚钱的AI爆款应用还没出现,我觉得得等商业模式更清晰的时候,从应用爆点切入也许还有可能,但从找到一个软件栈完全跟CUDA能够达到一样的效果,这个确实从技术上来讲我觉得比较难。戴伟民:说到应用,ChatGPT出来之前都是“弱智能”,现在Transformer下的AIGC实现了“强智能”,我认为被这波“强智能”第一个颠覆的将是教育行业——我们不需要背答案的人,而需要提问题的人,因此在“个性化教育、普惠教育”的背景下,AI-Pad将是一个很好的抓手,所以对RISC-V来说,我们更需要往中高端市场去发力,和安卓做好适配。那么,从家长的角度来看,赋能教育的AI-Pad到底应该拥有哪些功能呢?汪志伟:市场上Pad产品已经很多了,价格区间从800元到4000元不等。但我认为过去硬件引领软件下所谓的“智能教育”的智能化程度是偏低的,现在变成软件引领硬件,硬件能力相对于智能化的需求是偏弱的。要让AI-Pad有竞争力,我认为一方面AI算力需要提升,可以借助RISC-V这样一个开放、灵活、可扩展的CPU架构来扩展AI算力;另一方面需要支持安卓操作系统,便于广大的用户、开发者在这上面开发软件,实现应用软件层面的智能化提升,比如语音、手势等姿态的交互能力,解答问题、分析评价的能力等。戴伟民:很重要的是“个性化”,学习的人打瞌睡了你还在讲,那不行;如果他/她学得很有成就,奖励其玩10分钟游戏也是应该的,这个其实要求蛮高的。现在技术都有,但在终端垂直领域个性化的大模型需要微调和推理。至于怎么去推理和微调,RISC-V能否支撑起AI-Pad对CPU的焦点需求,我想听听彭博士的看法。彭剑英:在AI智能终端的定位方面,我认为2000-3000元价位的AI-Pad就像是“小房子”,5000-6000元价位的AI-Pad则是“大房子”,它们对SoC的架构的需求是不一样的。而未来评价AI-Pad好坏最核心的因子也不是基础的CPU性能,而是这个CPU能不能支撑未来在AI方面的扩展。 这几年RISC-V生态发展很快,包括在算力或者CPU内核在性能上的不断提升,已经可以往主流应用去走,这对于RISC-V是巨大的机会,因为RISC-V最大的优势就是可扩展性,能为这些应用提供更强的AI能力。戴伟民:段总在英特尔曾经也看过教育,而且听说你的小孩也是很优秀的,你能否谈一下你想象中的AI-Pad最重要的三个点?段建钢:从家长的角度来讲,我希望能够提供一个安全可控的,帮助他/她去探索和了解世界的一个渠道。小朋友理解世界的方式和大人是不一样的,他/她的文字能力不是太好,更希望通过语言和AI引擎对话,所以我们是否能够提供一个方式,一方面针对有限的领域和知识集引导他/她们,培养他们对这个世界的热情;另一方面提供给家长一个参与和了解他们探索过程的辅助能力。这些新的创新和应用,我觉得就需要新的软件、新的模型、新的算力来支撑。投票问题:从家长的角度来看,希望AI-Pad有哪些功能?(选三项)

问题:从家长的角度来看,什么价位的AI-Pad是合理的?(单选)

彭剑英:不能选太贵的CPU,所以选RISC-V最合适,性价比最高。戴伟民:除了以上提到的消费电子外,我们来看车端,高通、博世、英飞凌等几家做RISC-V是为了汽车,这一次“RISC-V欧洲峰会”上也特别讲到了“汽车”的事情。最近芯原做了一个5nm车规芯片,德国一家非常有名的公司跟我们谈,他说:“我不要做一大颗芯片,我希望把它分开做,你会做CPU、他会做GPU、他会做AI,最好几个人来领。比如一个车型需要50Tops的AI算力,今天这个CPU可以是Arm、x86,也可以是RISC-V,当然这个接口我们事先有标准。所以我想请问彭总,从MCU的角度来看,RISC-V是否有可能实现上车?”彭剑英:今年6月底在慕尼黑开的“RISC-V欧洲峰会”,蛮多内容都跟“RISC-V上车”相关。 以英飞凌的一个演讲为例,我们知道英飞凌之前一直是自研的,如今他们也投了5家企业。从各种信息可以看到,他们下一代ECU或者下一代车规的CPU平台就是基于定制化的RISC-V的。为什么英飞凌占据世界第一的位置,依然有决心在早期投入到RISC-V? 我自己的理解是,现在汽车电子面临巨大转型,软件定义汽车芯片正在成为未来趋势。2010年之前大家追求的是性能,当时面临着的是16位升级到32位;现在强调的是“软件和AI”,如果不主动拥抱变化,就会被抛弃。至于为什么选择RISC-V?他们也是认为RISC-V实际上是一个开放的环境,它的可扩展性、可模块化,适用于在未来一颗芯片或者整个汽车电子不同模块的芯片,可以用同一个ISA、不同的微架构实现的核心来统一满足需求。以汽车电子ECU为例,系统管理有一个核心,计算、加速器可能会有1-4个核心,AI-ECU可能会有N个核心。换言之,未来的车载ECU对CPU的性能要求不再是简单对标MCU,而是需要一系列的覆盖,那就意味着不仅仅是对IP选型的问题,而是对整个软件生态整个兼容性的问题。但对于RISC-V来讲,整个软件是兼容的,所以这是一个巨大的优势。 其实现在不仅是英飞凌有所动作,瑞萨电子也在做内部的一些RISC-V项目研究。总体上我认为汽车电子正面临巨大的转型,这对RISC-V来讲是一个机会。 芯来从2021年就开始做车规产品,2023年7月,芯来NA900系列的成功认证使芯来科技成为了全球首家获得ISO26262 ASIL-D产品认证的RISC-V CPU IP厂商,今年芯来NA300系列也获得了认证。确实,新能源汽车赛道给整个产业链带来了一次巨大的机会和时间窗口,对我们来说,已经从“0”踏入了一个相对来讲探索的阶段,国内和国际头部的激光雷达、毫米波雷达厂商已经在量产基于芯来IP的ASIL-B和ASIL-D产品。汪志伟:第一代特斯拉的时候单颗芯片算力只有36TOPS,如今已经达到500TOPS,未来可能会更高。Chiplet要解决的一个最大的问题就是AI算力需求问题,过去两年芯原在汽车电子领域做的不错,尤其是在ADAS领域,设计能力已经属于业界领先水平。为了满足进一步的算力需求,我们跟RISC-V四大家的芯片大厂中的两家(是我们的客户)都有讨论。你切成几颗大的,怎么切?要解决可靠性、散热、安全等问题,那么我们要回到Chiplet在车上最主要解决的问题是什么?其实,最关键的是解决神经网络,尤其是现在这种大模型LLaMA2,以及在边缘端和车端的推理,有很多工作要做,当然首先要解决的还是AI算力问题。在逐渐收敛的过程中,芯原认为需要简化方案,AI算力不够怎么办?拓展算力再加上一个NPU的Chiplet,NPU的Chiplet可以再来300TOPS、500TOPS,甚至1000TOPS;另外可能还要加一个Chiplet,就是AISP,因为市场上有些芯片的AI算力只能支持两路、四路,或者最多到六路、八路摄像头,但是现在新能源车上用的摄象头越来越多,12路摄像头是普遍的,怎么办?可能要加一个Chiplet来扩展AI算力,加上对AI的处理。我们现在看到的,2-3颗Chiplet是比较现实可行的一个针对自动驾驶的解决方案。投票问题:预计RISC-V芯片何时可以在汽车上获得普遍采用?(单选)

问题:基于Chiplet的高端车规芯片预计何时会成为主流?(单选)

戴伟民:我认为AI-Pad是非常有市场的,而且当Pad出来后,一定要联合教育软件公司做线上线下的配合,做成真正的智慧设备,同时把软件生态搞起来。 此外,在“上车”方面,我们看到,芯来的小MCU已经“上车”了,现在我们要看能不能尽快把Chiplet在自动驾驶上推动起来。

0 阅读:0
硬件是与非

硬件是与非

感谢大家的关注