文 | 智能相对论
作者 | 陈泊丞
经过数年发展,我国已培育出一批能切实支持产业发展的芯片企业,进入3C、汽车、制造等产业。汽车领域,汽车芯片的国产率已从过去的不足5%发展到10%左右;在GPU赛道,国内智算中心、互联网企业等需求方采购国产算力芯片的意愿不断提高,国产算力开始迎来市场化应用的春天。
我国已形成一批性能还不错的AI算力芯片,不过,算力产业的发展仍面临诸多挑战。芯片性能与国际头部产品相比仍存代差,软硬件适配不足。不同品牌芯片存在互联和协同等问题,难以面向具体场景发挥出应有的性能表现等等。而需求方对国内芯片产品的性能了解不充分,存在选择困难,这也直接限制了国产算力的商业化进展。
国产算力产业和需求方之间,缺乏打通信息壁垒的桥梁。在这种情况下,北电数智(北京电子数智科技有限责任公司)依托前进·AI异构计算平台打造的首个国产算力PoC(Proof Of Concept,场景验证)平台,能以国产算力产业“连接器”的定位补齐国产算力产业的关健“拼图”,对国产算力的商业化应用和规模化爆发都有着重要意义。
为什么PoC平台是算力产业的关键“拼图”?
当前,国产算力产业面临的问题比较具象化,即算力供给侧和需求侧之间存在明显的产业生态断层,各自繁荣,却难以相互打通、产业链不协同。
在算力供给侧,尽管AI算力厂商很多,但国产芯片的整体性能依旧无法与行业的头部产品竞争,很难媲美高端芯片的极致性能表现,仅在个别维度上具备优势。在这种情况下,国产芯片最好的应用路径是组合取优,寻求国产算力集群的性能最优解。
国产芯片还面临着产能不足的情况,单一算力集群难以满足算力需求。不同芯片之间存在异构问题,比如不同芯片在算子、软件栈、工具链层面存在差异,不同类型卡的物理连接和集合通信库完全不同,无法直接互联互通,组合应用非常麻烦,很难为下游提供统一、高效的算力解决方案。
另一方面,AI技术不断突破,正逐步进入千行百业,行业发力探索场景需求。行业普遍认为,大模型想要落地,需要与具体的行业、场景结合。为更好支撑大模型,这就需要这就具有性价比、又能有效支撑模型的底层算力解决方案。
但需求侧的企业不了解国产芯片性能,难以评估其是否能满足自己复杂的场景需求。当需求方无法验证国产芯片的应用效果,最直接的表现就会导致采购意愿不足,进一步加剧国产算力产业链的割裂和断层。
产业链的上下游断层,难以协同,缺少必要的“桥梁”完成两侧互通,导致国产算力的整体利用率并不高。
这种现状背后的本质是产业生态的不完善,北电数智的国产算力PoC平台基于场景提供测评、适配和验证服务,将有效地实现产业链上下游的互通协同,从而更好地推动国产算力支撑大模型落地的步伐。
国产算力PoC平台补齐了整个产业链中关键的一块“拼图”,促使整个产业生态区域完整、协同,让国产算力能充分发挥出应有的性能表现和产业价值。
PoC平台之路,已经踩了出来
基于整个国产算力产业的发展趋势,PoC平台所要走的是一条正确且艰难的道路,需克服诸多问题。北电数智首个国产算力PoC平台,需解决三大层面的问题,把初步道路踩出来。
第一,技术能力是否强大。对于算力PoC平台,技术能力是关键。若要实现不同芯片之间的混元异构算力集群,算力PoC平台需要有必要且领先的技术实现统一通信库建设,做好芯片硬件和软件、算法的适配,实现算子协同等,再基于不同芯片特长有针对性进行算力调度,将混元国产算力集群的性能发挥出来。
北电数智国产算力PoC平台背靠的前进·AI异构计算平台,是国内首个在生产环境下可实现规模化测试的全栈迭代验证平台,已成功实现数千卡国产算力集群的部署。由此,基于多芯片混元异构,能有针对性地根据不同芯片特点,基于模型任务、场景需求来调配合适的芯片算力,并提供加速解决方案,从而实现国产算力集群的高性能表现。
第二,评测价值是否有效。AI产业发展日新月异,垂类场景的算力需求也在不断变化,算力PoC平台比较难做的一点是,需要面向多种不同的垂类场景需求,不断去迭代评测机制,保障评测价值真实有效。
如今,北电数智正面向影视、金融、政务、工业等多个垂类场景开展测试验证服务,为不同行业的垂类模型落地树立标杆案例,并持续探寻国产算力和行业、模型、应用的最佳适配组合。既面向具体的垂类场景,又保持持续性探索,这正是国产算力PoC平台最需要具备的特性。
第三,生态建设是否全面。算力PoC平台在产业链中的站位,决定了其发展必然要拉起整个生态建设,才能做好产业链上下游的“连接器”。在这个过程中,平台需要尽可能多的上游厂商一同发展,进而才能面向下游企业提供高性价比产品和服务,获取认可。
截至目前,由北电数智统一规划建设与设计运营的北京数字经济算力中心,已成功完成对包括摩尔线程、寒武纪等在内的十余种知名国产算力芯片的部署测试。面向上游的生态建设已经初见成效,北电数智也在积极面向下游的具体场景需求,联动AI企业落地应用,继续扩大生态影响力。其中,面向影视领域,北电数智推出面向影视文化产业的AIGC视听的解决方案六艺多模态影视文化大模型,基于国产算力PoC平台,深度联合10余家相关AI明星企业,打造人物AI生成代理、剧情创作辅助工具等超级应用,助力推动影视及文化产业的数字化与智能化转型升级。
国产算力产业再进阶,从算力PoC平台开始
毫无疑问,在国产AI产业高速发展以及算力需求持续爆发的重要节点,算力PoC平台将有效解决国产算力供给侧与需求侧断层的问题,促使产业链双向打通,最终带来多方利好的价值。
中国科学院计算技术研究所研究员张云泉介绍,北京推出国产算力场景验证平台,能够帮助算力需求方充分了解国产算力芯片对自身业务的支持程度、适配程度,更为国产芯片提供了多元场景性能展示平台和公正清晰的评估标准,为国产算力大面积商业化落地提供支撑。
一方面,面向算力需求方,可以提供专业、高效、灵活且具备高性价比的算力解决方案,加速AI产业爆发。目前,北电数智正在为下游的算力需求方,如金融、工业、医疗等具有真实场景需求的AI企业提供能满足业务场景需求的国产算力集群组合,以有效降低用户的验证时间和成本,最终快速锁定合适的算力解决方案。
同时,基于“前进·AI异构计算平台”及“宝塔·模型适配平台”,凭借混元适配及异构调度能力,使芯片与大模型广泛解耦合适配,进一步为用户提供能满足行业、模型、应用的适配的最佳组合方案。基于不同的芯片组合所提供的算力解决方案性能会更好,也更具性价比。要知道,合理规划算力资源,可以减少用户的等待时间,提高处理效率,同时也意味着在相同时间内可以处理更多的tokens,从而增加收入或降低单位成本。
另一方面,面向算力供给方,统筹国产算力集群,充分激发国产算力产业的潜力。像北电数智打造的国产算力PoC平台提供垂类场景评测、验证和适配服务,不仅可以及时向芯片厂商反馈芯片使用情况,帮助芯片厂商迭代,让性能优势继续强化,同时能补足性能短板,让不同的算力资源找准产业定位,真正把国产芯片用起来,发挥出应有的价值。为了更好发挥硬件效果,PoC平台发力解决国产算力集群的混元异构问题,统一通信,做好芯片硬件和软件、算法的适配,实现算力的最佳调配。
面向整个算力产业,PoC平台将双向拉通产业链上下游关系,促使算力实现正向流转,加速国产算力商业化进程。上游的算力资源有了用武之地,下游的算力需求能得到充分满足,整个算力产业的商业生态就实现了激活,从而得以更好地发展。