“自下而上”模式真能走通吗?探索中国式AI产业发展路径

创见科技未来 2024-08-27 19:33:21

我们总是会高估一年内的变化,却低估十年后的成就——这勺历久弥新的“鸡汤”,同样适用于判断AI产业的走向。

从近处看,生成式AI的狂飙突进似乎遇到了瓶颈,大模型参数规模上升的斜度出现趋缓迹象,崇尚“大力出奇迹”的算力叠加模式也难逃边际效益递减的魔咒,千呼万唤的杀手级应用更是“犹抱琵琶半遮面”。

眺望远方,根据权威研究机构的预测,2023~2030八年间人工智能产业的累计贡献,将超过1830~1910八十年间蒸汽机对社会经济的影响。AI将重塑劳动者、生产资料及工具等生产力要素,进而创造全新的生产方式和运行范式。

当眼前的迷茫与未来的荣光交织在一起,恰是选择脚下道路的最佳时机。通往巅峰的路肯定不止一条,但此刻每一条路看上去都无比艰难,甚至根本不存在现成的路径,需要扫除那些旁逸斜出的荆棘,才能看见开满鲜花的苔原。

这就是中国AI产业面临的真实状况。特别是在外部环境诸多不确定性因素的影响下,芯片等核心部件“卡脖子”的问题依然严峻,因循国外既有的发展路径显然走不出困境,另辟蹊径势在必行。于是,摒弃“芯片独大”的桎梏,基于垂直行业场景需求“下围棋”、以集群性能优化弥补算力短板等思路和做法浮出水面——在赢得广泛关注的同时,也遭遇了“只是被动退而求其次”等非议。

事实上,简单的“judge”没有任何意义,从产业演进规律、现实发展条件出发,实事求是地探索“另一条道路”才是正途。笔者认为,中国AI产业有望走出“自下而上”的独特道路——深耕千行百业的场景化应用,并以此为基石进行全方位的系统创新,真正将科技自立自强与高水平开放相结合,让数字化、智能化赋能新质生产力发展,为中国式现代化保驾护航。

探寻“自下而上”的源头与流向

表面上看,生成式AI有点横空出世的意味,而实际上其爆发背后是人工智能自上世纪50年代起的筚路蓝缕,更是IT产业长期发展的“涌现”结晶。

作为经济全球化浪潮的典型代表,IT产业历经多年洗礼已形成稳定的格局,世界各国基于各自的“比较优势”,在产业链中扮演不同的角色。例如:美国擅长基础理论研究和原始技术创新,日本和欧洲在新材料方面屡有建树,而中国的制造能力无出其右。

值得关注的是,国际分工一旦形成,很容易导致路径依赖,从而不断拉大各国在某些细分领域的差距。显而易见,当下国内AI产业在芯片、大模型等前沿技术上遇到的难题绝非从天而降,而是IT产业长期演进累积的必然结果,再加上AI对资本、人才的“虹吸效应”,国内确实无法在短时间内赶上国际先进水平。

站在产业链顶端的角色,掌握核心技术和标准体系,更容易借助“自上而下”的发展模式,谋求具有支配力的市场地位。在IT产业,美国在处理器、操作系统、中间件等关键领域始终把控着主动权,当AI风云再起时,则欲基于GPU、大模型的优势复制过往的成功。

那么,过往居于产业链中下游的角色,是否有逆风翻盘的可能?答案是肯定的。当具有颠覆性的创新技术或产业机会出现时,从终端应用入手聚合用户需求,再向上完成系统或平台级的蜕变,进而带动核心技术领域的突破,已被事实证明是行之有效的路径。

这种“自下而上”的突围模式,正是中国在移动互联网和云计算等新兴产业赢得话语权的关键所在。在互联网发展初期,国内同样面临类似AI产业当下的挑战,而伴随即时通讯、电商等自主创新超级应用的崛起,中国互联网企业羽翼渐丰,并为解决业务发展问题改造IT系统平台——此前不敢想象的“去IOE”成为现实,亦为云计算的大行其道创造了必要条件。

从应用端出发,深入行业场景谋求竞争优势,也是国内AI产业应该秉承的发展思路。中国拥有全球最大的电信和电力网络、银行交易体系以及高速公路与铁路系统,制造业的门类细分与专业化程度遥遥领先,千行百业的信息化建设和数字化转型正渐入佳境,这为AI大展身手提供了强劲的底座支撑,亦开辟出广阔的市场空间。

相关统计显示,中国人工智能产业规模从2016年的100亿元增长到2022年的5080亿元,各个行业的智能化升级无疑是50倍增速的原动力。另据普华永道预测,2030年中国人工智能产业规模将达到7万亿美元,超过美国与欧洲的总和,这将成为国内AI产业掌握命运主动权的最大底气。

拓展“系统创新”的边界与路径

如果说应用需求和市场规模优势是“自下而上”发展模式的重要基石,那么“系统创新”则是打破传统格局、重新制定玩法的核心利器,堪称承上启下的中流砥柱。

从广义上来讲,“系统创新”涵盖人工智能产业的三驾马车,即算法、数据、算力,三者相辅相成才能取得全局突破;狭义而言,“系统创新”主要强调算力底座的优化与升级,改变过度依赖高性能GPU的窘境。

在算法领域,以大为美是“自上而下”模式追求的目标,“Scaling law”驱动下的大模型参数飙升与算力基础设施巨额投入彼此刺激,推动训练和推理水平不断迈上更高台阶。不过,倘若以应用端的视角来看,这种方式可能造成巨大的成本和能效压力,并不适用于所有市场。

由此可见,“自下而上”模式放弃对“大”的执念,并非只是因“得不到高性能芯片”而做出的被动选择,从应用需求出发寻找最适宜的算法才是更具建设性的“系统创新”思维。在国内市场,中等参数规模、贴近行业特征的垂直大模型更受用户青睐,颇具针对性效果的MoE混合专家系统也得到广泛应用,算法创新可能释放的能量不容低估;与此同时,大模型精度从过去的FP32到现在的FP8,未来会走向FP4,算法优化将促进算力效率不断翻番增长。

在数据领域,通用大模型对高质量训练数据的需求永无止境,国外屡次爆出“数据衰竭”的新闻即可见一斑,AI合成数据也许是缓解“数据饥渴”的解决之道。但从“自下而上”的角度看,将分散的海量非结构化数据有效整合,借助大模型为具体的业务赋能,才更有助于解决行业用户的燃眉之急。对相当多的国内企业而言,数据安全保障与价值分享机制更为重要,AI产业的“系统创新”有望走出与国外完全不同的道路。

不容回避的是,无论是“自上而下”还是“自下而上”模式,都会对算力底座提出前所未有的高要求。AI集群从百卡、千卡到万卡、十万卡,整个系统的复杂性必然激增,由此衍生的低效问题尤为突出,“系统创新”发挥作用正当其时。

从2017年Transformer架构诞生至今,按照摩尔定律推算,芯片性能只提升8倍,但通过综合的系统创新手段,AI计算的性能提升超过1000倍。系统创新的途径非常丰富,包括算法效率调优、以硬件重构和软件定义弥补资源短板、改善网络高速互连能力、推动高密液冷在数据中心落地等。目前,已有越来越多的国内客户重视模算效率(实际有效算力同系统最大算力之比),系统创新的丰硕成果有望加速落地。

开辟自立自强与开源开放汇流的新航道

不难看出,探索“自下而上”的中国式AI产业发展路径,以场景化应用为牵引,通过全方位系统创新实现算法、数据、算力的协同进化,既有助于解决当下困扰业界的难题,也为构建长远的数智化图景奠定了根基。

当然,在前进的道路上,难免遇到“成长的烦恼”。比如:如何在鼓励自主创新的同时,营造更开放兼容的生态?开源潮流与政策支持相结合,促进AI领域迸发出创新活力,CPU、GPU、TPU、NPU等各种自研芯片不断涌现,国产大模型领域也呈现出欣欣向荣的景象。但同时也要看到,部分企业“捆绑”特定客户群体,形成割据的“小圈子”,则不利于生态演进和技术进步。

从IT产业的发展轨迹来看,开源开放始终是技术创新的最佳催化剂,也是满足用户需求、降低应用门槛的重要驱动力。在AI时代,开源开放将发挥出更大潜能,目前2/3的大模型都选择了开源,90%以上的高端芯片厂商都支持OAM开放规范, 开源开放降低了自主创新的试错和适配成本,让更多的企业和开发者参与进来。多元的芯片、模型竞争激烈,让AI一直保持着巨大活力,这正是AI与开源开放双剑合璧的结果。

站在顶层设计的开阔视角,科技自立自强与高水平开放相互促进已上升到战略高度,新质生产力发展对中国式现代化的推动作用更是毋庸置疑。在这样的背景下,国内AI产业必须承担起更大的责任,并在模式探索的过程中汲取宏大叙事的养分,开辟自立自强与开源开放汇流的新航道,在充满未知的海域树立起夺目的灯塔。

0 阅读:1

创见科技未来

简介:感谢大家的关注