当前全球人工智能竞争已进入以大模型为核心的“智能密度”比拼阶段。美国依托算力霸权和产业先发优势,持续巩固技术垄断壁垒。近期我国以DeepSeek为代表的大模型企业通过算法创新、数据工程提升和存储优化,在推理成本上比OpenAI下降了90%以上,同时实现了同等的推理性能,并且在数学、代码等复杂推理任务中表现卓越,获得全球瞩目,证明了“算法+数据+存储”可有效突破算力桎梏。
“原来大家都觉得需要依靠高算力,但是我们现在发现也可以通过另外的技术途径走到国际先进行列。”全国人大代表、华中科技大学副校长冯丹表示。今年两会,她带来了关于加快大模型推理创新和应用的建议。
冯丹提到,加快大模型推理落地,既是突破国外技术封锁的关键路径,更是抢占产业智能化制高点的战略需求。通过政策引导、技术创新与标准建设,从“算力竞赛”转向“算法+数据+存储协同创新”,中国有望在近年实现大模型推理应用的全面发展和换道超车,为全球AI发展提供“中国方案”。
“OpenAI由美国主导,是闭源的,使用就需要付费,但现在DeepSeek通过开源建立了比较好的生态,大家一下子觉得门槛低一些了,这是一种中国方案,我们也期待着未来会有更多的中国方案。”
冯丹告诉九派新闻,在建议的具体实施方面,她建议在教育行业、金融行业、交通智能驾驶等多行业加快应用,行业数据有自己的特征,通过使用大模型对这些数据进行预训练处理,可以更好地在应用中进行推理,助力行业发展。
冯丹。图/受访者提供
[1]三大问题:推理应用、推理成本、推理标准
冯丹介绍,目前加快大模型推理存在三方面的问题。
第一,推理应用上,行业定制化困难,行业数据供给不足,导致模型应用效果不佳。她解释,不同行业具有独特的业务逻辑和数据特点,大模型推理需要针对性地开发才能有效应用,但目前缺乏通用的行业适配框架和工具,阻碍大模型推理在行业的快速落地。而模型应用效果也依赖于长期积累的庞大行业数据,当前,行业数据分散在各单位的“数据孤岛”中,很多行业的数据积累尚未达到一定量级。同时,数据流通共享也面临隐私、版权等问题,企业间难以实现数据的有效共享。
第二,推理成本上,算力不足仍是影响大模型推理成本的决定因素。DeepSeek通过算法创新和存储优化给出了降低算力成本的实践,但随着DeepSeek的推理能力提升,用户数也显著增长,近期也出现了因为算力不足而带来的服务质量下降。DeepSeek也带来了私域大模型的需求增长,随着大模型部署数量增加,中国整体算力不足和成本高企仍会影响推理成本。
第三,推理标准上,缺少符合中国行业应用特点的推理效能评估标准,应用选型缺乏依据。目前难以准确评估大模型在不同行业应用中的模型性能、数据质量、幻觉率、时效性等,不利于企业对模型的选择和应用。企业缺少对大模型推理的可信度,导致“重复造轮子”现象严重。在一些高风险领域,如金融、医疗等,模型可信度至关重要。推理效能标准可以保障推理过程中生成可靠的结论,并提供可追溯的推理过程,也可以为大模型的开发提供明确的目标和方向。
[2]三大建议:政策引导、技术创新、标准建设
为解决上述问题,她提出以下建议。
第一,政策引导,制定行业数据存储要求和流通规则,构建行业适配框架和工具,加快行业应用。加快制定国家数据资源储备战略规划,实施存力中心建设工程,制定数据资源存储要求。建议国家主管部门、各行业主管部门尽快出台相关政策。
第二,技术创新,设立新一代AI算法、新一代AI存储重大技术专项,支持关键技术持续发展。在科技创新2030、关键核心技术攻关工程、重点研发计划等中间增加新一代AI算法、新一代AI存储重大技术专项,并加大创新资金投入。此外,支持高校、科研院所、龙头企业共同攻关,将基础研究、技术创新、产业创新与市场应用有机结合,
第三,标准建设,建立符合中国行业应用的推理评估体系,掌握标准话语权。制定大模型推理在不同行业应用的评测标准,发布大模型推理效能评估国家标准,涵盖模型性能、数据质量、安全性、幻觉率、时效性、能耗比等多个维度;建立权威的大模型推理评测机构和平台,定期发布评测报告,为企业选择和应用大模型提供参考;推动国际标准制定。
九派新闻特派记者杨冰钰彭茸雯北京报道