中国电信申请推理优化方法专利,减少多租户大模型的GPU内存资源使用量

金融界 2025-01-08 15:11:55

金融界2025年1月8日消息,国家知识产权局信息显示,中国电信股份有限公司技术创新中心、中国电信股份有限公司申请一项名为“推理优化方法优化装置设备存储介质和程序产品”的专利,公开号CN119250207A,申请日期为2024年10月。

专利摘要显示,本公开提供了一种推理优化方法、优化装置、设备、存储介质和程序产品,涉及机器学习技术领域。其中,模型即服务的推理优化方法包括:响应于接收到的多个用户调用多个微调大模型推理的调用请求,生成第一请求集合和第二请求集合,第一请求集合对应于基础大模型的推理,第二请求集合对应于微调大模型的推理;基于共享冻结参数对第一请求集合进行推理得到第一批处理结果,基于非共享参数对第二请求集合进行推理得到第二批处理结果;合并第一批处理结果和第二批处理结果得到目标结果,将目标结果反馈至多个用户。通过本公开的技术方案,通过使不同租户共享冻结的参数进行推理任务的批处理,减少多租户大模型的GPU内存资源使用量,降低推理成本。

天眼查资料显示,中国电信股份有限公司技术创新中心,成立于2010年,位于北京市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本None。通过天眼查大数据分析,中国电信股份有限公司技术创新中心参与招投标项目79次,专利信息2233条,此外企业还拥有行政许可3个。

本文源自:金融界

0 阅读:0
金融界

金融界

财经媒体、互联网金融、财富管理