金融界2025年1月28日消息,国家知识产权局信息显示,阿里云飞天(杭州)云计算技术有限公司申请一项名为“大模型的训练方法、任务处理方法、设备、介质及程序产品”的专利,公开号CN119358709A,申请日期为2024年12月。
专利摘要显示,本申请公开了一种大模型的训练方法、任务处理方法、设备、介质及程序产品,其中训练方法包括:在任一训练轮次中,调用待训练模型基于多个训练文本输出多个输出文本,待训练模型包括大语言模型和至少一个扩展网络,任一扩展网络用于学习多个自然语言处理任务的相关知识,在任一训练轮次中大语言模型的第一参数处于锁定状态;根据目标数据确定目标损失,目标数据包括多个输出文本;根据目标损失更新至少一个扩展网络的第二参数,直至确定满足训练结束条件,得到多任务模型。本申请中,避免了知识遗忘问题,且提升了多任务模型的训练效率。
天眼查资料显示,阿里云飞天(杭州)云计算技术有限公司,成立于2021年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10000万人民币。通过天眼查大数据分析,阿里云飞天(杭州)云计算技术有限公司共对外投资了4家企业,参与招投标项目46次,专利信息58条。
本文源自:金融界