杭州沧海观止申请基于知识图谱的领域内模型训练专利,提高模型训练效率

金融界 2025-01-15 21:22:02

金融界2025年1月15日消息,国家知识产权局信息显示,杭州沧海观止科技有限公司申请一项名为“一种基于知识图谱的领域内模型训练方法和系统”的专利,公开号CN119294461A,申请日期为2024年12月。

专利摘要显示,本发明公开了一种基于知识图谱的领域内模型训练方法和系统,属于人工智能技术领域,方法包括:构建领域知识图谱;从领域知识图谱中提取新增高频专业术语;为每个新增高频专业术语生成新增词元并集成到预训练大语言模型的词表中得到扩充后的词表;利用知识图谱中的实体嵌入向量初始化词元的词嵌入向量,基于扩充后的词表中新增词元的词嵌入向量调整预训练大语言模型的词嵌入层并进行再训练;将基于领域知识图谱构建的问答对经专家审核完善后作为指令微调数据集,对再训练后的大语言模型进行微调进行模型性能评估和持续优化本发明能提供更为全面的词表并提高模型对特定领域词汇的理解能力,提高模型训练效率,适用于领域内大语言模型训练。

天眼查资料显示,杭州沧海观止科技有限公司,成立于2023年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本100万人民币,实缴资本10万人民币。通过天眼查大数据分析,杭州沧海观止科技有限公司知识产权方面有商标信息5条,专利信息5条。

本文源自:金融界

0 阅读:2
金融界

金融界

财经媒体、互联网金融、财富管理