百度国际申请基于大模型的文本训练样本的生成方法专利,提高了微调后的第二大模型的泛化性

金融界 2024-12-21 16:48:35

金融界2024年12月21日消息,国家知识产权局信息显示,百度国际科技(深圳)有限公司申请一项名为“基于大模型的文本训练样本的生成方法、装置及电子设备”的专利,公开号CN119151012A,申请日期为2024年9月。

专利摘要显示,本公开提供了基于大模型的文本训练样本的生成方法、装置及电子设备,涉及人工智能技术领域,具体为大模型、模型微调、深度学习、自然语言处理等技术领域,可应用于基于人工智能的交互场景,比如生成式搜索、智能助手、智能客服等应用场景。具体实现方案为:对至少两个查询问题进行聚类,得到至少两个查询问题簇;从每个查询问题簇中获取第一查询问题;将第一查询问题作为示例,通过第一大模型生成设定主题下的至少两个第二查询问题;基于第二查询问题,生成用于对第二大模型进行微调的第文本训练样本由此提高了生成的第文本训练样本的多样性,进而基于生成的第一文本训练样本对第二大模型进行微调,提高了微调后的第二大模型的泛化性。

本文源自:金融界

0 阅读:1

金融界

简介:财经媒体、互联网金融、财富管理