金融界2024年12月19日消息,国家知识产权局信息显示,度小满科技(北京)有限公司申请一项名为“一种文生图模型训练方法、文生图方法及装置”的专利,公开号CN119131194A,申请日期为2024年8月。
专利摘要显示,本发明提供一种文生图模型训练方法、文生图方法及装置,包括:将图文对输入至候选文生图模型中,每个图文对中包括样本图像及对应包括预设关系词以及身份信息的样本描述信息,通过候选文生图模型向样本图像添加预设噪声并基于样本描述信息对噪声图像进行去噪,得到预测噪声,基于预测噪声与预设噪声之间的噪声损失、样本描述信息与预设正负样本之间的对比损失得到目标损失,基于目标损失对所述候选文生图模型进行微调得到目标文生图模型。通过基于图像和关系词两方面损失对候选文生图模型进行训练,增强文生图模型对关系以及图像的学习能力,进而提高文生图模型基于用户描述输出的图像的准确性。
本文源自:金融界