百度国际申请基于大模型的多模态内容提取模型的训练方法及智能体专利,有效提高训练的多模态内容提取模型的准确性

金融界 2025-01-15 21:22:06

金融界2025年1月15日消息,国家知识产权局信息显示,百度国际科技(深圳)有限公司申请一项名为“基于大模型的多模态内容提取模型的训练方法及智能体”的专利,公开号CN119294504A,申请日期为2024年9月。

专利摘要显示,本公开提供了一种基于大模型的多模态内容提取模型的训练方法及智能体,涉及信息处理、人工智能等技术领域。具体实现方案为:采集多个多模态文档中各多模态文档的各页内容的页面,生成页面库;对于页面库中各页面,采用预先训练的多模态大模型,提取页面的文本内容;基于各页面的文本内容,构建适用于监督微调任务训练的第一训练数据和适用于直接偏好优化任务训练的第二训练数据;分别基于第一训练数据和第二训练数据,对多模态内容提取模型进行监督微调任务的训练和直接偏好优化任务的训练;多模态内容提取模型比多模态大模型的参数少。本公开的技术,能够有效地提高训练的多模态内容提取模型的准确性。

天眼查资料显示,百度国际科技(深圳)有限公司,成立于2010年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本2000万美元。通过天眼查大数据分析,百度国际科技(深圳)有限公司参与招投标项目11次,知识产权方面有商标信息17条,专利信息209条,此外企业还拥有行政许可52个。

本文源自:金融界

0 阅读:0
金融界

金融界

财经媒体、互联网金融、财富管理