金融界2025年1月15日消息,国家知识产权局信息显示,百度国际科技(深圳)有限公司申请一项名为“基于大模型的多模态文档的信息提取方法、装置及智能体”的专利,公开号CN119294503A,申请日期为2024年9月。
专利摘要显示,本公开提供了一种基于大模型的多模态文档的信息提取方法、装置及智能体,涉及信息处理、人工智能等技术领域。具体实现方案为:获取多模态文档的页面集,所述多模态文档包括多页内容,所述页面集中包括各页内容的页面;基于所述多模态文档的页面集,采用预先训练的多模态内容提取模型,提取所述多模态文档的文本内容所述多模态内容提取模型基于大语言模型训练而成;所述多模态内容提取模型能够提取所述多模态文档中每一种模态的文本内容;基于所述多模态文档的文本内容,采用预先训练的信息抽取模型,进行信息抽取,所述信息抽取模型也是基于大语言模型训练而成。本公开的技术,能够有效地提高信息提取的准确性和信息提取效率。
天眼查资料显示,百度国际科技(深圳)有限公司,成立于2010年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本2000万美元。通过天眼查大数据分析,百度国际科技(深圳)有限公司参与招投标项目11次,知识产权方面有商标信息17条,专利信息209条,此外企业还拥有行政许可52个。
本文源自:金融界