成都开心音符申请音频和视频生成方法专利,生成的目标视频和音频同步性高

金融界 2025-01-16 11:13:49

金融界2025年1月16日消息,国家知识产权局信息显示,成都开心音符科技有限公司申请一项名为“音频和视频生成方法、电子设备和计算机可读存储介质”的专利,公开号CN119295618A,申请日期为2024年12月。

专利摘要显示,本申请提供一种音频和视频生成方法、电子设备和计算机可读存储介质,该方法包括:获取目标文本信息;将目标文本信息输入预先训练完成的音视频生成自回归模型,获得目标视频令牌数量以及目标音频令牌数量;对目标视频令牌数量进行解码获得目标文本信息对应的目标视频;对目标音频令牌数量进行解码获得目标文本信息对应的目标音频,由于目标视频令牌数量根据目标文本信息、第一解码函数、预测视频令牌数量以及预测音频令牌数量生成,目标音频令牌数量根据目标文本信息、第二解码函数、预测视频令牌数量以及预测音频令牌数量生成,因此,目标视频令牌数量和目标音频令牌数量实现视频信息和音频信息的关联,生成的目标视频和音频同步性高。

天眼查资料显示,成都开心音符科技有限公司,成立于2019年,位于成都市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本100万人民币,实缴资本100万人民币。通过天眼查大数据分析,成都开心音符科技有限公司知识产权方面有商标信息14条,专利信息12条,此外企业还拥有行政许可5个。

本文源自:金融界

0 阅读:0