金融界2024年11月22日消息,国家知识产权局信息显示,北京奇艺世纪科技有限公司申请一项名为“一种图像生成方法、装置、电子设备及存储介质”的专利,公开号CN118982604A,申请日期为2024年8月。
专利摘要显示,本发明实施例提供了一种图像生成方法、装置、电子设备及存储介质,涉及人工智能技术领域。方法包括:获取第一文本,第一文本中包含至少一个人物的待利用描述文本;提取第一文本中包含的每一人物的待利用描述文本;按照镜头对第一文本进行拆分处理,得到各镜头的镜头描述文本;一个镜头描述文本表示:该镜头描述文本表征的镜头中的人物,以及该镜头中的人物所处的状态;基于每一镜头描述文本,以及该镜头描述文本中的人物的待利用描述文本,得到该镜头描述文本对应的第一提示词;基于预先训练好的第一文生图模型,对该镜头描述文本对应的第一提示词进行处理,得到该镜头描述文本对应的图像。保证同一人物在生成的不同图像中的连续性和统一性。
本文源自:金融界