在公开预览Sora过去10个月后,12月10日,OpenAI宣布正式向用户开放人工智能(AI)视频生成模型Sora,该系统可以根据文本提示生成逼真的视频。新版工具SoraTurbo可以生成最长达20秒的视频,并且可以提供这些视频的多种变体。据介绍,Sora将在10日开始向美国及其他市场的ChatGPT付费用户开放。
在演示中,OpenAI展示了Sora的新功能。该公司表示,该工具不仅可以通过文本提示生成视频,还能够基于静态图片和已有视频创建新的内容。例如,用户可以上传一段视频剪辑,Sora会生成扩展这个片段的后续画面,使视频变得更长、更完整。
同时,Sora还包含一个名为故事板(Storyboard)的选项,允许用户通过它详细描述希望视频在不同时间点发生的内容,从而更好地指导一系列片段的生成,用户可以浏览其他人创作的视频集锦。
据悉,自今年2月首次预告Sora以来,OpenAI便开始向电影制片厂、媒体高管以及经纪公司示好,OpenAI还允许一些艺术家、知名演员和导演试用该服务。
记者注意到,此次OpenAI正式上线Sora,并没有向预告时在中国市场激起巨大水花。事实上,“中国版Sora”正快速崛起。今年年初,Sora在发出60秒视频一鸣惊人后,迟迟不上线,多家中国厂商抓住机会,抢先入场,推出了视频大模型产品,包括字节、快手、阿里云、腾讯、美图在内的互联网厂商,以及Minimax、智谱、爱诗科技与生数科技等大模型初创等厂商都在快速跟进。
比如,在视频生成时长方面,快手可灵视频生成大模型上线,采用类Sora技术路线,视频分辨率最高可达1080p,时长最高可达2分钟,提供首尾帧控制、镜头控制等功能。在所需生成时间上,字节跳动自研的视频生成模型Seaweed仅需60秒即能生成时长5秒的高质量AI视频,相比此前业界平均所需的3至5分钟有所突破。
在应用落地上,OpenAI向导演提供试用,国产视频生成大模型在影视行业的应用探索也已经开启。今年9月,快手启动“可灵AI”导演共创计划。李少红、贾樟柯、叶锦添等9位导演,将依托可灵AI的技术能力,制作出品9部AIGC电影短片。9部短片将全部由可灵AI进行视频生成,导演完全依托视频生成大模型进行内容创作。12月6日,上述9部影片已完成首映。影视行业上市公司也纷纷拥抱AIGC,为主营业务赋能。博纳影业出品制作的AIGC生成连续性叙事科幻短剧集《三星堆:未来启示录》在抖音播出。该剧集利用AIGC技术完成了从剧本创作到视频编辑等多种工作。
“国产多模态视频大模型历经一年多迭代,已逐步提升对内容制作的赋能效果,拓宽了创作边界,预计后续AI影视领域商业化空间将打开。”开源证券表示。不过,业内人士也向记者表示,视频生成大模型拥有乐观的商业化前景的同时,从可用度而言,还未到大规模商用的阶段,仍很多技术难点需要克服,比如对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都是行业激战且有待提升的重要维度。