过去两天,最火的一个英文单词是什么?自信地喊出来:“Sora!”
一年前曾经以 ChatGPT威震天下的OpenAI再度推出革命性的文生视频大模型Sora,其带来的震撼感令人似乎重回AIGC元年。过去一年经历了疯狂、浮躁和冷静的AI行业,这下子有理由再嗨一次了么?
从OpenAI官网发布的视频来看,品质极高,纯纯电影级别的。其生成的60秒视频的提示词文字(翻译后)为:“一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。”
视频也高度反馈出了提示词所要求的视频要素,可以说其质量与国内目前的拼接级文生视频比是一个天一个地,也远强于先行者Pika。
从技术创新方面亮点也非常多,比如不但关注视频生成对提示词的精确体现,也同样把握物理世界的真实存在。也就是说,特别真!
此外,还有不少特别玄乎的东西,比如可以加插件、补丁来完成特定的视频开发功能,比如搞个“清洁”补丁让图像更为清晰。这里我们就不再多说了,反正就是强大无比。
应该说,Sora的发布,让我们对AI主题投资价值的预期又一次提升,起码从心情上可以小嗨一把。
相比之前AIGC主打文字聊天,以及“多模态”搞搞图片、表格输出,Sora带来的体验效果太爆炸了。这不,网上舆论已经炸锅,带动AI人气再次回归!
木鱼ETF也从谨慎乐观的角度整理了文生视频对人工智能主题投资带来的潜在影响分析,我们认为“文生视频”的AIGC跨越发展,对于版权方、影视制作、短剧游戏开发、算力和大模型等方面都有积极的推动。
Sora的出现,将使文生视频的门槛预期将大幅降低,那么IP版权方的小说、漫画等内容转换为视频甚至连续剧的门槛将极大降低,从目前Sora的演示视频来看,已经有能力生成有复杂场景描述的精确构图。很可能,过往需要制作几个月的小说漫画视频,可能几天就能完成了,因此对于短剧和互动游戏开发乃至大型影视制作来说,门槛都有望大幅降低。
拿上面的视频来说,提示词内容就是一只猫企图叫醒酣睡的主人,但主人选择忽视,而猫就换了唤醒战术。最终视频效果可以说令人非常满意,这种程度的文生视频应该足以覆盖大多数的短剧制作。影视传媒公司有较为确定的受益预期,就是苦了演员了。
从一个演示视频来看,Sora的视频素材中也融合了大片元素,一个充满科幻感的画面令人十分感慨。我们可以大胆预期,用文生视频的电影将在两年内公开上映!
文生视频同样对游戏制作来说有望降低成本,比如大量的CG动画以前是要一帧帧做出来的,而现在Sora用“camera”视角做出来的动画就与极限竞速等3A大作的质量非常接近,这也是让人眼前一亮。
用过Midjourney和stable diffusion的朋友知道,文生图片可以选择多重画布风格,而Sora同样可以加工多种风格的“小电影”。相信学习下“国风”动漫,也能做出国漫风格了。短期国内大模型虽然达不到这种效果,但传媒一侧可以直接用,而国内大模型迟早会有类似产品。
那么从业务支撑角度,文生视频大模型以及算力的逻辑再次增强。首先文生视频大模型给现在做基础多模态大模型企业带来了想象空间,部分上市公司已经号称有相关业务。而算力方面,生成视频比之前生成聊天和图片,所需要的算力是数十倍上百倍的增加。AI算力建设,真是永无止境。
当然,我们必须要说,国内AI大模型技术发展由于种种限制,已经显著落后于国外,因此可以说,AIGC终端使用方的确定性更强一些,大模型则期待有真正的创新企业成功突围。而算力方面,也受到AI芯片禁用掣肘,目前仅CPO光模块预期较为确定,就是市场规模不会太大。TMT虽然整体会受益于AI的爆发,但是长期确定性强的方向还是需要辨别甄选。
好了,Sora的发布让我们这些已经从AI革命受益的创作者再度欢欣鼓舞,更easy的未来仿佛伸手可触。唯一的遗憾,就是国内大模型水平差距还是很大,多么期待一波国产替代和算力来个双剑合璧啊。仅从Sora事件,我们认为给目前的游戏传媒、算力等AI核心板块的修复行情,算是加了把火,希望不负我们长期看好的期待!最后,中国AI,加油!