当不少人还在为剪个看得过去的视频而烦恼时,人工智能早就盯上了视频剪辑,这一次,或许要比2023年的ChatGPT更让人惊叹——输入寥寥数语,便能生成效果炸裂的60秒视频!
自这个名为Sora的新物种横空出世后,人们不免感叹,视频行业的从业者很快要失业了。
当然,危机与机遇总是相伴而行。Sora的推出或将为市场带来新的机会。站在当下,更多人开始关心,Sora能否像它的前辈ChatGPT那样,带来人工智能领域的颠覆效应,从而催生国内科技领域又一股创业狂潮?
01 AI领域的一颗“重磅炸弹”
2024年春节假期还没过完,美国开放人工智能研究中心(OpenAI)便扔出这枚重磅炸弹,视频生成模型Sora震惊全球。
从目前公开的多条Sora生成视频来看,无一例外地具有共同特征:场景逼真、细节丰富、复杂的摄像机运动、充满活力的情感等。从Sora官网公布的视频可以看到,无论是人物脸上的雀斑,还是水中的倒影都格外逼真。以至于不得不怀疑,这是实拍而非AI生成。“几乎以假乱真”!
图源:OpenAI官网
图源:OpenAI官网
据称,Sora使用的是Transformer架构,可根据文本指令创建现实且富有想象力的场景,最终生成多种风格、不同画幅、最长为一分钟的高清视频。换句话说,只要给Sora一些提示语,它就能生产出一条高质量的短视频。不仅如此,它还可以根据静态图像生成视频,扩展现有视频或填充缺失部分。
根据官方介绍,OpenAI正在教人工智能理解和模拟运动中的物理世界,目标是训练模型,帮助人们解决需求现实世界交互的问题。
而对于外界普遍关注的安全问题,OpenAI表示,在提供Sora之前,OpenAI已采取几个重要的安全措施。如与红队队员合作,他们是错误信息、仇恨内容和偏见等领域的领域专家,对模型进行对抗性测试;技术层面,OpenAI还开发了一些工具来帮助检测误导性内容,如检测分类器,可以告诉OpenAI一个视频是什么时候由Sora生成的。
很明显,根据目前的公开信息来看,相较于此前人工智能被群嘲为“人工智障”,Sora的进步肉眼可见。
也因此,在Sora发布后,毫无悬念地引爆行业热情。
马斯克、杨立昆、贾扬清、谢赛宁、周鸿祎、李志飞等科技圈大佬纷纷下场评论。周鸿祎迅速“追星”,李一舟火热售课被全网群嘲不得不下架。
一众上市公司夹杂着“颠覆性、里程碑、加速器”等关键词,挑动资本市场起舞;
一些视频、影视从业者也关注起这一新工具,一方面希望借此提升自己的实力,一方面也在担心自己饭碗问题。
此时的Sora,为科技圈贡献了龙年第一个热点。
只是,热潮过后,理性回归。从2023年的ChatGPT到2024年的Sora,相同的问题也摆在AI厂商面前:要不要跟进,能否追赶?能否快速场景落地?
02 能否带来新一轮AI行情?
在国内资本市场,热点通常可以带来一波行情。
2月15日Sora爆发,至2月19日A股开盘时,A股市场上相关题材股表现尤为明显。19日当天,昆仑万维(300418)大涨17.09%,因赛集团(300781)自19日起连续3个涨停,并在短短5个交易日内,股价从近年低位的21.12元/股暴涨至54.72元/股。Wind Sora指数节后4日累计上涨超90%。
随后,相关概念股也出现明显分化。当虹科技、新易盛、万兴科技、东方国信等在此后的几个交易日内出现了不同程度下跌。
一如2023年的ChatGPT横空出世,Sora在资本市场上搅动的风云不容忽略。
需要注意的是,Sora虽然复刻了前辈ChatGPT的轰动效应,但市场上似乎并未复制出创业之风,取而代之的是创业者的理性思考。
一位AI创业者对壹度Pro表示,文生视频并非新鲜事,但国内现有的文生视频最大的硬伤在于“时长”,其次是目前生成的视频相对简单。全球范围来看,Runway和Pika被认为是视频生成赛道的引领者,但前者生成的视频仅4秒,后者则为3秒。从这个角度看,Sora当下的能力属于超越级别的。
无界AI联合创始人马千里在接受北京商报采访时曾提到:“三四秒和一分钟,是天差地别的。”他认为,对于AI生成视频来说,随着生成时增长难度指数级上升,更长的视频意味着更高的一致性要求、更详细的画面描述,对算力的消耗也是远超此前水平的。
面对超高的算力成本,不少国内创业者趋于理性。“没钱、没卡、没人才”,在谈及是否要跟进时,不少从业者表示“现实困难很多,未来的前景或许没有那么大。”
也有从业者表示,虽然Sora公开了一些官方制作的视频,但其场景落地的现实性还有待验证。“OpenAI CEO阿尔特曼,非常擅长营销,他一定会通过营销方式最大程度地放大OpenAI的估值。一年一个爆点,或许正是其目标。”
广发证券分析认为,Sora的主题意义更为显著,商业化进程仍需观察。一方面,技术文档提到的局限性需逐步解决;另一方面,版权合规、内容伦理课题仍是AIGC类应用需要克服的挑战。同时,该分析报告也指出,在底层基础技术原理上,Sora其实并没有脱离大语言模型本质,仍是基于深度学习的框架。
03 AIGC行业的想象力
值得肯定的是,Sora的破圈,让外界看到AIGC产业更多的可能性,从而推测国内AIGC产业有望加速。
首先是政策扶持与指引。2月19日,国务院国资委召开的“AI赋能 产业焕新”中央企业人工智能专题推进会提到,中央企业要主动拥抱人工智能带来的深刻变革,把加快发展新一代人工智能摆在更加突出的位置。10家中央企业签订倡议书,表示将主动向社会开放人工智能应用场景。
近段时间以来,新质生产力的概念被反复提及,其中,AI有望成为制胜新赛道,未来相关应用新场景将刷新想象。
同时,市场调研也证明了这一趋势。艾瑞发布的《AIGC场景应用展望研究报告》称,2023年仅上半年生成式AI在资本市场上便募集约141亿美元的资金。并预计2024年AIGC在资本市场上仍然是投资热点。
事实上,过去两年,AIGC早已风靡全球。通过人工智能生成内容,让人可以简单、便捷、低成本地借助AI力量完成文本、图片、视频、音频等多媒体内容的高效高质量生产。
2022年底,抖音“AI绘画”火出圈,用户只需要输入一张图片,AI就可以根据图片生成一张动漫风格的图片;2023年,小红书推出“此刻”,AI基于用户输入的文字自动生成配图,帮助用户完成多媒体内容制作……
“Sora将改变整个AIGC的方向,人工智能将主导文字以及影响创作影响。这并不是对Sora的过度神化,而是基于对当前人工智能发展趋势的深入理解。”中国信息协会常务理事、国研新经济研究院创始院长、数智未来科学院首席经济学家朱克力在接受封面新闻采访时表示。在他看来,Sora并非孤立存在,而是AIGC时代的缩影,更是人工智能大模型发展的一个标志性成果。
方正证券持相似观点,其分析师郑震湘领导的团队在题为《AI巨轮滚滚向前》报告中直言,文生视频大模型Sora震撼登场,AIGC新时代已至。因为在算力需求大、高质量数据短缺、可控性较差等挑战下,文生视频算得上是AIGC的高点。
近年来,随着手机、机器人等新品持续亮相,AI终端已经来临,全球芯片厂商的新品性能水平攀升,同时,助力AI在诸如PC、汽车、智能家居等终端场景的渗透。
由此,我们看到联想正加速AI PC进程,规模化落地逐步推进;OPPO发布全新的AI战略,不仅推出AI超级智能体,还上线了AI Pro智能开发平台,提供AI插件,与开发者共建生态;海尔智家将大模型技术落地应用到用户家里以及终端体验上,让AI更理解生活。
而让AI走进现实,才是科技进步的最大要义。