一个好消息,可灵AI这次来了波大的。
就在今天下午,快手上线了可灵2.0视频生成模型和可图2.0图像生成模型,全量开放,进他们家官网就能用。
一上来,快手的高级副总裁盖坤就直接摆数据,可灵2.0的文生视频模型甩了Veo2和Sora好几个车尾灯,图生视频也要比Runway的新模型Gen-4强不少。
甚至还在现场放话,把可灵2.0称作是“世界上最强大的视觉生成模型”。
虽说世超没去发布会现场,但结合官方放出来的demo、网友的测试,当然还有我们自己的一手体验,咱不敢打包票可灵2.0是最强的,但实力的确对得起现阶段“AI视频版本答案”这个称号。
这次升级比较出色的一个点,就是动态质量上的优化。
可灵AI官方 po 出来的案例,那效果可以说是非常惊艳了,随便拎出一个来,都可以称得上是百万镜头、千亿制作。
就比如这个,穿着长袍的人在漫天黄沙中行走,你别说,还真有点电影《沙丘》那味儿了。
可灵2.0发布后的第一时间,X上也有不少网友把自己的case发了出来。
拿已经生成好的图片,让可灵2.0跑一个灾难片场景。短短5秒的时间,可灵2.0把男人整体逃跑的动作流畅地表现了出来。
当然瑕疵也是有的,空中散落的传单大部分都糊掉了。
直接拿同一组prompt分别测试了可灵2.0和可灵1.6的效果。
就比如这个少女骑着海上摩托艇送外卖的视频,可以看到,可灵2.0对海上摩托艇的动态处理更逼真,不再是千篇一律的慢动作,发动机对于海浪的冲击是在变化的,反观可灵1.6的摩托艇,稳得有点太假了。。。
还有一个图片生成的视频,提示词是“她很生气”,可灵2.0和1.6的表现力高下立判。
前者的面部表情很生动,把对“生气”的理解变成了破口大骂,后者的“生气”,有点猜不出到底是生气还是无语。
看下来,大伙儿对可灵2.0的评价都还挺正向的,唯一的一点吐槽,可能就是价格真的有一点贵。。。
用可灵2.0生成一个5秒的视频,要花掉100积分,也就是10块钱。世超也只能用兜里仅剩的几十块钱,给大伙儿浅浅测评一波。
在动态效果上,我用可图2.0生成的地下室忍者图片,跑了一个模拟被忍者追杀的镜头。
prompt是这样的:忍者做完一个前空翻之后,举起手中的武器冲向镜头,镜头不断后移,随着地下室场景的变化,光线越来越暗。
半小时的等待时间里,我把同一组prompt喂给了可灵1.6。
1.6快是快了,但质量得打对折。说好的前空翻呢,往下蹲这一下算怎么回事??
再来看可灵2.0的结果,相比之下要顺眼多了。
虽说前空翻的动作一整个糊掉了,但好歹动作完成度是有的,举起手中的武器冲向镜头也理解得没毛病。在语义响应方面,做得确实还不错。
不过老实说,这个视频的动态效果没有我想象中的那么好,特别是在画面稳定性上,明显能看到手部、武器变形的地方。
再来看这个例子(prompt:拥挤的车流中,一只机器狗往前狂奔,镜头慢慢往右移动到机器狗的侧面,到达十字路口的时候,机器狗起跳,越过了一辆汽车,而后继续向前狂奔)
别的先不说,这个画面质感世超必须夸一夸,这机器狗的耳朵动起来就跟真的似的。而且在机器狗奔跑的过程中,没有看到特别明显的变形,画面流畅,地面上的倒影也都对上了。
就是镜头移动没能体现出来,还有越过汽车的方式,跟世超想象中的多少差点意思。
值得一提的是,这次可灵2.0还上新了一个叫做多模态编辑的功能。基于一个视频,咱可以进行替换、增加和删减元素。
世超用上面机器狗的视频试了下这个功能,再上传一张柯基的照片,让可灵2.0帮我把视频里的机器狗换成柯基。
大伙儿看看效果,评价一下?
原来的车流背景看不到特别大的变化,柯基的运动轨迹也跟机器狗基本一致。理论上,咱们还可以基于机器狗的视频做更多改动,比如把马路变成花田,或者再多加一只金毛之类的。
根据快手高级副总裁盖坤的说法,可灵定义了一种人和AI交互的新语言Multi-modal Visual Language(MVL)。
啥意思呢,就是以前咱们用文字跟AI说要生成啥样啥样的视频,最后的结果多多少少都会有偏差。但如果你多给一个图片和视频的参考,AI就能更懂你。
这么说吧,多模态编辑的功能让视频的可控性更高了,对于视频生成和视频后期编辑来说,都有不小的帮助。
所以测试下来,世超觉得可灵2.0在产品的深度和广度上,确实下足了功夫。不敢说已经能碰瓷摄像机了,但整体瑕不掩瑜,如果能把价格也打下来,那就更好了。
有一说一,自打去年6月快手推出可灵以来,满打满算也才一年时间不到。但无论是技术水平,还是全球知名度,可灵都是众多玩家里比较拔尖的那一个。
上个月快手发财报,还首次披露了一组数据:截至2025年2月,可灵AI累计营业收入已突破1亿元大关。
虽然在快手的整体营收面前,可灵的这丁点收入充其量也只是苍蝇腿。
但有个问题,目前市面上的AIGC产品收费且营收能干到1亿的,又有多少?
并且快手的财报中也提到,2024年第四季度,快手AIGC营销素材日均消耗超3000万元人民币,也就是说,有不少广告主开始选择用AI生成的素材来做营销。
而且快手CEO程一笑也表示,AI大模型预计可以把短视频营销素材的制作成本,降低60 - 70%甚至更高。
所以,快手完全有给AI提供稳定商业化的潜力。
如果可灵过后能够跟快手形成深度联动,不仅AI的商业化有着落,说不定也能借AI重做一个快手。