就在昨天凌晨,AI文生视频的知名公司Runway在官网宣布,其文生视频模型Gen-3Alpha向所有用户开放了。与 Gen-2 相比,Gen-3 在保真度、一致性和运动表现方面迎来重大改进。
但是,不论是实际使用还是看网友实践,只能说有进步,也有缺点,一些生成的视频甚至可以用“抽象”来形容。
同样被认为是“下一代”文生视频的 Dream Machine的Luma AI在某些方面的表现更是堪称“癫狂”。从去年开始,AI文生视频就在很多人心中留下了深刻的印象,但最近的表现却不禁令人怀疑,AI视频真的有希望发展成人们设想中一句话生成任何自己想象中的影片吗?
一条视频10块,遇到抽象视频直接亏
Runway 的这次更新确实让很多人眼前一亮,最重要的就是生成视频的长度,已经从原先的 4s 翻倍到了 10s。并且在昨天全面开放后,不少网友进行测试发现,生成10s视频几乎不到一分钟,可以说不论是生成视频长度还是速度都跟很多同行拉开了差距。
当然,技术更新了收费标准也更高了。如果按照月包套餐计算,基础会员12美元一个月,只能拿到 625 的积分。而 Runway3生成一秒钟,就要消耗 10 个积分。换算下来,一条 10s 的视频价值 1.4 刀,约合人民币 10块。一旦生成出的视频不符合心意就等于10块钱打水漂了,所以视频的质量才是重点。
普通的空镜和人物长镜头太没有挑战性了,于是我们想到了去年好莱坞影帝威尔·史密斯在社交媒体上发的AI整活视频。没错,就是那个吃面的镜头,当时让无数网友震惊但最后发现其实不是AI生成的视频而是本人亲自出镜拍摄的恶作剧。
吃面在普通人看来是很简单的一件事情,但在AI眼中却犯了难。使用工具的动作是否正确、嘴部咀嚼动作的连贯性、面条能否随着吞咽动作的消失,都十分具有挑战性。
很显然,Rumway生成的整体流程都比较顺畅,但依旧有两个严重缺陷。第一是对于舌头的形象不精确,一度让人以为这是蜥蜴的舌头,第二则是咀嚼面条时夸张且抽象的脸部动作,一个普通人吃面的动作却硬是生成出了外星人到地球做客的既视感。
(图源:差评X.PIN)
同样是在吃上面,曾经Sora也有一个吃汉堡的动作,但却显得十分自然。而现在,Sora还没有太多动作,所以也让人们的视野放在了其它同类型的AI工具上,快手的可灵AI也凭借其出色的表现成功出圈了。
(图源:差评X.PIN)
说实话,这真不是快手工作人员自己拍摄然后上传的嘛,这也太逼真了吧。上浮的热气,碗边的油渍,面条消失的自然度,和现实几乎一模一样,不过从面条一开始是方便面吃到嘴里变成普通拉面这一瑕疵却反而让我确定了它不是真人拍摄的。
快手的可灵AI居然能够强过Runway是一件十分震惊的事情,毕竟前一段时间许多人的关注点都在Sora、Pika、Runway 、Luma等国外软件上,很难想象到国内居然也有像快手可灵一样的AI工具发展到如此程度了,更重要的是还免费。
AI视频最被人所期待的就是能够正确的描绘现实世界的物理规则,但这也恰恰是最难的,吃面就是最直观的体现之一,虽然Runway的表现不是最好的,但却有比Runway还要奇葩的存在。
“癫狂”的人体变形体操,Luma你怎么了
最近让网友热议的不只有Runway的全面开放,还有Luma的癫狂体操表演视频。这段视频让网友们觉得即搞笑又恐怖,实在是因为几乎每一秒都在像变形金刚一样变换身体形态。
难以想象这是曾被寄予厚望的Luma AI生成出的视频,就连Yann LeCun,这位著名的AI专家都开麦批评了Luma:“视频生成模型不理解基本物理知识。更不用说人体了”。
自 Sora 问世以来,“AI 是否理解物理规律”这个话题就被越来越多人关注。许多人看到一些视频里的动作十分逼真,就认为只要 AI 视频生成模型不断进化,生成的视频质量趋近完美,就意味着它理解物理了,但这可能没有那么简单。
毕竟现实世界不仅仅是物理,还有人体数据的分析理解。否则可能会像Luma的视频一样,体操运动员落地时脚下的垫子有逼真的物理反馈,但人在空中没有脑袋只有四肢也仍然“惊悚”。
科技旋涡认为,AI生成视频需要研究和进步的地方还有很多,无论是各种数据的投喂和训练还是有关物理世界的学习理解,都不是一蹴而就的事情。虽然目前市面上的这些 AI时常出现一些笑掉大牙的错误,但进一寸有一寸的欢喜,AI的发展需要时间,我们也应当耐心一些。
写在最后
每一个AI工具在发布时都让人震惊,但演示时的表现却颇有一种卖家秀与买家秀的差异。每一款AI工具在侧重点上都有所区别,许多爱好者经常要用多款工具才能制作出一个满意的作品,但只有发现问题才能更好的解决问题。
给岁月以文明,而不是给文明以岁月,这句话本意虽是对人类文明发展的批判,却恰好符合当下AI发展的态度。AI的发展不能仅仅只是满足于消费和物质层面,还需要关注更深层面的提升和创新,不断地反思和完善技术,才能真正地实现人类AI发展的新纪元。