【眼观】AI图生视频大火:大模型向动态大迁移的时代来了?

第三眼界 2023-12-12 09:47:44

高校学生AI视频刷屏背后:AI大模型技术散落人间

最近,清华大学深圳国际研究生院的学生团队用AI工具制作了一部关于深圳的动画短片《山·海·城》。短片从山、海、城三个篇章探讨了人、环境、城市与科技之间的共生关系,通过大模型算法实现生成式艺术,描绘出科技视野中的沧海桑田、昼夜晨昏里的城市风景,展现了赛博朋克式的科幻未来。

据悉,该作品运用了CLIP模型与扩散模型等创新型人工智能技术。通过前期收集大量深圳建筑特征、城市规划等视频资源,将视频数据逐帧生成照片,随后借助不同的大模型算法进行风格迁移测试,最后将图片逐帧合成视频。

无独有偶。今年9月份,上海交通大学文创学院2021级学生制作的AI短片,同样引发热议——不仅在交大人的朋友圈引起轰动,更得到大学官方视频号的转发。

视频内容以校园内以知名交大历史人物命名的十二条路为主线,串联起十余位大师的故事,并传达了交大的精神。其精美的制作画面,配上气势磅礴的音乐,确实很有感染力。

在制作过程中,其同样采用了文生图、图转视频的做法,运用的工具包括Midjourney(文生图)、InsightFaceSwap(换脸)、Pika labs和Runway Gen-2(图转视频)等。近三分钟的内容时长,该学生仅仅花了2周左右的时间,并且也不是全天候投入,对于很多人来说,这样的效率简直不可想象。

高校出现拥抱AI技术的现象,值得我们欣慰,这意味着中国高校教育不再是自我封闭的象牙塔,而成为真正能培养未来科技型创新人才的摇篮。莘莘学子对新科技的好奇和探索,也不免让我们对中国高校未来科技教育充满希望。

说回到短片本身,虽有不少惊艳之处,但碍于制作者的水平、打磨时间,以及AI工具本身的限制,生成的作品仍有不少提升空间。

在ChatGPT的引爆下,AI大模型的发展可谓突飞猛进。全球AI大模型雨后春笋般蜂拥而入,中国这边也紧随其后,百度、阿里、腾讯、360、讯飞等纷纷推出自家的AI大模型,文生图、图生视频,甚至文生视频都在飞速发展。

在数字人方面,得益于AI大模型的发展,目前很多工具已经可以做到以假乱真的地步。

就开篇的两个短片来看,在视频逼真度方面还是稍微差一些——当然,这可能跟制作手段有关。而即便是全球领先的AI视频工具,生成的结果也很不完美,常常让人觉得匪夷所思,甚至有点恐怖。

不过可以畅想的是,未来随着AI技术的进一步发展,生成更为逼真且流畅的视频应该会成为稀松平常的事情。

以主机游戏为例,借助强大的游戏引擎(尤以虚幻引擎为代表),游戏画面的逼真程度已经不亚于现实世界,这项技术将来如果跟AI视频工具做完美结合,那么其结果将会是颠覆性的,称为AI视频革命也毫不为过。

就目前的AI视频来看,其技术尚处在初级阶段,由于机器不具备“思考”能力,很多工作需要由人来完成,想要实现想要的视频效果,也需要人不断做技术调优和参数修正。而这个过程中,事情的繁杂程度也是不可想象的。

“一段10秒钟60帧的视频需要将600张图片进行3个小时的风格迁移,这必须消耗大量的时间进行实验。” 《山·海·城》项目成员介绍说,创作过程中最大的难点在于,要将庞大的深圳城市数据转化为艺术生成的照片,并赋予视频故事性。

不过虽然不容易,现阶段的AI视频还是具备很大的利用价值。比如用在影视作品的动画预演阶段,取代目前以简笔画风为主的影视效果初览;此外,涉及到项目竞标或初期视频提案的时候,AI视频也可以节省大量时间,以更具视觉风格和画面冲击力的动态画面,赋能方案汇报。

如今,AI绘画已经展现出强大的发展潜力,而AI作品是否属于艺术也存在很大争议。对此,很多艺术界人士对AI作品表达了自己的看法。“艺术不仅是一个创作的结果,更是人类独有的生命体验过程,这是AI所无法替代的。” 清华大学深圳国际研究生院设计学副教授聂晓梅认为。相信持此观点的人不在少数。目前,AI确实无法替代人类,但站在更宏大、更长远的角度看,当AI进化为AGI(AGI被认为是AI的更高层次,可以实现自我学习、自我改进、自我调整,进而解决任何问题而不需要人为干预,而这是AI发展的必然趋势),具备独立思考能力的时候,AI作品也会具有独特的艺术价值。奈飞出品的《爱&死亡&机器》第一季当中的短片《齐马蓝》便是这种例子的生动写照。

总的来看,在艺术领域,AGI不会取代人类,但是会跟人类分成两派,彼此独成一体。艺术不分高低,人类的艺术和AGI的艺术都值得尊重。

结语:

继AI文生图之后,AI图生视频也开始大放异彩,不远的将来,或许会产出更加令人惊喜的作品。AI大模型技术飞速发展,我们人类也在逐步适应和发掘AI大模型的优势和价值。

最近,OpenAI神秘的Q*模型被爆料,该模型显示了解决数学问题的前景,标志着AI向AGI能力的飞跃。

由此来看,AGI的时代或许已经不远了。

0 阅读:23

第三眼界

简介:分享商业洞察,开拓思想新知