这也许不是梦境,大概就在不远的将来,我们的科技场景会变成这样:
只要我想,“我”可以画出一架翼展超过一公里的飞机,如果你觉得这样的飞机没法起飞,我还可以通过想象,瞬间将它变成视频,我会说:“你看,这架飞机没有任何问题”。
翼展超过一公里的飞机能起飞吗?当然不能——但只要我想,并将想法告诉计算机,它就有可能实现。
听起来,这真是一个超酷的科幻场景,如果我还想骑着扫帚飞,AI就能绘制出我想象的场景——无论是图片、视频都可以。
现在,藉由技术的进步,这种夸张的想象力已经一步步成为现实——AIGC和其身后的学习模型,正在让“每个人成为创造世界的艺术家”变为可能。
在去年,AIGC(生成式 AI)在开启了影音技术方面的应用。从AI绘画到生成短视频,从写作到与ChatGPT聊天,你能感觉到人工智能从曲高和寡的实验室走出,在普通人面前展示出非凡的技能。
在中国,AIGC一样迷人又新奇。
1月10日,科技公司百度举办了第五届百度 Create AI开发者大会,大会将AIGC应用到每一个环节——从现场歌曲创作到内容制作、幕后、大会脑图甚至现场作画,都有AI在其中参与。
而在这背后,是技术精进、AI“学习”的成果。而不断“机灵”的AI,实力不止展现在舞台。
百度CTO王海峰在Create大会上介绍:从深度学习技术兴起,到产业链的形成,再到深度跨界融合,深度学习已经进入了一个全新的发展阶段,“深度学习+”。
多年来,百度对于“深度学习+”的布局是多维度的:从技术角度,深度学习+知识,从产业角度,深度学习+上下游产业,从应用角度,深度学习+千行百业。而深度学习平台加上大模型,贯通了从硬件适配、模型训练、推理部署,到场景应用的全产业链,夯实了产业智能化基座,会进一步加速产业智能化升级。
一切看起来即清晰又迷人——通过深度学习,AIGC“让每个人成为创造世界的艺术家”这种“科幻”得以付诸实现,在更广泛的领域,AI技术同样让这家老牌科技公司,展现出新的魅力。
Create大会,一场AIGC的百度秀场如何解释AIGC——它是真正的AI生产力。
不同于AI控制的生产线机械臂,那些看似复杂的装配工作,仍需要工程师制定严谨的流程和精确的数据——现在科技公司赋予AI“思想”,你只要给出一个想法,AI就能创造一个世界。
即便这听起来像是AI的“玄学”,到生产力,但AIGC正以各种方式闯入人们的生活中。
比如在去年8月,当那幅《太空歌剧院》在艺术大赛获奖的时候,还没人相信它是由AI“创作”;但接下来,红杉的一篇文章《Generative AI: A Creative New World》(一代人工智能:一个创新的新世界)火爆全网,作者不仅描述了AI的创造力,还进一步指出了一款AI“杀手级应用”将很快出现。
请注意,仅就这篇“指明未来AI道路”的文章来说,它的作者不是人类,是个叫GPT-3的生成式AI。
还有前一阵,AI实验室OpenAI推出的AI聊天机器人ChatGPT,它上线的五天里迅速积累100万用户,虽然ChatGPT还不能和你对春联,但可以逻辑清晰的回答类似“颜值是否代表一切”这样的问题。
ChatGPT说:这种说法是不正确的……
再往前看一点,早在2015年,谷歌就在AI上有所行动,那时他们在一篇论文中介绍了神经网络架构,这是个非常酷的发明,或者可以说是GPT-3和ChatGPT的祖师爷。
现在,类似AI“创造世界”这样具有未来主义的描述,正在不断接近现实——来自中国的科技公司不甘心只停留在“描绘AI蓝图”这样的境地,它们正在用基于AIGC的技术干点漂亮活。
比如1月10日的2022百度Create大会上,开场视频便是数字人希加加在不同维度的Create(创造)世界跑酷穿梭;更有数字人乐队演绎歌曲——从作词、作曲到编排,全部是由AIGC生成;整场大会当然有专业制作人员参与,但AI这次加入了各个环节之中,整个创排过程混合了人类和AIGC的“脑洞”,使得大会真正具备了“Create”的特性。
Create大会看起来真像一个科技公司的AIGC秀场,但其背后技术平台的实力,以及“人机共创”的新模式——这甚至可以看做是为“人人都是艺术家”而迈出的最为深远的一步。
文心大模型如何成为内容生成力?想象一下,若让AIGC创造世界,这家伙要学习不同的文化、不同的创作方式、不同的理念,也许还要懂点美学概论……
于是工程师们创造了一个可以学习的模型,让AI得以更懂艺术创作。在百度,这个模型叫做文心。
通过学习,文心成为天才。
比如要拍一部电影,AI一个“人”便兼职了编剧、导演、演员、摄影师、剪辑师、美术师、服化道等等——这在人类看来是不可能的事情,AI做起来非常简单。
现实中,作为“天才导演”的AI已经完成一些简单的任务——百度APP里有些视频内容,是AI“导演”,将百家号的图文内容自动转换成视频。
而更复杂的AIGC学习和生成,背后则有着这一套深不可测的方法和逻辑。
比如在训练“文心ERNIE 3.0”中,工程师为AI灌注了百科、小说、新闻、戏剧、诗歌等无标注数据——还记得哆啦A梦中有一个放在书页上的转印转知识面包吗?你可以理解工程师不断将印有知识面包喂给文心模型。
“吃下”百余种不同形知识的文心,成为一个真正的“杂学家”——会写摘要、对对联,翻译、分类、阅读理解,并且掌握了几十类自然语言。
在另一个模型,“文心 ERNIE-ViLG 2.0”中,通过训练逐渐成为一位AI美术室、插画师。现在,你只需要在屏幕上输入一个想法,AI便可以据此进行创作,生成一幅令人惊叹的画作。
AI背后的操纵者,总会感慨人工智能的创作成果与他的想法如此接近,这恰恰是因为AI学会了分析你的想法。
工程师为AI学习添加了知识增强的扩散模型——简单说就是,AI不仅能分析你这段想法中的语义,同时能通过拆解描述,找到对应的图像。不仅如此,AI还能在图像的底稿、轮廓、着色等不同阶段,选择不同网络来进行建模。
最终,AI生成的图像,不仅精美,与人的想法也如此接近。与其说这是AIGC的生产力,不如说这是机器学习带来的力量。
所以AIGC真的是一个合格的艺术家,从编剧到运镜,从桥段设置到画出分镜,乃至渲染、剪辑、添加特效,这些以往需要超大制作团队才能完成的任务,AIGC都能轻松应对——毕竟,文心模型在权威公开数据集 MS-COCO 上刷新 SOTA 效果,性能已经远远超过了国际上的同类技术。
人人艺术家?百度的AI软实力有一点需要注意,AI终究是AI,并不会主动为你做点什么。
无论AIGC有多么强大,驱动其完成各种任务的,始终是背后的人。而通过AIGC进行创造,本质上是让“每个人成为创造世界的艺术家”这一梦想成为现实。
反过来说,现实中成为“艺术家”是一件可望不可及的事情,但AIGC整让此变得简单。
今年1月10日举办的第五届百度 Create AI开发者大会上,百度创始人李彦宏用“危机和希望”为关键词,在百度AI作画平台一格上,由人工智能自动生成了一幅画并展示在大屏幕上。
他说:我觉得很传神。生机勃勃的新生命已经破冰而出,然而寒冷还没有完全褪去——AI理解了他的创作动机,这让不是艺术家的李彦宏,也能完成一幅艺术作品。
AIGC的力量还不止如此——百度数字人度晓晓曾发布MV《启航星》,作画、作词、作曲,全部由AI一手操刀;百度AI数字人度晓晓,挑战写高考作文,40秒写了40篇,得分可以排在总考生前 25%。
这些通过文字描述自动生成的文章、歌词、音乐,让AIGC生产的艺术充满了灵性,同时也让技术更加迷人。
事实上,为了让AI更“聪明”,创造力更丰富,百度也在不断培养AI背后的“教练”——工程师。
比如百度已与全国 100 多所高校进行深度人才培养战略合作,并连续八年支持教育部产学合作协同育人项目,累计投入超过千万基金,覆盖 242 所高校的 511 个项目,为 4100 多名教师提供技术支持;多学科领域的师资培训项目覆盖超过 910 所高校,累计免费培训 4100 多名 AI 相关专业教师。
在程序设计大赛方面,不仅有连续举办 18 年的企业级编程赛——百度之星程序设计大赛,还举办了百度国际大数据竞赛、中国高校计算机大赛-人工智能创意赛(C4-AI大赛),以及被称为国内 AI 领域资助金额与含金量最高的学术奖学金之一百度奖学金。
Create AI开发者大会上,李彦宏说:三年前,我们宣布五年内为社会培养500万AI人才,目前已培养了超过 300万。未来,百度会投入更多资源,与各位开发者们一道,为中国AI的发展尽我们最大的努力。
这么大精力的投入,不止生产更多“创造世界的艺术家”这么简单。
现如今,各大视频平台都将目光转向新奇的AI 创作,市场也在期待AIGC领域制作的动画或视频出现爆款,营销等领域更是期望AIGC能替代费用高昂的制作团队,去生成精美的海报和视频——虽然目前的AIGC 技术还未能成熟到支持低成本的 C 端应用,但无疑,对技术和人才的长期投资,是一件未来可期的事情。
如果说技术研发的AI模型是硬实力,驱动技术长足进步的人才培养与储备则是软实力——百度的AI当然不止于此,但在“每个人成为创造世界的艺术家”上押注和投入,则显示出这家科技公司对AIGC布局的高瞻远瞩。
来源|AI蓝媒汇 作者|黑羊