前文介绍了字节跳动推出的人工智能系
字节跳动推出了一款人工智能系统“X-Portrait 2”,可以将任何照片转换成令人信服的视频表演,其微妙的表情和情感深度堪比真实镜头。这使得静态图像成为著名电影场景的镜像——其效果非常逼真,模糊了真实内容和人造内容之间的界限。
该系统的演示展示了《闪灵》、《变脸》和《藩篱》等电影中经典场景的静态照片,捕捉了原版表演中每一个细微的表情。现在,一张照片就可以像训练有素的演员一样,以同样令人信服的细节展示恐惧、愤怒或喜悦,同时保留原人物的身份和特征。
X-Portrait 2能够根据任何照片制作出与现实难以区分的视频,而以往的AI动画工具通过机械动作产生了明显的人工效果。但X-Portrait 2可以捕捉面部肌肉的自然流动、细微的眼部运动和复杂的表情,这些都使人类的面部具有独特的表现力。
X-Portrait 2通过创新方法实现了这种逼真度,系统不是追踪面部上的特定点(这是大多数动画软件使用的标准方法),而是观察和学习完整的面部动作。旧系统通过连接点来创建表情,而X-Portrait 2可以捕获整个面部的流畅动作,即使在快速讲话或从不同角度观看时也是如此。
字节跳动的优势源于其作为TikTok所有者的独特地位,TikTok每天处理超过10亿个用户生成的视频。这一庞大的面部表情、动作和情绪集合提供了大多数AI公司无法获得的大规模训练数据。虽然竞争对手依赖有限的数据集或合成数据,但字节跳动可以使用从不同面部、光照条件和摄像机角度捕捉到的真实表情来微调其AI模型。