打字即可生成摄影大片,NVIDIA黑科技全新升级2.0

昨夜雨林听蛙叫 2021-12-02 10:11:25

不知道是否有人希望在未来可以如神笔马良一般,只需随手一画,一幅色彩艳丽且生动形象的图画即可呈现在眼前。而现在NVIDIA推出的最新黑科技系统,利用深度学习AI只需输入单词即可轻松生成摄影大片。这项最新的技术可以将用户输入的文字描述以及色块涂鸦转换成拟真的图片,真正意义上做到了只需要语义即可完成一副精美逼真的照片。

在2019年举办的GTC大会上,NVIDIA就展示了如何利用生成对抗网络将分割图转换为栩栩如生的精美图片,并将这款新的交互应用命名为GauGAN。如今其继任者GauGAN2正式推出,它允许用户可以轻松创建一个现实中不存在的逼真风景图像。GauGAN2作为一款将分割映射、修复和文本生成图像等技术结合在一起的工具,只需要通过输入文字和简单的绘图就能创建出逼真的图像。

GauGAN2作为生成对抗网络的一种变体,由生成器和鉴别器组成。生成器用于获取样本,例如获取与输入的文本配对的图片,并预测可能与图片中元素相对应的数据。生成器生成的图像将不断受到鉴别器的检测,鉴别器将判断其生成的图像是否真实。最初的GauGAN生成的图像质量较差,但随着鉴别器的反馈不断进行改进,更新到GauGAN2时其生成的图像质量也越来越逼真,呈现出的效果也越来越接近现实中的场景。

NVIDIA表示这是一个迭代的过程,用户在文本框中输入的每一个单词都会使AI创建的图像添加更多的内容。GauGAN2背后的AI模型通过使用NVIDIA Selene超级计算机对1000万张高质量风景图像进行训练,这是一个NVIDIA DGX SuperPOD系统,是世界上最强大的 10 台超级计算机之一。

GauGAN2借助神经网络来学习词汇与其对应的视觉效果之间的联系,而这种输入文本生成匹配图像的方式也是GauGAN2的最大创新之处,其生成的图像会逐渐根据输入的内容进行修改,直到最终生成和文本匹配的图像。

GauGAN2在未来将会广泛应用在电影、软件、视频游戏等概念图的设计上,并在视觉领域中具有潜在的应用前景,在未来NVIDIA也宣布会提供开源代码并投入进实际应用中。GauGAN2的技术演示展现了图像生成工具在未来的强大可能性,而这样一款图像生成工具在未来是否需要强大的性能支持并不清楚,但现在市面上的其他图形应用软件就有着不小的配置要求,那么影驰RTX 3070 Ti金属大师OC绝对可以满足你在图形制作上的一切需求。

影驰RTX 3070 Ti金属大师OC,铝合金铁甲散热器,几何镂空设计,大幅提升散热面积。全新NVIDIA Ampere架构加持,搭载全新的GDDR6X高速显存,带来强劲的性能提升。RTX光追与DLSS技术加持,带来高帧率低延迟的优质游戏体验。

优秀的硬件支持与强大的GauGAN2技术,或许在不远的将来,人人都能轻松成为艺术家。

0 阅读:132
评论列表

昨夜雨林听蛙叫

简介:数码、科技、二次元、技术宅