在昨天的 Surface 新闻发布会上,微软宣布将 AI 驱动的图像生成技术集成到其必应搜索引擎、Edge 浏览器和名为微软设计器的新 Office 应用中。该技术将由OpenAI的DALL-E 2提供支持,该版本在四月份因其根据书面提示生成新颖图像的能力而掀起波澜。由于道德问题,这项技术也成为一些艺术家愤怒的主题。

微软的产品旨在通过建议创造性的行动方案来帮助创作者克服难题。在微软提供的微软设计器示例中,有人键入他们想要看到的内容的描述,例如“装饰有鲜花和秋叶的 Ombre 蛋糕”,然后他们可以滚动浏览 AI 生成的图像示例,他们可以选择将其添加到他们的设计中。“设计师邀请你从一个想法开始,让人工智能做繁重的工作,”微软在一份新闻稿中写道。

微软设计器起源于PowerPoint的一部分,它目前将设计理念作为该程序的子集。但微软计划将 Designer 分解为自己的 Microsoft 365 应用程序,该应用程序将作为免费应用程序和高级应用程序提供给 Microsoft 365 个人和家庭订阅者。目前,微软将设计器限制为免费的公共Web应用程序,它将用于从公共测试中收集反馈。

微软还宣布,它将把设计师集成到微软Edge中,以提供“人工智能驱动的设计建议,以视觉方式增强社交媒体帖子和其他视觉内容,而无需离开浏览器窗口。AI图像合成也将出现在必应与图像创建者,人们将能够输入提示并获得由OpenAI的DALL-E 2提供支持的新结果。
自OpenAI于4月推出DALL-E 2以来,AI图像生成因其工作原理而受到一些艺术家的争议。像DALL-E 2这样的图像合成模型使用深度学习神经网络来分析在网络上公开发现的数百万或数十亿张图像,而无需征求艺术家或版权所有者的同意。这些模型,包括DALL-E竞争对手稳定扩散,在统计上将这些图像的内容与网络上找到的描述性标题联系起来,以将它们与单词相关联。结果是,这些模型可以根据文本描述生成图像,并且可以模仿特定人类艺术家的独特风格。
此外,这些图像合成模型的创建者警告说,它们在其训练数据中反映了种族主义和性别歧视等社会偏见,如果不采取安全措施,它们也能够产生令人不安或非法的图像。微软表示正在解决这些问题:“为了帮助防止DALL∙E 2在设计器应用程序和图像创建器中提供不适当的结果,我们正在与开发DALL-E 2的合作伙伴OpenAI合作,采取措施,并将继续根据需要发展我们的方法。
缓解措施包括从训练数据集中删除“最明确的性和暴力内容”,并添加过滤器以“限制生成违反内容政策的图像”。关于偏见,微软提到应用“额外的技术,有助于为我们的结果提供更多样化的图像”,这可能与OpenAI在7月份向DALL-E引入的随机多样化提示注入相同,后者本身也遇到了一些争议。也许正是由于这些问题,微软正在采取一种缓慢发布的方法,而不是完全打开大门。
“我们正在采取一种有节制的方法来推出[图像创建者],”微软在一份新闻稿中写道。“我们很快就会从针对特定地区的有限预览开始,这将使我们能够收集反馈,应用学习成果并改善体验,然后再进一步扩展。
随着微软的这些举措,图像合成工具正迅速成为主流。Canva在9月中旬增加了文本到图像的生成功能。