随着AI技术的飞速发展,越来越多的用户开始利用AI工具进行图像生成,这一趋势正逐渐改变着设计行业的生态。
作为学习设计的我们,面对这一全新的工具,究竟该如何合理运用,才能在快速发展的技术浪潮中保持竞争力?
今天给大家分享一篇文章,来了解专家用户如何在图像生成过程中使用人工智能工具,这不仅能帮助设计师和其他初学者更好地将这些工具应用于他们的项目,还能为未来此类工具的设计提供有价值的参考。
研究
总共进行了九次情境探查,以了解用户在使用AI生成图像时的自然行为。参与者可以选择他们喜欢的任何图像生成工具;结果九位参与者都选择了Midjourney。
在这些会话中,我们观察到了参与者创作过程中的一些模式,不论他们正在创作什么内容。我们将这些用户旅程提炼成一个高级体验图,以展示大多数用户如何实现他们的目标。
AI图像生成过程:四个阶段
研究参与者在生成AI图像时经历了四个阶段:
Define 定义Explore 探索Refine 优化Export 导出
图片来源于网站
阶段1:定义
用户通过确定他们的目标并思考如何实现它来开始图像生成过程。
确定目标用户的目标通常分为两类:灵感导向或交付物导向。
灵感导向当用户没有预先设定的最终输出想法时,他们会使用图像生成工具来收集灵感,寻求的是概念而非具体的细节或可直接导出的图像。
交付物导向
其他用户的主要目标是创建精致的、高保真的输出,追求完美,尽量减少在AI工具外进行的调整。这些图像作为最终产品,需要关注细节和反复优化。
确定如何实现目标一旦用户确定了他们的目标(无论是灵感导向还是交付物导向),他们会开始思考如何实现这一目标。由于表达障碍,这一步让一些研究参与者感到不知所措。用户通过参考其他来源来克服这种“空白页”问题,包括以前的图像、生成式AI(genAI)聊天机器人提供的指令或外部资源。
将过去的图像作为起点
一些参与者依赖于浏览他们之前生成的图像,寻找与当前目标类似的内容。
将生成式AI聊天机器人作为起点
许多参与者经常使用聊天机器人,主要是ChatGPT,作为创作过程中生成图像提示想法的来源。
将外部资源作为起点
一些研究参与者访问了Midlibrary等网站,这是一个AI生成的图像和提示的众包资源库,从中挑选灵感。

图片来源于官网
阶段2:探索
第一阶段的输出是一个明确的想法、愿景或图像的提示。在第二阶段,用户尝试创建一个大致符合他们愿景的图像;然后可以对这个图像进行微调,以达到最终输出。
大量创建
在确定目标后,参与者使用工具生成图像。探索阶段通常涉及创建大量图像(通常从20到80张不等),以增加其中一张图像足够符合他们愿景的可能性。
我们观察到的专家用户使用了两种常见策略来有效地生成大量图像:提示重复和提示变化。
提示重复
这种技巧涉及重复相同的提示,以“穷尽”与某一创意方向相关的可能性。由于AI图像生成算法固有的随机性,这种做法产生了同一概念的许多变体,使人们能够选择自己最喜欢的版本。
提示变化
提示变化涉及为同一目标图像编写几个略有不同的提示。拥有丰富提示词汇的参与者通过提示变化来探索多个创意方向。
这种提示策略带来了挑战。对于普通用户来说,快速想出众多提示替代方案在认知上具有挑战性。
在探索过程中发现新想法
尽管用户通常在定义阶段确立初步愿景,但探索阶段经常会发现超出他们原始概念的想法。用户通常会放弃他们的初始想法,而选择更符合他们愿景或偏好的图像。
一旦用户创建了一个在主题、美学和构图方面大致符合他们期望的图像,他们通常会进入下一步——优化,来解决图像中的不完美之处并进一步提升图像质量。
然而,在灵感导向的情况下,如果细节不重要或将使用AI图像生成工具之外的工具进行优化,探索阶段可能标志着AI图像生成过程的结束。
阶段3:优化
在这个阶段,用户会对图像进行调整,以使其尽可能接近预期的输出。这是整个过程最复杂和困难的一步,即使对于专家来说也是如此。
一位使用Midjourney的参与者表示:“Midjourney是一个生成器,不是一个[图像]编辑器。”用户以多种方式对图像进行优化。
我们观察到参与者通过添加、删除或更改图像中的特定对象或更改构图来实现最终结果。
缺乏用户控制:与AI抗争
修改AI生成图像的细节可能是一项艰巨且耗时的任务。参与者常常因当前AI图像生成工具固有的缺乏用户控制(可用性启发式规则#3)而感到沮丧。
与传统的图像处理软件不同,这些工具对细微调整的支持有限,这意味着用户最终需要与AI抗争以实现预期的效果。因此,用户往往对最终的图像感到不满,因为它们往往未能达到完美。
阶段4:导出
在达到通过提示能够实现的极限后,用户会将图像导出工具。接着,他们使用其他工具如Photoshop进行最后的润色和编辑,利用AI放大工具来放大图像(即增加图像尺寸),或者在图像上添加文字。这一阶段标志着他们为特定任务所做的设计过程的结束。
非线性变体虽然我们描述了AI图像生成过程中的四个阶段,但并非每个人都会经历所有这些阶段。个人用户的目标和经验最终决定了他们的过程如何进行,以及他们在每个阶段花费多少时间。
灵感导向的创作者会更多地花时间在探索阶段具有灵感导向目标的用户会更多地花时间在定义和探索阶段,并可能跳过优化和导出阶段,因为他们只需要图像创意,而不是最终的图像交付物。
交付物导向的创作者会更多地花时间在优化阶段
当AI生成的图像作为最终交付物时,用户会尽力使细节尽可能完美。他们从定义和探索阶段开始,但随后将大部分时间花在优化和导出阶段。优化阶段中缺乏用户控制使这一过程变得具有挑战性,甚至令用户感到沮丧。

图片来源于官网
结论
了解专家的图像生成过程对AI图像生成工具的用户和设计者都具有重要价值。
AI图像生成工具的用户可以学习如何更好地实现他们的目标。例如,他们可以使用聊天机器人来创建提示,并在迭代过程中开始变化提示。
理解用户的创作过程有助于AI图像生成产品的设计者识别痛点和改进领域(例如,需要在优化阶段给予用户更多控制)。通过识别灵感导向和交付物导向用户的不同需求,设计者可以创建更具针对性和高效的工具,这不仅有助于创意探索,还能优化工作流程,提高用户实现目标的可能性。
对于设计师或正在准备设计作品集的创作者来说,AI工具的高效运用可以极大地提升创作的效率和质量。
通过不断实践和调整,你将能够充分发挥AI工具的潜力,创造出更加出色的设计作品。
Ref:
原作者:
Tarun Mugunthan&Sarah Gibbons
https://www.nngroup.com/articles/ai-imagegen-stages/
想要了解更多关于留学申请及设计专业的详细信息,欢迎私信WellDesign官方账号——welldesignedu,将能够为你提供更加准确及时的信息。
期待您的咨询!