溯源|生成式人工智能在建筑设计中的应用

自由的鱼儿在飞翔 2024-12-25 11:53:24

以下文章来源于国家土建装配化工程技术研究中心 ,作者许心慧等

国家土建装配化工程技术研究中心.

国家土建结构预制装配化工程技术研究中心于2013年4月获科技部立项批准,依托同济大学结构工程、桥梁与隧道工程和机械设计及理论3个国家重点学科并联合国内相关骨干企业共同建设,目标是成为装配化工程技术研发和推广的国家级基地和校企合作开放平台。

摘自《建筑智能工业化》杂志

2024年第3期

溯   源

Review

生成式人工智能在建筑设计中的应用逐渐成为行业发展的关键驱动力。从早期的算法研究到现代AI技术的深度融入,生成式设计不断推动着建筑学的范式转型,探索设计与建造一体化的未来发展方向。

阅读导览

· 引言

· 早期建筑设计生成理念和方法

· 生成式AI与建筑设计

· 生成式AI增强建筑设计的应用现状

· GAI增强建筑设计关键问题

· GAI增强建筑设计突破方向

· 展望

生成式人工智能在建筑设计中的应用

Generative AI in Architectural Design

许心慧 XU Xinhui

同济大学建筑与城市规划学院 博士研究生

冯庭淏 FENG Tinghao

瑞典皇家理工学院 硕士研究生

袁   烽 Philip F. YUAN

同济大学建筑与城市规划学院 长聘教授

(通讯作者)

1引言

随着人工智能生成内容(Artificial Intelligence Generated Content, AIGC) 技 术 的 蓬 勃 发 展, 基于生成式人工智能(Generative Artificial Intelligence, GAI)的建筑算法与生成设计已成为当下技术前沿,具有重塑建筑行业范式的巨大潜力。借助互联网所存储的海量建筑数据与巨大算力双重驱动下的生成式人工智能,逐步替代了早期手工绘图和参数化建模的繁杂工作,为建筑设计带来“人工智能时代”的转向。目前生成式人工智能应用广泛,艺术创作、音乐创作、虚拟助手、小说生成等均取得较为显著的成果,但在建筑设计领域却仍处于起步阶段。因此,寻求多场景应用成为人工智能时代下建筑范式转型的关键点。

2早期建筑设计生成理念和方法

马里奥·卡波(Mario Carpo)曾将数字化建筑发展大致划分为四个阶段[1]——1950年起点、1980年开端、2000年开始进入第二次数字化转型、2010年左右开始发展的人工智能时代(图1)。生成式设计的早期研究注重搜索式的方法,例如元胞自动机、遗传算法、集群智能、分型算法等。这些方法往往在一开始具备了明确的生成框架,例如规定建筑物的四个角点在某一平面,通过日照角度优化四个角点在平面上的位置。

图1 数字化建筑设计的普及发展

然而一开始,建筑设计人员往往不具备如此具象的概念和清晰的逻辑。建筑设计是一个复杂而漫长的过程。建筑师往往从搜集相关案例开始,并逐步具有模糊的设想,这构成了建筑方案的基础。建筑设计过程中,除了审美等内部力量外,也存在着外部影响、法规等力量。多种复杂因素导致建筑设计并不会一次性完成,建筑形态也并未具备确切的设计逻辑,需要通过多次迭代、方案筛选,最终逐步完善。早期生成式设计方法过早地将建筑设计限定在框架内,导致生成的结果缺乏创意。

2014年开始“生成对抗网络”(Generative Adversarial Net-work, GAN)的出现引领了GAI的蓬勃发展,进一步提升了建筑生成的自由度。生成式人工智能的发展大致可以分成三个阶段:早期阶段(1950~1990年),由于技术限制,仅用作小范围研究;中期阶段(1990~2010年),由于深度学习算法的出现、算力设备精进,开始出现GAI技术原型研究,例如2012年微软基于深度神经网络(DNN)实现同声传译;快速发展阶段(2010年至今),由于GAN的出现,生成式AI技术推陈出新,涌现大量AI交互生成内容。

生成式AI被应用到一系列与建筑相关的应用中,其中包括数据质量增强、建筑布局生成、3D打印路径生成等。随着扩散模型、GPT系列的发展,生成式AI迸发出惊人的潜力,将随着时间的推移推动范式转变,并彻底改变建筑业。建筑项目的动态性和复杂性,导致设计方案是不断发展和变化的,同时由于其由多个反馈系统组成,某一部分的条件变化将导致不可预见的整体变化,这使得传统机器学习等方案难以适应。通过对生成式AI的理解加深,有助于扩大生成式AI在建筑设计领域的效率、质量和应用范围。

3生成式AI与建筑设计

3.1 生成式AI增强建筑设计

AIGC技术是当今人工智能领域的前沿技术之一,它具有在各种领域生成新数据的能力,如文本、图像、音频等。这种能力是指通过人工智能生成自动生成内容的生产方式,像人类一样可以创作小说、艺术品、画作、音乐的能力。AIGC主要依托于生成式AI技术,生成式建模旨在推断一些实际的数据分布。例如,输入和输出的联合概率分布P(X, Y) 或P(Y),这些Y往往来自于高维空间。通过这样做,生成模型在给定情况下产生新的合成样本,例如给定目标值Y,生成新的特征观测值配对 (X, Y) 或新的观测值X,即自动生成新设计或形成预测(离散类或连续值)。

在建筑设计中,通过分析大量的建筑数据和设计模式,AIGC可以生成多种设计方案,并根据特定需求进行优化,例如功能布局、结构稳定性、能效和美学效果。这种技术的应用不仅有助于减少设计师的重复性劳动,还能够推动建筑行业向更加智能和可持续的方向发展。

3.2 主流技术

在建筑设计领域,主要涉及到图像、模型等生成技术,其算法框架主要分为以下三类(图2):

图2 生成式AI的三种类型

(1)扩散模型(Diffusion Model):该模型通常用于图像生成等任务。扩散模型通过建模数据点在潜在空间的加噪方式来捕获图像数据,具体来说,它们通常使用经过变分推理训练的马尔可夫链,然后反向扩散来生成自然图像。一些常见的图像生成算法和软件均使用该框架,例如稳定扩散模型(Stable Diffusion)、DALL–E、MidJourney等。

(2)生成对抗网络:GAN由两个神经网络组成,第一个网络被称为生成器,用于生成假样本,第二个网络被称为鉴别器,用于鉴别输入的样本是否为真。通过两者的对抗,生成器不断提高生成样本的能力,鉴别器不断提高鉴别能力,从而使最终生成的样本越来越趋近于真实样本的数据分布。GAN不仅结构简单,并且可以用于生成全新样本,在很长一段时间都是应用的主要方法。GAN包括一些常用的变体,例如条件生成对抗网络(conditional GAN, cGAN)、pix2pix、StyleGAN、CycleGAN等。

(3)变分自编码器(Variational Autoencoder,VAE ):通过将输入数据编码到一个压缩的潜变量空间中,然后从这个压缩的表示中重构原始数据来学习输入数据的低维表示。VAEs通过使用概率方法来编码和解码过程,这使得它们能够捕获数据中的潜在结构和变化,并从学习到的潜在空间中生成新的数据样本。常被用于异常检测、数据压缩、图像和文本生成等任务。

4生成式AI增强建筑

设计的应用现状

4.1 场地分析

4.1.1 建筑图像识别

对于真实建筑识别,建筑设计中有诸多任务需要准确采集立面特征,例如既有建筑的能耗模拟、旧建筑改造、城市更新等,以往主要依赖于现实建筑测量,这一过程耗时耗力。生成式AI的图像翻译和分割能力,能够快速从建筑图像中提取元素特征,实现简易计算。一类研究通过基于语法的边缘检测或基于CNN学习驱动的方法建立框架,自动检测街景图像中的立面窗墙比、预测建筑高度、识别建筑面积等。另一类通过改进现有实例分割算法,例如SOLOv2、Mask R-CNN等算法,实现建筑立面窗口分割,消除了建筑立面的图像畸变和遮挡,实现了建筑立面特征提取,为建筑能耗模拟、城市更新等场景提供基础数据[2]。

对于建筑图纸识别,建筑图纸运用较广且所含信息详尽,以往主要依赖于建筑图纸的手动计算,因此图纸识别技术在建筑内部重建和高精度还原方面具有独特的优势。目前图纸元素识别往往采用YOLO系列模型、R-CNN模型对目标实体进行检测。一部分使用类似CNN进行工程图纸分类,例如电气类图纸、机械工程类等。另一部分被用于建筑图纸中重要元素的识别,例如基于生成对抗网络(GAN),识别建筑平面图中的结构、装饰、功能元素等,或为后续BIM的自动生成提供数据支持。

4.1.2 环境感知建模

生成式AI可以与建筑空间结合,从空间分析和数据中获取特征,并根据历史和当前数据,预测一系列的评价指标和结果。大多数模拟仿真工具参数复杂、耗时和计算成本高,基于生成式算法模型的量化分析,一方面可以大大缩短计算时间,以便于进行更迅速地评估建筑方案的形态、空间、布局性能,从而在设计早期便捷地优化方案;另一方面能够通过真实数据训练模型,然后用于设计方案的预测,实现更精准地预测。

在行为分析方面,通过输入建筑平面图,利用生成对抗网络(如pix2pixHD和GAN)生成行为热力图,分析建成环境中的活动分布和行为模式。例如郑豪等学者训练了使用基于图像的pix2pixHD,通过输入建成环境的平面图,生成建成环境中不同区段主体的行为活力热力图,来探索建成环境与骑自行车者在该环境中的活动之间的关系,从而确定区域活力可以改善的地方(图3)[3]。类似地,福斯特建筑事务所ARD团队通过参数化建模生成了数千个平面图数据集,然后进行空间和视觉连通性分析,并使用全卷积U-Net网络和Pix2Pix进行训练,实现空间和视觉连通性评估。

图3 骑行、跑步热力图预测[3]

在环境性能计算方面,生成式AI能常被用于代理模型。例如日光模拟代理模型,将包含几何信息和采光信息的平面图成对放入生成式AI,训练后的模型用于预测建筑设计的采光性能。一部分研究将重点放在多模态特征融合,例如利用像素和矢量的组合表示平面、立面、反射率、透射率等建筑条件,建立多模态特征融合机制,从而在早期建筑设计阶段,快速评估设计的日光性能。此外,基于GAN将现有建筑性能计算模型与上下文感知设计的特定数据相结合,使用性能目标作为指导来生成增强的建筑性能计算模型。

4.2 方案生成

4.2.1 建筑概念生成

伴随着图像生成技术的发展,建筑师或建筑公司逐步采用生成式AI技术,用于在建筑设计早期生成建筑概念意向图,进行快速试错。主要使用以StyleGAN、CycleGAN、Stable Diffusion、Controlnet等 为 核 心 的 算 法, 首先收集意向图, 搭建数据集,并训练或微调这类算法的预训练模型,最后通过输入文本生成图像、图像生成图像、局部重绘等方法,实现建筑概念的生成。建筑行业的众多设计公司均对这类方法有所探索,例如蓝天组(Coop Himmelb(l)au)的云增强项目、GAM设计公司设想的情绪建筑等(图4)、扎哈·哈迪德建筑师事务所(Zaha Hadid Architects)创建的扎哈图像集(图5)。

(a) 室外场景

(b) 室内场景

图4 由GAM设计公司设计的情绪建筑

(a) 建筑局部图

(b) 建筑立面图

图5 由扎哈·哈迪德建筑师事务所使用AI生成的设计图像

文本生成图像是最主要的跨模态生成式模型之一,设计早期尚未具有确切的设计意向,往往能通过文本生成图像的形式快速生成意向图。Manas Bhatia的概念项目“AI X Future Cities”使用MidJourney,以“未来塔”、“乌托邦技术”、“共生”和“生物发光材料”等提示词生成建筑设想。建筑师 Karisma Shoker用Midjourney的程序技术塑造了设想中的亚特兰蒂斯城入口。Green Clay建筑公司运用AI工具讲现代工程与传统波斯美学结合,设计了由混凝土、木材、玻璃集成的体育场(图6)。SaT工作室设想了一栋由冰块构成的房子,与伊朗南部炎热气候形成对比;设计了在巴黎街道上悬浮岩石构成的摩天大楼(图7)。文本生成图像的方法,往往面临文本可控性弱的问题,因此只适合于建筑师对建筑设计方案暂未出现明确设想的情况。文本生成图像的方法往往存在文本可控性不强的问题,因此通常在建筑师对建筑设计方案尚未形成明确构想时较为适用。

(a) 体育场室内

(b) 鸟瞰图

图6 由Green Clay建筑公司设计的体育场

(a) 室外场景

(b) 室内场景

图7 巴黎街道上悬浮岩石构成的摩天大楼

图像生成图像则提升了前期设计的可控性,通过输入一张或多张图像作为内容和风格的引导,从而生成渲染图。常见的图像生成图像技术可被运用在以下两种情况中:⑴草图生成渲染图:首先建立草图和建筑图像配对的数据集,通过训练CycleGAN和cGAN实现输入草图自动生成建筑图像。⑵草模截图生成渲染图:通过输入Sketchup或Rhino中的草模图像,利用ControlNet生成对应的建筑渲染图。当然,这一步输入信息较为多元,可以是手绘草图、模型草图、真实的建筑图像,也可以是非建筑的物品组合等,不同信息输入和不同算法选择将会影响最终生成的建筑渲染图。除了输入一张完整的图片,也可以采用局部重绘对涉及到单张图片进行涂改,将图片和需要修改的位置配对输入,生成式AI将对要修改的部分重新生成。

另一类建筑概念涉及到对场地内部和建筑物内部的大致规划。建筑设计中的空间布局规划需要对拓扑空间关系有深入理解,生成式AI因其可拓展性,能够输入灵活的数据来源,使建筑空间布局的生成得以实现。早期自动化空间布局常使用形状语法、遗传算法等,但往往找到最优解耗时过长;现在多通过输入现有边界或场地条件,用图结构表示空间关系,通过GAN或扩散模型进行训练生成,完成下一步设计。例如,在Building-GAN的研究中,提出了体素图(Voxel Graph)的建筑表示形式,使用跨模态的图神经网络作为生成器,在生成对抗网络中进行训练,实现具备功能标定的3D空间划分[4]。在单个建筑空间功能布局中,使用cGAN将空房间划分为几个功能区域,然后训练一个全连接网络,将家具放置在相应的功能区域,完成房间的家具布局。此外,空间规划生成的研究也被用于搜索相似空间布局,应用往往会提取平面或模型数据功能布局的拓扑结构,然后从数据库中搜索到符合要求的设计。例如通过输入图像或草图,自动确定查询的类型,并从数据库中检索相似的平面图图像。

4.2.2 建筑图纸生成

平面生成是生成式AI应用最为广泛的方面之一。这类应用多使用生成对抗网络、稳定扩散模型等架构,通过将建筑平面图转译为数据表示,放入深度学习的算法中进行训练、生成。这类方法常见的特征提取方式有CNN(将建筑平面用像素点表示,并分块提取)、GNN(建筑平面用图结构表示),另一种最新的研究则是通过自注意力机制进行提取。

在生成式AI被引入建筑平面的早期,GAN常常选择风格迁移类的StyleGAN系列以及监督学习类的cGAN。2018年,黄蔚欣和郑豪通过建立 pix2pixHD识别和生成住宅平面[5]。2020年,Stanislas Chaillou发布ArchiGAN采用基于Pix2pix的GAN模型,并创建了设计流程的生成模型栈,生成出了住宅平面户型图(图8-9)[6]。然而,基于CNN提取平面像素的方法在实际工程中应用较少,最终生成的栅格图像难以更改,平面部分位置难以解耦。

图8 基于输入的住宅边界生成房间布局[6]

图9 基于输入的房间布局生成住宅平面[6]

随后建筑师并不满足于使用像素点表征建筑,转而使用图神经网络提取和发掘建筑图纸结构数据中的特征和模式,尝试建立一种住宅平面表示和生成方法,在可控制性和创造性间实现平衡,为平面生成研究提供参考。2021年,Nelson Nauata发表了House-GAN++,同样也是用了图约束的GAN模型和cGAN模型,将房屋平面的功能编码进关系网络的图结构中(图10)[7]。随后,Mohammad Amin Shabani将图结构应用在扩散模型中, 提出了HouseDiffusion, 生成矢量平面图[8]。基于图神经网络的方法能够有效编码建筑平面中每个房间的位置、关系和尺度,成为新的研究方向。

图10 图结构生成建筑平面[7]

建筑立面的生成,可以为客户或建筑师提供实时预览,把控整体风格和体量关系,极大程度缩短设计耗时;同时,也为一部分基于立面的性能评估提供基础。立面生成主要使用以 StyleGAN、CycleGAN、Controlnet等为核心的算法,通过输入线稿或草模四视图,生成相应的立面。立面生成技术常常被运用于立面改造项目、城市街景图生成项目。例如用相邻两栋建筑的建筑风格、尺寸、尺度和开口为参考,通过GAN生成中间建筑的立面设计。哈尔滨工业大学团队收集了哈尔滨中央大街立面数据集,分割了墙、门、窗、檐口等元素,使用CycleGAN将立面图像和分割后的图像配对训练,最终通过分割图像生成建筑立面(图11)[9]。随着扩散模型的发展,图像生成技术有了进一步提升,有关于该算法的立面生成研究也应运而生。

图11 训练生成哈尔滨中央大街立面[9]

建筑结构图纸的生成,常常基于现有的平面或剖面图纸,整合设计数据、力学机制和经验规则,完成进一步的结构深化设计。不同类型建筑结构的设计方法和规则差异巨大,需要针对特定数据开发相应的神经网络。研究主要集中在常规结构的生成上,通过CNN或GNN提取现有图纸中的建筑元素,结合GAN、Attention或LSTM,从而生成例如剪力墙、框架结构的布置。例如经过训练的GAN可以根据输入的建筑平面实现剪力墙的快速设计、针对钢筋混凝土剪力墙结构的梁排布设计、钢框架支撑结构设计。

4.2.3 建筑模型生成

建筑概念模型往往包含粗略的建筑体量、比例、尺度等信息,三维生成的任务能使人从繁重的创作流程中解放出来。建筑形态的表示方法有多种形式,通常分为两类:⑴显式表示:包括点云、体素、网格、IFC等;⑵隐式表示:神经辐射场(NeRF)、三维高斯泼溅技术(3D Gaussian Splatting)等。依据不同的三维形态表示方式,也会选用不同的生成式AI技术,例如扩散模型、生成对抗网络、变分自编码器等。

受限于算法和算力,早期研究的思路集中在通过二维图像建立连续变化的截面,从而将多张截面用拉伸的方式组合在一起。例如将原始的模型切割成多个截面,运用StyleGAN或风格迁移,在一种类型到另一种类型间生成一系列连续变化的图像,并尝试通过体素、点云连接或拉伸的方式实现三维形体建构(图12)。

(a) 生成方法

(b) 室外场景

图12 Deep House 项目[11]

随后,研究集中在将先进3D生成算法融入建筑设计中,一类应用强调文本生成3D模 型, 利用如Text2Shape、Point-E、Shap-E等算法,通过输入文本提示词直接生成三维几何形态。这些形态可被转换为建筑元素,并经过体素化等步骤进行优化,以适应设计需求。另一类不涉及多模态生成,而专注于3D模型数据集的学习,例如将建筑几何表示为矩形3D体量的单元格等形式,使用VAE或GAN进行三维训练和生成。

为了使生成算法更符合建筑师的直觉,研究尝试运用不同的数据格式表示建筑,从而让生成式AI更容易理解建筑语义。常见的一种表达形式是通过BIM模型语义进行生成,黄蔚欣等学者建立了BIM中三维建模动作日志数据集,训练了Transformer模型,预测三维建模动作[12]。也有学者通过Mask R-CNN识别建筑平面图像的元素,例如墙、门窗、柱等,将其映射为IFC格式,并用于BIM的重建。Matias del Campo采用3D图卷积网络表示建筑三维模型,并将其置入优化框架中,对输入的三维模型进行变形(图13)[13]。

(a) 室外场景

(b) 楼梯局部

(c) 露台局部

图13 住宅生成结果[13]

4.3 流程探索

4.3.1 设计流程框架

生成式AI彻底革新建筑设计流程,通过建筑师专属的人机交互关系,强调人工智能系统的设计以建筑师的需求为主导,根据具体建筑语境的变化而随时做出调整。通过搭建设计框架,从而组织生成式AI的各种功能,例如草图生成渲染图、3D模型生成、分析预测趋势以及文本生成图像或报告。

对于不同任务需求,设计流程框架往往不同。杨俊宴团队通过进化算法、适应性算法和有监督深度学习等人工智能方法,构建了街区三维形态的智能化设计模块,首先搭建了基底计算模块,采集周边信息,智能控制模块并提出一套较为完整的城市街区三维形态智能化设计技术流程[14]。Anca-Simona Horvath结合evolo竞赛的设计方案过程,详细阐述了如何在概念阶段使用文本到文本、文本到图像和图像到图像进行设计。例如她剖析了三个语言层次:建筑话语、编程话语和注释,并解释了三者如何被运用于设计之中。此外,有研究提出了一种快速设计流程:从黑白草图生成平面概念图,处理为深度图,通过建模软件实现深度图转3D点云模型,再多视角生成渲染图,从而实现基于文本描述的快速构思和可控生成建筑效果图。

4.3.2 设计工具平台

设计工具平台利用人工智能技术,为建筑师提供高效、智能的设计方案。刘念雄团队构建了一种以绿色建筑节能性能为导向的住宅智能生成设计平台,该平台支持设计信息输入、参数化方案生成、能耗评价筛选及优化、综合决策一体[15]。李飚团队搭建了SIMForms集成了参数化建模、量化指标计算,以及AI图像生成,设计师在设计前期仅需网页上的简单操作即可生成多样的建筑设计形态,并获得关键的量化指标和概念设计作为反馈。何宛余团队通过建立小库AI云产品,整合文生图、图生图模型,实现了建筑设计早期灵感创作[16]。同济大学AIDC团队搭建了FUGenerator,服务于从生成到建造的全流程智能链路,实现图像生成一键导出3D打印。类似地,许多建筑设计院均尝试构建AI生成平台,辅助建筑设计。随着生成式人工智能的发展,建筑设计工具平台不断涌现,包括ARCHITEChTURES、Ark Design AI、Maket等。

4.3.3 设计建造一体化

生成式设计介入建造成为建筑行业需要攻克的难题。生成式设计的图纸、模型,往往由于其粗略性,缺乏部分信息,导致进入建造阶段仍有壁垒。因此生成式AI可以在方案设计和机器人建造间提取必要特征,从而指导机器人建造。例如Bárbara Andrade Zandavali使用 cGAN建立了自动化砌砖框架,通过输入墙体形状,生成砖块排布图像,并转换为指令,用于机器人装配(图14)[17]。这一方向是实现从设计到建造无缝衔接的关键一步,也是大批量定制化建造的基础,结合生成式设计与机器人建造技术,使建筑设计和施工之间的距离进一步缩短,实现设计与建造的一体化流程。

图14 自动化砌砖框架[17]

尽管生成式设计与机器人建造技术的结合展示了巨大的潜力,遗憾的是,目前针对这一方向的研究仍然相对有限。许多研究仍集中在生成式设计的算法优化和设计方案的多样性上,而对如何将这些设计更高效地转化为实际建造操作的探讨则相对较少。尤其是涉及生成式AI在自动化建造中的应用,还缺乏系统性研究和实证分析。

5GAI增强建筑设计关键问题

5.1专业知识图谱构建难

随着人工智能和大数据技术的飞速发展,领域知识库的构建在建筑专业领域中变得愈发重要。知识库作为集中存储、分类、管理和检索专业知识的系统,为各种智能系统提供了必要的语义信息,使得这些系统能够在问答、预测、设计生成和训练等任务中迅速获取所需的信息,从而显著提高决策的准确性和效率。然而,构建一个建筑专家知识库存在诸多挑战,包括建筑语义的复杂性、知识获取的难度、数据标准的缺乏等问题。图纸上的有效信息过于复杂,准确识别、提取和学习稀疏的关键特征以生成高质量的设计至关重要。

针对建筑信息的综合性,建筑学涉及多种信息,如建筑设计、结构工程、材料科学、施工管理等,每个子领域都有其独特的知识体系和术语。这些知识既包括定量数据,如建筑规范、材料性能参数,也涵盖了定性信息,如设计风格、空间布局等。由于这些信息类型多样且彼此交织,如何将其有效整合到一个统一的知识库中,成为知识库构建的难点之一。此外,不同平台数据安全、隐私保护和知识产权问题也为知识库的构建增加了复杂性。

针对知识获取的难度,随着互联网数据的快速增长,构建知识库需要从海量的文献、数据库和专家经验中提取相关知识。这一过程不仅耗时耗力,而且要求研究者具备深厚的领域知识。此外,建筑知识通常以非结构化文本形式存在,如设计说明、工程日志、会议记录等,如何有效地从中提取出有用的信息并将其转化为结构化的知识表示,是知识库构建中的一大挑战。

5.2黑箱性与决策不透明

建筑设计往往需要精确的数字描述,且涉及复杂的构件网络。然而,由于GAI采用基于具有拟合原理的深度学习模型,其决策过程具有黑箱特征,因此其不可解释性影响了建筑设计的效率和质量。而随着人工智能系统越来越多地被应用于建筑领域,这种“黑箱问题”引发了关于安全性、合规性和责任分担的广泛担忧。

建筑行业的数据来源广泛,包括设计图纸、传感器数据、市场数据等,但这些数据通常缺乏合理有效的学习方法,这进一步增加了AI系统的不可解释性问题。另外建筑方案的制定往往需要同时优化多个目标,而AI系统在生成方案时,缺乏透明的决策逻辑。方案中需要同时考虑物理特性、气候条件等多种信息,AI在生成过程中难以追溯内部逻辑和每个输入条件对最终输出的影响。另外,建筑行业对安全性和可靠性有极高要求,GAI技术中的黑箱往往会导致忽视某些重要的安全标准和局部风险,而建筑师在评估和验证生成方案时,很难从中有效识别和修正潜在问题。然而,黑箱问题需要在自由度和可控性间寻找一个平衡,数据集框架、拟合方式的选择,恰恰能够在保留黑箱算法创造力的同时,适当规避不合常理的结果。正如徐卫国教授提出的,建筑设计本身就是一个黑箱问题,“如何设计”便是黑箱操作的结果;在深度学习算法中,只要能有数据,就可以找到建筑设计的规则,也就打开了“如何设计”的黑箱。

5.3 建筑行业构建算力弱

建筑数据的复杂程度远超过单纯的文本或图像数据,涉及大量的几何数据、环境参数和物理属性。为了充分理解和处理这些数据,通常需要依赖于复杂的神经网络,这无疑显著增加了计算需求。然而,现有的算法和算力往往难以满足建筑设计中的复杂需求,导致算力限制成为提升设计能力的瓶颈。

面对日新月异的大模型迭代,算力限制成为提升设计能力的瓶颈。大模型的训练、微调、对齐与推理过程都需要强大的计算能力支持。AI与人机协作的方式将显著提高设计的精确度和效率,需要持续的算力投入和优化。建筑行业亟待建立专业算力基础设施,借助边缘计算、云计算等外部资源,保障大模型的高效运行和持续发展。

5.4 生成方案可评估性低

由于GAI技术的不透明性,导致评估这些生成方案成为了一个关键挑战。确保生成设计不仅在短期内是最优的,而且在建筑物的整个生命周期内都具有可持续性至关重要。然而,当前的生成设计通常只关注设计阶段的最优解,而忽视了对其长期可持续性的全面评估[18]。评估一个设计在建筑生命周期内的可持续性,需要综合考虑其在建造、运营、维护以及最终拆除和材料回收等环节中的表现。

同时,建筑物所处的环境条件是动态变化的,例如气候变化、城市化进程等,都会对建筑物的长期可持续性产生影响。由于每个阶段的环境和经济条件可能发生显著变化,确保生成设计在这些条件下始终保持可持续性,增加了评估的复杂性。因此,如何在设计生成阶段考虑复杂的建成环境因素、发展全生命周期可持续的评估模型、增强动态环境模拟能力,成为评估和筛选生成内容的重要基础。

6GAI增强建筑设计突破方向

6.1 建筑设计专业知识图谱

在建筑生成式设计领域,搭建特定表征方式,构建专业图谱,已经成为学科前沿的关键议题。搭建建筑学知识图谱,厘清数据结构,选择合适表征方式,构建用于集中存储、分类、管理和检索知识的数据库,都将成为生成式AI理解建筑语义,提取建筑信息的重要基础,大幅提高大模型在问答、生成、检测等任务的专业度与精确性。

具体而言,构建建筑学知识图谱的关键在于有效整合多源数据,包括设计图纸、说明文档、市场数据等。通过自动化知识提取技术,如自然语言处理(NLP)、文本挖掘、机器学习、卷积神经网络(CNN)、多模态模型(如CLIP)等,可以从大规模非结构化数据中提取出结构化的知识。构建合适的表示形式,例如早期通过像素或体素表示建筑形体,后期通过图结构表示建筑功能关系,提升了AI对建筑功能语义的理解能力。制定数据标准化与规范,在建筑领域内制定统一的数据标准和规范, 包括数据格式的统一、术语的标准化以及数据质量的控制等,建立领域专用的标准化数据集,为知识库的构建提供高质量的数据源。

6.2 建筑设计流程可解释性

建筑设计流程的定制化与可解释性已成为生成式AI在建筑领域发展的关键。生成式AI与以往基于规则生成的模式截然不同,Matias del Campo认为,人类将从神经网络呈现的结果中推断出全新的设计方法。由于其“黑箱”和数据驱动的属性,不同研究往往形成孤岛,缺乏联系。通过建筑师专属的人机交互关系,强调人工智能系统的设计以建筑师的需求为主导,根据具体建筑语境的变化而随时做出调整。

因此构建系统性的生成式AI增强设计流程,融合各类方法,搭建可解释、可调整、可追溯的建筑设计流程,必将全面提升学科的知识生产与创作范式。丹尼尔·博勒简(Daniel Bolojan)坦言:“使人工智能符合建筑师的习惯是建筑师自身的任务,而不应完全依赖大型人工智能公司”(图15)。

图15 AI生成砖墙立面

6.3 设计生成与建造直通车

在未来,建筑生成式设计将尝试打通与建造之间的隔阂。生成式人工智能(AI)不再仅仅停留在粗糙的图像生成阶段,而是通过与三维生成、建筑信息模型(BIM)等技术的深度融合,直接贯通建造环节,实现从数字模型到实际建筑的无缝衔接。这种整合不仅能够提高项目的整体效率和质量,还将推动建筑行业从数字化向智能化的进一步迈进,为从概念设计到建造的全流程设计创造新的可能性。

加强设计到建造一体化数字工艺链的整合。通过将生成设计与施工技术紧密结合,实现从数字模型到现实建造的无缝过渡。生成设计常常产生创新的结构和形式,但在实际建造时,受限于现有的工艺和技术,某些设计可能难以实现。另外,生成设计产生的复杂几何形态和结构,通常需要通过高度精确的数字模型来描述。这需要在生成阶段就将可建造性纳入生成过程,并且实现生成过程的可控,例如控制生成构件的标准化。另外,如何将以图像为主的生成有效地转化为可建造的设计,并使用 BIM等数字化工具进行全流程的协同管理,成为一项关键挑战。

7展望

通过构建专业图谱、定义设计流程、打通设计建造一体化流程,建筑学必将迎来智能化赋能发展的全新阶段,必将全面提升创作能力,增强综合知识理解能力,增进建造实现能力。在人工智能时代,需要全面构建以建筑师创作力、思辨力以及实现力为核心的全新知识架构体系,实现新时代的可持续发展需要新型人机协作的启蒙。

参考文献:

[1] 马里奥·卡尔波 , 闫超 . 一个精简且可证的建筑数字化转型史 [J/OL]. 建筑学报 ,2023(10): 21-28.

[2] LU Y, WEI W, LI P, et al. A deep learning method for building façade parsing utilizing improved SOLOv2 instance segmentation[J/OL]. Energy and Buildings, 2023, 295: 113275.

[3] ZHENG H. A Machine Learning Method of Predicting Behavior Vitality Using Open Source Data[J/OL].[2024-08-14].https://www.researchgate.net/profile/Hao-Zheng20/publication/353901092_A_Machine_Learning_Method_of_Predicting_Behavior_Vitality_Using_Open_Source_Data/links/611744ac0c2bfa282a421bbf/A-Machine-LearningMethod-of-Predicting Behavior-Vitality-Using-Open-Source-Data.pdf.

[4] CHANG K H, CHENG C Y, LUO J, et al. Building-GAN: Graph-conditioned architectural volumetric design generation[C/OL]//Proceedings of the IEEE/CVF international conference on computer vision. 2021: 11956-11965[2024-08-12]. http://openaccess.thecvf.com/content/ICCV2021/html/Chang_Building-GAN_Graph Conditioned_Architectural_Volumetric_Design_Generation_ICCV_2021_paper.html.

[5] HUANG W, ZHENG H. Architectural drawings recognition and generation through machine learning[C/OL]//Proceedings of the 38th annual conference of the association for computer aided design in architecture, Mexico City, Mexico. 2018: 18-20[2024-08-15]. https://papers.cumincad.  org/data/works/att/acadia18_156.pdf.

[6] CHAILLOU S. ArchiGAN: Artificial Intelligence x Architecture[M/OL]//YUAN P F, XIE M, LEACH N, et al. Architectural Intelligence. Singapore: Springer Nature Singapore, 2020: 117-127[2024-08-12]. https://link.springer.com/10.1007/978-981-156568-7_8.

[7] NAUATA N, HOSSEINI S, CHANG K H, et al. House-gan++: generative adversarial layout refinement networks (2021)[J]. arXiv preprint arXiv:2103.02574.

[8] SHABANI M A, HOSSEINI S, FURUKAWA Y. Housediffusion: Vector floorplan generation via a diffusion model with discrete and continuous denoising[C/OL]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2023: 5466-5475[2024-08-15]. http://openaccess.thecvf.com/content/CVPR2023/html/Shabani_HouseDiffusion_Vector_Floorplan_Generation_via_a_Diffusion_Model_With_Discrete_CVPR_2023_paper.html.

[9] SUN C, ZHOU Y, HAN Y. Automatic generation of architecture facade for historical urban renovation using generative adversarial network[J/OL].Building and Environment, 2022, 212: 108781.

[10] REN Y, ZHENG H. The Spire of AI: Voxel-based 3D Neural Style Transfer[C/OL]//25th International Conference on Computer-Aided Architectural Design Research in Asia (CAADRIA 2020). The Association for Computer-Aided Architectural Design Research in Asia …, 2020:619-628[2024-08-15]. https://scholars.cityu.edu.hk/en/publications/publication(23a5b322-7ee8-477b-89a08a0b9d0f2234).html.

[11] DEL CAMPO M. Deep House - datasets, estrangement, and the problem of the new[J/OL]. Architectural Intelligence, 2022, 1(1): 12.

[12] GAO W, ZHANG X, HE Q, et al. Command prediction based on early 3D modeling design logs by deep neural networks[J/OL]. Automation in Construction, 2022, 133: 104026.

[13] CARLSON A, MANNINGER S. 3D Graph Convolutional Neural Networks in Architecture Design[J/OL]. [2024-08-12]. https://www.academia.edu/download/66007602/3D_GraphCNN_academia.pdf.

[14] 杨俊宴 , 朱骁 . 人工智能城市设计在街区尺度的逐级交互式设计模式探索 [J/OL]. 国际城市规划 , 2021, 36(2): 7-15.

[15] 张竞予 , 刘念雄 , 王珊珊 , 等 . 节能性能导向住宅建筑智能生成设计方法与工具平台[J/OL]. 建筑学报 , 2022(2): 22-27.

[16] 何宛余 , 杨良崧 . 生成式人工智能在建筑设计领域的探索——以小库 AI 云为例 [J/OL]. 建筑学报 , 2023(10): 36-41.

[17] ZANDAVALI B A, JIMENEZ GARCIA M. Automated brick pattern generator for robotic assembly using machine learning and images[C/OL]//Blucher Design Proceedings. Editora Blucher, 2019: 217-226[2024-08-12]. https://discovery.ucl.ac.uk/id/eprint/10117450/.

[18] JALAEI F, JRADE A. An Automated BIM Model to Conceptually Design,Analyze, Simulate, and Assess Sustainable Building Projects[J/OL].

Journal of Construction Engineering, 2014, 2014: 1-21.

图片来源:

图1 参考文献[1]

图2 https://pub.towardsai.net/diffusion-models-vs-gans-vs-vaes-comparison-of-deep-generative-models-67ab93e0d9ae

图3 参考文献[3]

图4 https://amazingarchitecture.com/futuristic/ela-emotional-layout-architecture-prototype-by-gam-design

图5 https://www.dezeen.com/2023/04/26/zaha-hadid-architects-patrik-schumacher-ai-dallemidjourney/

图6 https://amazingarchitecture.com/futuristic/chubieh-stadium-by-green-clay-architecture

图7 https://amazingarchitecture.com/futuristic/hotel-suspended-above-paris-by-sara-tarokh

图8-9 参考文献[6]

图10 参考文献[7]

图11 参考文献[9]

图12 参考文献[11]

图13 参考文献[13]

图14 参考文献[17]

图15 https://www.instagram.com/khaled_sadeden_design/p/DAMSnDcus3H/?img_index=7

0 阅读:0