福清智慧城市规划网/ FUQING
SMART CITY PLANNING NETWORK
当前位置: 知识共享> 精品文摘> 当ChatGPT遇到城市规划︱走向规划自动化:AI催生的都市幻想 (上)

当ChatGPT遇到城市规划︱走向规划自动化:AI催生的都市幻想 (上)

城市规划和人工智能(AI)这两个领域是分开产生和发展的。然而,现在两个领域出现了交叉,人们对交叉领域的部分也愈发感兴趣了,希望从能从其中一个领域的进步中受益。本文将从可持续性、生活、经济、灾害和环境的角度介绍城市规划的重要性。我们回顾了城市规划的基本概念,并将这些概念与机器学习的关键开放问题联系起来,包括对抗性学习、生成神经网络、深度编码器-解码器网络、对话式人工智能以及时空机器学习,从而分析人工智能如何为现代城市规划做出贡献。基于此,核心问题是自动化土地利用配置,这是根据周围地理环境、人类活动、社交媒体和经济活动为目标区域生成土地利用和建筑布局。最后,文章描述了人工智能对城市规划的一些影响,并提出了两个主题交叉的关键研究领域。

 

编辑团队

Editorial Group

原文DONGJIE WANG, CHANG-TIEN LU, YANJIE FU

翻译王睿珺, 付伟佳, 吴梦雨, 张楚唯, 许诺, 曾琦琛, 侯钰懿, 吉炫竹  

校核/ 王睿珺, 付伟佳, 吴梦雨, 张楚唯, 许诺, 曾琦琛, 侯钰懿, 吉炫竹

编辑众山小  文献钱乾   排版王睿珺

 

 

01

 

 

当城市规划遇见人工智能

 AI in Planning 

 

 

 

城市规划是设计和管理城市、城镇和其他区域的物质和社会发展的过程。它包括制定和实施计划与政策,以及通过满足社区需求的方式指导土地、基础设施和资源的使用。这包括诸多活动,例如土地利用规划、交通规划、环境规划、经济发展规划和社区发展。

 

城市规划在塑造我们城市未来的时候,发挥着不可或缺的作用,从而影响着数百万人的生活。随着城市的不断发展和演变,城市规划对于确保可持续发展、有效利用资源和促进经济增长变得越来越重要。一项成熟的城市规划可以创建对环境负责、社会包容的社区,不仅可以提高居民的生活质量,还可以增强城市抵御自然灾害和其他不可预见挑战的能力。通过将深度生成学习等先进技术融入城市规划过程,我们可以更好地预测和应对复杂的且相互关联的城市化挑战,同时利用创新和增长的机遇。最终,这将有利于城市成为更智能、更具韧性的空间,从而更好地应对快速变化的世界的需求。

 

传统的城市规划包含几个阶段,根据项目的具体背景和要求会发生变化。首先,通过评估区域基础条件及影响区域发展的社会、经济和环境因素,进行目标设定,并对预期结果进行评估。接下来是制定目标,即确定预期成果和衡量进展的标准。在战略制定阶段确定可以实现项目目标的潜在战略和干预措施。一旦确定了战略,就需要制定详细的计划,概述实施计划所必需的具体行动、政策和方案。实施阶段包括通过执行战略阶段制定的步骤、政策和计划,同时与各种利益相关者合作、确保资金和管理资源。最后,对全过程予以监测和评价,确定计划的有效性并明确需要改进的领域。总体而言,传统的城市规划过程强调全面和不断迭代的过程,促进与利益相关者的合作,并深入了解影响城市发展的社会、经济和环境因素。

 

近年来,人工智能的进步为城市规划者带来了新的机遇。图1显示,通过利用人工智能算法和数据分析技术,规划者可以更深入地了解构成现代城市的复杂系统(例如土地使用和交通)。人工智能可以帮助传统城市规划做出更明智的决定,并帮助解决传统城市规划方法的一些局限性。例如,人工智能可以让规划者以近乎实时的方式快速有效地处理大量地理空间和社交数据。此外,人工智能可以帮助识别使用传统方法可能难以或不可能检测到的模式和趋势。

 

 

人工智能辅助规划师以生成最优土地利用布局(在考虑现实约束条件及规划专家的基础上)

 

 

尽管人工智能在城市规划中有潜在的好处,但也有一些挑战和担忧需要考虑。由于城市系统的高度复杂性,规划任务主要由专业规划师承担。然而,规划师们通常需要较长的时间来完成这些任务。人工智能生成内容(AIGC)的最新进展(例如,Chat GPT,图像生成模型)在训练机器概念化和生成城市社区的土地利用方面展现出巨大的潜力。这一观察结果促使我们从人工智能的角度重新思考城市规划:深度学习在城市规划中扮演什么角色?机器能否获得并展示类似人类的能力,例如进行土地利用布局?通过采用此类方法,机器是否可以作为规划助手,使规划师能够调整机器生成的计划以适应特定的需求?

 

研究贡献

 

 

本次研究我们引入了一个深度生成的人工智能驱动的城市规划框架,该框架在考虑规划约束和专家干预的情况下,生成了最优的土地利用布局。这种方法旨在增强我们对生成式规划过程的理解,并解决城市规划方法中现有的局限性,如图1所示。这将使城市规划领域更接近一种涉及图像生成意义上的生成式规划。尽管生成式人工智能在文本和图像生成方面取得了成功,但城市是一个复杂的生态系统,涉及地理空间、社会、经济和人类等多维度。整合城市规划和人工智能在神经架构、训练算法、复杂和不完善的数据以及计算方面一直是一个巨大的挑战。

 

我们在第二部分描述了深度生成城市规划,即对自动化城市规划的研究。我们讨论了城市规划和生成式人工智能类比背后的计算思维,提出了将城市规划转化为深度生成式学习任务时使用的关键术语,最后提出了城市规划的通用生成框架。

 

我们在第三部分中回顾了学习城市规划深度生成模型的现有方法。我们涵盖了三类生成式规划的方法:通过生成对抗学习的自动化城市规划,通过变分自编码器的自动化城市规划,以及通过Transformer的自动化城市规划。此外,本文还讨论了生成式规划中的知识引导和领域感知,如城市规划中的空间层次结构知识、克服城市规划数据的稀疏性等。

 

我们展望未来的深度生成式城市规划研究。我们Chat GPT的角度讨论了未来自动化城市规划的可能性。我们提出了将生成式人工智能、对话式人工智能、循环中的人为反馈或人机协作规划整合为一体的想法,并讨论了其他几个问题,如更好地代表城市规划配置和城市规划的公平性。

 

 

02

 

 

深度生成式城市规划:

由类比、术语以及算法构成的框架

 AI in Planning 

 

城市规划与深度生成人工智能的类比

 

 

2.1 生成式人工智能视角:

作为深度生成式学习的自动化城市规划

 

城市规划是一个涉及城镇规划和城镇管理的综合领域。有这样一种有趣的城市规划方式:将社区布局看作一张图像,规划社区的整体布局则可看作是在生成这样一张图像。通过把城市规划视作图像生成(图2),我们可以将城市规划转化为一个深度生成学习任务。换句话说,给定一个区域或者社区,具有深度生成功能的城市规划模型可以生成最佳或者接近最佳的社区地理空间布局。为了搭建一个这样的深度生成式城市规划框架,解决以下三个问题至关重要:(1)量化:我们如何量化土地利用布局计划?(2)生成:我们如何开发一个机器学习框架,以学习现有城市社区在土地利用布局各方面的优缺点?(3)评估:我们如何评估生成的土地利用布局结果的质量?在介绍技术细节之前,我们先介绍一些深度生成式城市规划中的关键术语。

 

 

2.2 深度生成式城市规划中的关键术语

 

2.2.1 目标区域:

 

在城市规划中,目标区域指的是规划工作中的重点地理区域。它可以是一个社区、一条邻里街道、一个区域、一个地区、一个城市,甚至是一片地域,这取决于规划工作的规模和范围。为了使目标区域可量化,我们将目标区域视作一个空白的正方形地理空间,这个正方形的边长通常为一千米。实际上,目标区域一般是通过一系列因素来确定的,包括人口特征、经济条件、环境特点、交通基础设施以及社会需求。一旦确定了目标区域,规划者可以通过各种工具和技术来分析现状条件并制定该区域的优化措施。

 

目标区域与地理空间背景的说明

 

 

2.2.2 地理空间背景:

 

地理空间背景代表了目标区域周围的环境条件,每块地理空间背景区域都与目标区域共有同一段边界。从图3a)可见,地理空间背景区域从各个方向环绕着目标区域。为了利用地理空间背景中包含的信息,正如所描述的那样,我们将其表示为一个具有空间属性的图,如图3b)所示。在这个图中,节点表示地理区域,边界表示两个区域相连接的边界。另外,每个节点都与相应区域的社会经济特征相关联。

 

 

城市功能区与土地利用布局

 

 

2.2.3 城市功能区:

 

对提供网格级土地利用布局规划基础的城市功能区进行了研究。正如之前的研究中所提出的[23],通过地理数据和人类流动性来提取城市功能区。为了提取这些区域,首先将地理区域划分为N×N的网格,这些网格被视为单词,而人类轨迹被视为句子。某一地理区域内的所有轨迹集合被视为一个文档。然后使用不同的主题模型来确定每个网格的城市功能标签。这些区域的结果数据结构如图4a)所示,其中多个网格在一个由U ∈ RN×N表示的矩阵中与单一的城市功能标签相关联。

 

2.2.4 城市功能区:

 

土地利用布局采用了定量定义的方式。首先将某一地理区域划分为N×N的网格,并对每个网格内各个POIPoints of Interest,兴趣点)类别的兴趣点(POIs)数量进行统计。然后将每个类别的计数叠加以生成最终的布局形式。图4b)显示了此布局的最终结果的数据结构,它是一个张量,包含了经度、纬度和POI类别维度。这个张量由下列公式表示,其中CPOI类别的数量。

 

 

 

2.3 深度生成式城市规划的通用框架

 

深度生成式城市规划旨在目标区域生成最佳土地利用布局。自动化城市规划师包括两个基本步骤:表达和生成。第一步是学习目标区域的地理空间、流动性、经济、社会背景和人文指示的表达,将其作为生成条件。第二步是根据生成条件的表示,为目标区域生成最佳土地利用布局方案。

 

2.3.1 表达:

 

感知地理空间形式、人类流动、社会互动和规划者指令。为了生成有效的城市土地使用布局,我们需要教会AI感知和理解地理空间形式、人类流动、社会互动和规划者指令。

 

表达什么。首先,地理空间形式是指城市或城区的物理和空间特征。这包括街道、建筑、空地、交通基础设施以及构成城市环境的其他要素的布局、安排和分布。地理空间形式在塑造城市特征和功能方面发挥着重要作用,影响着从居民生活质量到经济机会等方方面面。其次,人类流动是指人在城市区域内和城市区域之间的流动。这包括上下班或上学等日常活动,以及购物、社交等不太频繁的出行。人员流动数据可以来自城市自行车、公交车、出租车、地铁和移动设备。对于城市规划者来说,了解人员流动性至关重要,因为它影响到城市生活的许多方面,包括交通、土地使用和经济发展。通过分析人类流动模式,规划者可以确定人们要去哪里以及如何到达目的地,并利用这些信息设计出更高效、更可持续的交通系统,确定公共服务和便利设施的位置,以及鼓励在交通便利的地区开展经济活动。第三,社会互动指的是人们在城市空间中的互动方式。这既包括线下社交互动,如在学校、政府办公室、公园、广场和其他公共空间中发生的社交互动,也包括线上社交互动,如在 TwitterSnapchat Facebook 上发生的关注、评论和转发。了解社会互动对城市规划者非常重要,因为它影响到城市生活的许多方面,包括社会凝聚力、社区建设和经济发展。最后,人类专家通常通过自然语言或预选选项来表达规划要求,而一个地区的社会经济特征会对城市规划过程产生重大影响。受深度表示学习的成功启发,可以利用它来学习所有地理空间形式、人类流动、社会互动和人类规划者指令的表示。所有这些信息都可以结合在一起,形成条件生成嵌入,用于生成符合该地区特定需求的城市规划。

 

如何表达。我们在世界上观察到的一个地方的地理、流动、社会和人文维度往往是多维和复杂的。我们相信,这些数据有更有意义、低维数据表示方式,可以捕捉到其底层的结构和模式。这些特征可以通过机器学习算法自动学习,而不是由人类手工创建,然后可用于下游的土地利用布局生成器。具体来说,我们将这些复杂且不完善的城市多维信息转化为新的表达方式,以捕捉目标区域态势中最突出的特征或特性。表达可以通过经典方法(如特征提取、降维)和高级方法(如自动编码器、卷积神经网络、循环神经网络、生成对抗网络)来实现。基于深度学习的先进方法可以学习知识感知结构特征,将城市环境的地理空间、流动性、社会和人文方面捕捉并融合到一个抽象向量中。

 

 

2.3.2 生成:

 

学习生成土地利用布局。所有这些相关信息(如地理空间、流动性、社会、人类文本指令数据)的表示将作为深度土地利用布局生成模型的生成条件。一个有意义的土地利用布局生成模型包括 1) 神经生成模型架构;2) 生成模型的目标函数;3) 优化或训练策略。

 

土地利用布局神经生成式架构。深度生成式学习中常用的神经架构有多种。以下是其中最常用的几种:1) 变异自动编码器(VAE):VAE 是一种深度生成模型,由编码器网络、解码器网络和概率潜变量模型组成。编码器网络将输入数据映射到潜在空间中的概率分布,解码器网络将潜在变量映射回输入空间。模型的训练采用变异推理法,即最大化数据对数似然的下限。2) 生成对抗网络(GANs):GANs 是一种深度生成式模型,由生成器网络和判别器网络组成。生成器网络生成虚假数据样本,而判别器网络则试图区分虚假样本和真实样本。这两个网络在博弈论框架下进行训练,生成器试图生成能骗过鉴别器的样本,而鉴别器则试图区分假样本和真样本。3) 自回归模型:自回归模型是一类深度生成模型,它根据之前的元素一次生成一个元素的数据。最流行的自回归模型是 PixelCNN,它根据之前的像素,每次生成一个像素的图像。4) 流模型:流模型是一种深度生成模型,它使用一连串可逆变换对数据密度进行建模。最流行的流模型是 RealNVP,它使用仿射变换序列对数据进行建模。5) 能量基础模型:能量基础模型是一类深度生成模型,它根据样本的能量来定义样本的概率。最流行的基于能量的模型是波尔兹曼机,它由一组二进制单元组成,这些单元根据学习到的能量函数相互作用。在这些生成模型的帮助下,我们可以将城市规划问题表述为一个生成任务;也就是说,给定邻近环境和人类指令的数据表示作为生成条件,该模型旨在生成适合这些生成条件的最佳土地使用布局选项。

 

优化土地利用布局生成。生成目标函数对于优化土地利用生成模型至关重要。这包括通用目标和特定领域目标。具体来说,VAE 的目标函数是最大化证据下限 (ELBO),这是数据对数似然的下限。ELBO 被定义为重建损失(即给定潜变量的数据负对数似然值)和潜变量分布与先验分布之间的 Kullback-Leibler (KL) 发散之和。在 GANs 中,目标函数是生成器网络和判别器网络之间的最小博弈。生成器网络试图最小化判别器网络将生成的样本正确分类为假样本的对数概率,而判别器网络则试图最大化这一对数概率。在自回归模型中,目标函数是在给定模型参数的情况下最大化数据的对数概率。这通常是通过最大化序列中下一个元素的预测值和真实值之间的交叉熵损失来实现的。在流模型中,目标函数是在给定模型参数的情况下最大化数据的对数似然。通常使用变量变化公式计算数据的对数似然,即简单基分布的对数似然。在基于能量的模型中,目标函数是最小化模型给定数据的能量。通常采用对比发散法或Gibbs采样法来估计能量函数相对于模型参数的梯度。在特定领域的目标背景下,生成过程受制于领域知识,例如:1)城市功能区和社区布局之间空间层次的影响;2)不同区域之间的地理空间、流动性和社会联系对城市规划的影响;3)土地使用布局的多样性和公平性。

 

扫码关注
玉融规划微信公众号
扫一扫
在手机上查看当前页面