快速获取三维(3D)建筑数据,包括屋顶、高度和结构等几何属性,以及功能、质量和年龄等指标属性,对于准确的城市分析、模拟和政策更新至关重要。当前的建筑物数据集存在多维属性时空覆盖缺失。龙瀛课题组开发了一个用于大规模建筑建模的人工智能框架(图1),提出了第一个国家规模的多属性建筑物数据集CMAB,覆盖了中国3667个实体城市,3100万个建筑和236亿m2的屋顶,在基于OCRNet的提取中F1值为89.93%,总计3630亿m3的建筑存量。基于城市行政等级分类训练了机器学习模型,包含形态、区位和功能等特征。使用多源数据,包括数10亿张高分辨率遥感图像和6000万张街景图像,通过深度学习、机器学习和多模态大模型为每栋建筑生成了屋顶、高度、结构、功能、风格、年龄和质量属性。准确性通过模型基准、现有的类似产品和人工检查进行了验证,准确率超过80%。数据集和结果对于全球可持续发展目标和城市规划至关重要。
图1. CMAB的整体建模框架
【研究背景】
在过去几十年的城市化进程中,世界各地的城市经历了快速扩张,建筑物成为空间基本细胞单元,城市在三维形态和社会功能方面呈现出日益复杂的变化。通过构建数据集全面了解城市的精细三维物理和社会结构,对于研究城市化进程、城市能源、城市生态系统以及与碳排相关的政府决策至关重要。建筑属性可以大致分为两类:几何属性,包括建筑二维形态、高度、结构和方位;和指标属性,包括功能、风格、年龄、质量和空置。几何属性对于分析城市物理结构和规划城市空间至关重要,而指标属性是理解建筑性能和生命周期的关键。
一方面,由于以往数据的空间和时间分辨率不足、训练样本有限以及训练成本高昂,三维城市形态信息由于测绘成本和技术限制一直难以大规模展开,尤其是在发展中国家。因为传统航空测量经济成本高、时间长,使用开源数据快速提取三维建筑数据是未来的发展趋势。另一方面,目前对城市结构的理解仍主要停留在物理层面,以现有的建筑屋顶和高度数据为代表,缺乏建筑物的综合社会属性,如功能、风格、年龄和质量。据调查,CMAB是世界上第一个在建筑单体层面提供这些属性的国家规模的尺度开放建筑物数据集。
图2. 建筑属性和数据来源可视化
【主要解决问题】
1.空间抽样策略
首先定义实体城市的边界,以明确数据产品的提取范围。根据中国的气候区划和行政城市级别选择建筑样本,并将所有建筑物按照其对应的行政级别分为五类。
图4. 实体城市GES影像的时间分布
2.构建指标体系,提取三维建筑
利用手工标注增强的屋顶样本来训练OCRNet模型,并采用空间聚合方法提取所有实体城市的建筑屋顶。在此基础上,计算不同尺度下的建筑形态、密度和区位特征。针对每个行政级别的建筑,训练合适的分区模型以完成三维建筑的提取。同时在建筑高度的指标体系上加入建筑功能特征。
图6. 百度建筑数据集的统计与预处理
3.提取指标属性
使用多源数据进一步提取不同尺度下的功能特征,生成功能特征。通过结合长时序不透水面和6000万条街景图像,通过空间匹配和目标检测为每个建筑单体分配建筑年代和质量。此外,建筑的结构、风格属性通过微调CLIP多模态模型获得。
4.数据验证
图11. 建筑物多属性的人工验证方法
【成效分析】
1. 数据产品整体介绍
图12. 北京多属性建筑物数据集的可视化
2. 建筑轮廓结果
评估基于一个验证集,包含来自七个不同气候区的城市中23,415个手动标注的建筑屋顶。结果显示,建筑屋顶分割模型在相关数据集上的交并比(mIoU)、召回率(Recall)和精度(Precision)方面优于现有研究。在补充了114,783个建筑单体的标注数据后,屋顶分割模型达到了91.59%的准确率,81.95%的 mIoU,89.93%的 F1 分数,以及79.86%的Kappa 系数。
3. 建筑高度结果
通过可视化和高度分类和 GABLE 数据集进行了比较。GABLE 是一个通过光学影像识别中国所有建筑高度的产品,提供了 0-10、10-30、30-50、50-100、100-500 米高度区间的 RMSE 值。根据这些区间分类数据后发现,在50米以下的区间内,表现出更低的 RMSE 值。根据使用的 Baidu 数据统计,98% 的建筑高度低于50米。另外,根据2020年中国人口普查,超过10层的住宅建筑(大致相当于建筑高度超过30米)仅占1%。
图13. 与GABLE建筑高度的可视化与比较
图14. 分区模型和组合模型的相对误差和绝对误差值表示的不确定性
4. 建筑功能结果
划分模型的表现优于组合模型,住宅功能识别的精度更高,F1 分数接近 0.90。而其他功能类别,如办公楼的识别精度略低,F1 分数接近 0.80。相比之下,商业和公共服务功能的模型表现较差,F1 分数约为 0.5。使用街景数据对2500 栋建筑的功能进行了人工验证,发现 88% 的建筑功能分类是准确的。这表明方法能够正确识别大多数建筑的功能用途。
5. 建筑质量和年代结果
各种建筑质量类别的识别准确率如下:“外立面损坏的建筑”(83.4%)、“非法/临时建筑”(71.6%)、“涂鸦/非法广告”(80.7%)、“门面差的商店”(89.8%)、“外立面不整洁的建筑”(79.9%)和“招牌差的商店”(84.6%)。建筑年代的准确性则依赖于 GAIA 数据的精度。GAIA 各年份的平均总体准确率高于 90%。利用安居客的住房交易数据,其中包括 3771892 条房屋租赁,包含建筑年份和坐标信息。发现在省级层面上,住房交易数据中的建筑年代与估计值之间存在显著正相关关系。与 GAIA 的建筑年代数据相比,结果显示平均差异为 8.7 年,GAIA 的建筑年代通常比住房交易记录的时间要早。使用街景通过人工审核对 2500 栋建筑的质量和年代进行了手动标注,给建筑质量问题分配了从 0 到 6 的严重程度评分。与现有结果进行相关性分析,得到了 R² 值为 0.78。关于建筑年代,将手动标注的建筑年代分为五个类别(1985、1990、2000、2010和 2018),并统计所识别的建筑年代是否符合观察到的真实类别值,发现 82% 的建筑分类验证是准确的。
6. 建筑结构和风格结果
目前,大型多模态模型(LMMs)如 GPT-4o 等已经显著改变了机器学习应用建模的范式。测试并微调了CLIP 和 GPT-4o等模型。比较深度学习和大模型训练成本、精度差异和识别效率,发现LMMs 在推断建筑结构和风格方面表现良好(见图 S9)。
图16. 通过街景微调LMMs预测建筑物属性的准确性
【研究团队介绍】
论文共同第一作者为清华大学城市规划系博士生张业成、博士生赵慧敏,清华大学龙瀛教授为通讯作者。研究由国家自然科学基金重大项目(项目号:62394335和62394331)、面上项目(城市收缩背景下城市空置的智能测度、机理认知与规划设计响应研究,项目号:52178044)和能源基金会项目(项目号:G-2306-34815)资助。
同时,龙瀛课题组已发布的相关数据集“全球1公里网格人口数据集(2020-2100)”,关联论文入选ESI高被引论文,论文共同第一作者为清华大学城市规划系博士生王新宇,清华大学出站博士后、中国矿业大学讲师孟祥凤,清华大学龙瀛教授为通讯作者。该数据集覆盖全球248个国家或地区,其空间分辨率为30弧秒(约1公里),间隔时间为5年。数据集同5个社会经济共享路径情景(Shared Socioeconomic Pathways, SSPs)相统一。通过与WorldPop数据集在省级层面和网格层面的比较得到验证,可以作为各领域预测研究的输入数据。成果于2022年9月在Scientific Data上以数据论文形式发布,目前数据浏览量超过14200次,下载量超过13400次。
文章URL:
建筑数据:https://www.nature.com/articles/s41597-025-04730-5
人口数据:https://www.nature.com/articles/s41597-022-01675-x
数据和代码:
建筑数据:https://doi.org/10.6084/m9.figshare.27992417
人口数据:https://doi.org/10.6084/m9.figshare.19608594