• $

新闻资讯

建筑物屋顶高分辨率卫星遥感提取数据与方法
发布时间:2022年05月30日

(一)高分辨率卫星遥感影像及辅助数据

1. 底图数据

使用的主要数据源为基于“资源三号”“高分一号”等 2 米级空间分辨率的卫星遥感影像制作的2020 年版全国版图。一年一版图作为当前分辨率最高的全国范围覆盖的真彩色正射卫星影像库,具有现势性强、定位精度高等特色,已在多个行业和部门得到广泛应用。

2. 训练样本数据

考虑因地域差异、发展水平造成的建筑物(区)样本差异,可将全国划分为东北、西北、华北、华中、华南、西南 6 个片区。建筑物(区)训练样本来源于 2017 年地理国情数据。每个片区选择 2 个省会城市、5 个普通城市、10 个县,将其中的房屋建筑区作为本研究的训练样本(见图 1);收集了部分城市白模数据作为底图矢量,经过人工编辑后用于独立建筑的训练样本,制作成 29 个典型城市独栋建筑物数据(见图 2)。

图 1 建筑区样本示例

图 2 独栋建筑样本示例

3. 验证及辅助数据

使用的验证数据主要是利用 2 m 分辨率的卫星遥感影像经过人工编辑形成的城区范围矢量,对提取的建筑矢量进行划分,确定城镇和农村建筑范围。依据典型城市提取的独栋建筑和建筑区矢量,计算对应的建筑占比系数;爬取百度地图等网络建筑轮廓数据作为辅助参考,优化样本精度。此外,使用国家统计局发布的 2020 年末总人口数据分析屋顶面积与人口的相关性及匹配性。

(二)基于卷积神经网络技术提取房屋建筑区

研究涉及的卷积神经网络包括三部分:①特征提取层,采用 ResNet50 深度残差网络进行特征提取,得到 Feature1 特征图;②金字塔池化层,设置不同尺寸的 Pooling(池化)层,分别对 Feature1 进行处理,将每个 Pooling 层得到的特征输入到一层卷积网络再进行特征提取,最后上采样到与 Feature1 相同的尺寸得到 Feature2 ;③特征融合输出层,将 Feature1、Feature2 进行通道融合,再经过卷积层输出结果。

神经网络训练基于 PyTorch 搭建的训练平台进行,针对建筑区提取、独栋建筑提取两种不同的任务,可调用大量图形处理器(GPU)计算资源进行分布式训练,快速得到深度学习模型,便于后续算法迭代更新。在选择网络特征提取层、训练超参数时,宜综合样本区域的情况以便提升最后算法的推广泛化能力。

按上述规则对全国建筑区及典型城市独栋建筑进行自动提取,得到全国建筑区及典型城市独栋建筑的矢量范围,为后续屋顶面积计算提供基础数据。

(三)建筑物屋顶面积估算

受卫星影像分辨率、同物异谱、建筑形态多样等因素的影响,独栋建筑提取面临着很大的困难;尤其是受 2 m 分辨率影像限制,城市密集建筑区无法区分独栋建筑。因此提取建筑区范围并依据典型城市建立的建筑占比系数,估算全国城镇建筑的屋顶面积。

在建筑区提取矢量的基础上,根据城区范围矢量对提取的建筑矢量进行划分,以此区分典型城市、城镇和农村的建筑范围;分别计算对应的建筑占比系数,进一步提升计算精度。建筑占比系数(CPC)公式为:

公式中,Area独栋建筑为目标区提取的独栋建筑总面积,Area建筑区为独栋建筑所在的建筑区总面积。建筑区与独栋建筑关系示意如图 3 所示。

图 3 建筑区与独栋建筑关系示意图

考虑全国各地建筑形式及分布情况的差异,本研究设计了 3 种不同的方法计算建筑屋顶面积。①城市分级,将典型城市划分为直辖市、省会城市、省会以下城市三级,分别计算出三个建筑占比系数;其中将直辖市、省会城市再次划分为主城区和郊区,使用不同的建筑占比系数计算屋顶面积。②位置分区,根据所在区域,将典型城市划分为华北东北、华中、华东、华南、西南西北 5 个大区,计算各大区建筑占比系数并推广至区内其他地区。③全国平均,将各典型城市建筑占比系数求平均值,得到全国平均建筑占比系数,从而计算各地区的屋顶面积。