经过整合遥感数据和社交媒体数据来进行城市土地利用的分类( Classifying urban land use by integrating remote sensing and social med

Classifying urban land use by integrating remote sensing and social media data   
Xiaoping Liu, Jialv He, Yao Yao, Jinbao Zhang, Haolin Liang, Huan Wang & Ye
Hong


html

摘要

研究方向的重要性(有意义):算法

  城市土地使用信息在城市管理、政府政策制定、和人类活动监测方面扮演着重要的角色。微信

However,存在的困难:网络

  因为城市系统的复杂性,将城市功能区正确分类是一件具备挑战性的事情。app

与此项研究课题相关的其余研究的作法:框架

  许多研究都是从高分辨率遥感影像或者社交媒体数据提取出特征,并对特征进行对比分析来进行土地使用的分类。可是因为缺少有效的模型,不多有研究将这两个特征同时考虑机器学习

本研究提出的方法:函数

  咱们提出了一种新奇的场景分类的框架在交通分析区水平上来鉴别主要的城市土地利用模式。这个框架是整合几率主题模型支持向量机(SVM)。在这个框架中的土地使用字典是经过融合从高分辨率遥感图像中提取出来的天然物理特征和从多元社交媒体数据中的社会经济语义特征。除了与人工解译做比较,咱们设计了几个实验来检测提出的模型对于先前获得的语义特征的不一样组合所反应的不一样土地使用分类正确性。工具

  分类结果(整体正确率0.865,Kappa指数0.828)显示咱们所提出策略的有效性--混合从多源地理空间数据提取的特征做为语义特征来训练分类模型。post

  这个方法能够被应用于帮助城市策划者分析精细的城市结构和监视城市土地使用变化。而且在将来从多源数据获得的其余数据将会融合进这个提出的框架中。

介绍

①城市土地使用模式

LULC(土地使用和土地覆盖):

  土地使用和土地覆盖信息包含许多领域重要的地域空间特征,例如,城市规划,政府管理,和可持续发展。

城市土地使用模式:

  中国经济和城市的快速发展生成了多种多样复杂的城市功能区,功能区反映了城市土地使用模式。

  土地使用模式不只受政府政策的影响,也受随城市发展而持续改变的室内生活方式的影响。

  Therefore,土地使用模式的有效检测对于制定有效的城市规划很是重要。在近期的研究中,土地使用模式的有效检测是一个有争议的话题。

②利用HSR遥感影像进行LULC的检测。

  在最近的研究中,HSR影像分类模型能够普遍地应用于提取和分析土地使用和土地覆盖(LULC)。LULC的分析主要由三个空间单元组成:像素,物体 和场景。物体用来评估土地覆盖,场景常常用于鉴别城市功能区和评价城市土地使用模式。

  许多研究采用面向对象分类(OOC)模式经过地物的物理特征(例如光谱,形状和质地特征)来提取城市土地使用模式。However,OOC模型常常忽视地物的空间分布及语义特征,由于它们旨在挖掘地物低级语义土地覆盖信息。

  因为在挖掘足够的信息方面存在困难,上述传统分类模型很难使用传统遥感分类模型分类出的典型专题特征去鉴别土地使用分类。困难是因为跨越“语义鸿沟”的问题。

③高、低级语义特征对比

  简单来讲,低等级语义特征代表“信息”直接来源于数据,而高等级语义特征指的是指针对每一个用户和应用程序的“知识”。语义鸿沟指的是这两个级别之间特定的功能差别。

  在图像解译的领域,低等级语义特征直接从影像数据中提取,例如颜色和纹理,只可以表达物理属性。 不一样的物体可能有相同的物理属性,相同的物体也可能有不一样的物理属性。因此使用低等级的语义特征进行图像分类极可能是不正确的。

  可是,将高级语义特征(即人类操做员根据用途和其余信息赋予对象的各类属性)引入图像分类中,可能会以较高的准确性进行更明确的分类。例如,有一系列包含不一样场景的HSR图像,能够基于低级特征描述来识别土地覆盖物对象,例如 建筑物。 可是,尝试捕获高级潜在语义概念的目的是寻求不一样的功能类型,例如住宅区,商业区和工业区。

④HSR场景分类

  为了弥合LULC之间的“语义鸿沟”,最近的研究已将“场景分类”的概念引入到HSR图像分类中,以用单个类别标记场景。当前的大多数研究都应用了词袋(BoW)建模方法,并经过几率主题模型(PTM)融合了地面场景的物理特征,以提升具备高级语义信息的城市土地利用类型的检测准确性。

  Zhang et al.(2015b)引入了线性Dirichlet混合模型(LDMM),该策略融合了HSR图像和道路网络数据,以检测每一个土地块中土地使用的百分比

HSR提取特征的局限性

  可是,从遥感图像中提取特征只能表明地面成分的外部天然物理特性,而区域土地利用类型一般与室内人类社会经济活动具备很强的相关性,而这很难从HSR图像中提取。

⑤社交媒体数据可反映室内人类经济活动

  为了解决这个问题,最近的研究提出了“社会感知”和“城市计算”的概念。引入了多源社交媒体数据,例如浮动汽车的全球定位系统(GPS)轨迹移动电话信号社交媒体的签到数据兴趣点(POI),以监视住宅活动和城市土地使用动态 。 许多深刻的讨论代表,多源社交媒体数据具备揭示城市土地利用模式的巨大潜力。

  Yuan等。 (2012年)提出了一个基于POI的语义分析模型DRoF来绘制城市功能区(Yuan等,2012)。 Yuan和Zheng(2015)引入了潜在狄利克雷分配(LDA)模型,该模型结合了浮动汽车的GPS轨迹和POI频率来挖掘具备高级语义信息的城市土地利用类型,这能够改善基于HSR图像的方法

⑥上述两种方法各自的局限性及本文提出的方法

  可是,这些方法仅利用一种类型的数据,而不是将HSR图像和社交媒体数据中的地理空间信息融合到土地利用类型的检测中

  城市土地利用类型类似的地区每每具备类似的外部天然-物理特性和室内人类社会经济活动模式(Yao等人,2016),例如,仅仅利用遥感图像信息而不使用室内人类活动信息很难将中央商务区(CBD)和带有高层塔楼的住宅区区分开。另外一方面,都是人类活动较少的地区,光秃秃的田野和农田,能够经过从遥感图像中识别天然物理特性来区分。

  如前所述,咱们的研究旨在经过结合几种机器学习和天然语言处理(NLP)模型来融合从HSR图像(遥感信息)和多源社交媒体数据(社会感知信息)做为对城市土地利用进行分类并经过人工解释评估分类模型的准确性和可靠性的模式。该模型用于检测广州市海珠区的土地利用方式,广州海珠区是中国南方最发达的城市之一,具备多种土地利用类型。经过组合各类特征并比较相应的分类结果,咱们获得了特征与土地利用分类结果的最佳组合。

2、研究区域和数据

①海珠区基本状况

  研究区域位于广东省广州市海珠区(图1(a)),总面积102平方千米,常住人口约1,010,500。 广州被认为是华南地区的政治,文化和经济中心。 做为广州四个市中心区之一,海珠区的城市结构很是复杂,混合了多种土地利用类型,例如住宅社区,购物中心,医疗设施和教育建筑。

②对图1(a)(b)进行解释说明

  图1(b)显示了2014年海珠区的高空间分辨率(HSR)Worldview-2图像,其网格尺寸为34,263×14,382,空间分辨率为0.5 m。 根据OpenStreetMap提供的路网数据HSR图像官方城市规划数据,咱们将图像分为593个土地斑块,相似于交通分析区(TAZ)(Long and Thill 2015)。

  图1(a)经过人工解释显示了研究区域中主要土地利用类型的分类结果,其中包括公共管理服务用地(M),工业用地(I),绿地(G),商业用地(C) ,住宅用地(R),公园用地(P)和城市村庄(U)。

 

 

 

 

 表1. 案例研究区域:广东省广州市海珠区。 (a)在交通分析区一级的单位内经过人工解释得到的城市土地使用数据; (b)Worldview-2卫星在研究区域内提供的高空间分辨率(HSR)遥感图像; 前面的黑线表明从OpenStreetMap(OSM)下载的道路; (c)高德兴趣点(POI)的空间分布密度。

 

③多源社交媒体数据

  社交媒体数据包括OpenStreetMap(OSM)道路网络(http://www.open streepmap.org),高德POI实时腾讯用户密度(RTUD)(http://heat.qq.com),用于补充HSR图像提取的特征,并丰富用于研究区域土地用途识别的其余信息。

  咱们研究中的POI由高德地图服务(http://lbs.amap.com/)提供,高德地图服务是中国最受欢迎和最大的网络地图服务提供商之一。 咱们经过高德地图API(图1(c))从研究区域中的432个类别的大约123,915条记录中得到了POI(包括企业,商业场所,教育设施(幼儿园,小学和中学),居住社区,临床) 设施和风景名胜区。

  RTUD是适用于t语义分类的新数据集,其中包含使用腾讯应用程序(例如,腾讯移动应用QQ(相似于Messenger的软件),微信(移动聊天软件),Soso Maps( Web地图服务和导航软件)以及其余提供LBS服务的移动应用程序。图2经过在25 m的空间分辨率下分别计算工做日和休息日数据的平均值来显示RTUD时间序列数据。

  先前的研究代表,均值过滤是一种有效的社交媒体数据预处理方法,能够减小数据大小和计算需求,而不会形成太多信息丢失。

 

 表2. 研究区域中实时腾讯用户密度(RTUD)的时间序列数据集。 (a)工做日9:00,(b)工做日17:00和(c)工做日22:00,(d)休息日9:00,(e)休息日17:00和(f)休息日22:00

 

3.方法

 

图3.经过语义模型融合多源地理空间数据(包括HSR图像和多源社交媒体数据)而提出的城市土地利用分类模型的流程图。

①研究方法总述(4步)

  该模型的流程图如图3所示。咱们的研究目的是经过融合HSR遥感图像和社交媒体数据中的多源特征,对主要的城市土地利用类型进行分类。在这项研究中,咱们采用了如下四个步骤来肯定每一个交通分析区域(TAZ)中的城市土地利用类型。

  首先,咱们使用窗口扫描从遥感图像中提取特征。 提取的特征经过光谱,纹理和空间包络特征进行表征,并同时使用尺度不变特征变换(SIFT)提取旋转不变特征。

  其次,咱们使用k-means聚类方法将上一步中提取的特征和RTUD数据分为几类,并主观定义POI的类型。 咱们得到了大量视觉单词,这些单词经过k-means算法进行聚类并被视为中级特征,以便将它们与低级原始特征和高级语义词汇特征区分开来,并构建了多源词典 BoW。

  第三,咱们基于开源的OSM道路网络数据在研究区域中描绘了TAZ,并计算了从每一个TAZ中的HSR图像和社交媒体数据中提取的特征词。 经过使用PTM,咱们将基于特征词出现频率的潜在语义特征挖掘到高维语义向量中。

  最后,咱们应用了多类支持向量机(SVM)模型。 咱们使用在地面上验证的选定土地使用数据来训练SVM模型,以对城市土地使用类型进行分类,并评估语义特征不一样组合下的分类性能。

②环境支持

  咱们的研究团队在Windows 8.1(×64)上使用C ++实现了如下所述的模型,包括CGAL(http://www.cgal.org),GDAL(http:// www.gdal.org/)、OpenCV(http://opencv.org/)和  LIBSVM(http://www.csie.ntu.edu.tw/~cjlin/libsvm/)。 基于LDA的主题模型的源代码可从普林斯顿大学(http://www.cs.princeton.edu/~blei/topicmo deling.html)得到。

3.1 空间特征提取

①HSR图像信息及利用

  HSR图像包含丰富的光谱和空间信息。 在全部特征描述符中,HSR图像的光谱和纹理特征可以反映出地面成分的内部成分和色调变化。 SIFT特征描述符能够处理地面组件的模式识别的拉伸,旋转和视角变化,这已在图像分析中获得普遍应用。 本文从HSR图像中提取的模式相似于Zhong等人基于语义分配级别(SAL)的PTM模型中的模式。 

②光谱特征的表示

  为了下降从HSR图像提取光谱特征时的计算复杂性,咱们采用具备必定大小的窗口和间隙,并为每一个HSR图像提取每一个波段的均值和标准差(STD)。 所以,第i个窗口中心的光谱特征 能够表示为其中B表示频段计数。 咱们能够继续一些均匀间隔的光谱特征向量。

③纹理特征的表示

  灰度共生矩阵(GLCM)有效描述图像和纹理的图案。 与光谱特征类似,咱们将图像的灰度级压缩为八幅图像,并提取四个基于GLCM的Haralick特征统计量,包括每一个窗口中具备必定大小的相关性,ASM,能量,对比度和同质性。设B为带宽,第i个窗口的纹理特征为:

 

④SIFT(尺度不变特征变换)描述图像局部特征

  在这项研究中,咱们介绍了两种方法(SIFT和GIST)来描述图像的局部特征。

  第一种方法是在每一个窗口中计算SIFT功能。 先前的研究代表,当采用128维矢量表示SIFT特征时,它能够实现最佳的优化配准性能。为了下降计算成本,咱们得到了HSR图像的第一部分,而后采用窗口扫描的方法来提取SIFT特征向量,其中第i个窗口中心的SIFT特征为

  在描述整个场景时,咱们一般使用部分模式而不是全局模式。因为HSR图像的复杂性和不肯定性,该方法不只计算和存储成本高,并且在两个场景相同但具备不一样的内部地面份量空间分布的状况下也会致使误分类。为了解决这个问题,咱们引入了奥利维亚等人提出的GIST空间包络特征,其在宏观层面上描述图像场景的有效性已在最近的研究中获得证明。

⑤GIST(空间包络)描述图像局部特征

  SIFT描述符最初旨在识别在不一样条件下出现的同一对象,而且具备很强的区分能力。 “ GIST”是场景的抽象表示,能够自发激活场景类别的内存表示,而且在识别天然场景类别例如 山和海岸。 GIST被认为是一种常见的空间包络特征描述符,能够充分描述五个不一样的空间包络场景,包括天然度开放度粗糙度膨胀度坚固性。 在咱们的研究中,咱们将每一个窗口划分为4x4,并计算每一个波段的GIST特征。 与SIFT类似,第i个窗口的主要GIST特征是:其中,B表明带宽。

⑥社交媒体数据

转折句:

  尽管遥感数据能够充分表明地面组成部分的物理属性,但不能说明人类活动形成的社会经济属性。

  社交媒体数据能够补充有关人类活动的信息。 先前的研究代表,POI的分布能够有效地用于说明地块的功能。在这里,咱们将POI类别介绍为一种反映社会经济属性的虚拟词语类型。 而后能够经过过滤的RTUD时间序列得到人类活动的模式,其时间和值很重要。 城市居民活动的特色与周围环境和城市功能区密切相关。 所以,RTUD的时间序列能够表示某些区域的功能模式。 所以,咱们将每一个窗口的RTUD模式描述为,j表示研究区域内的第j个窗口,w和r分别表明工做日和休息日的时序曲线

 

3.2 创建多源BoW词典

①定义向量

  假设某城市存在某个区域R,其多源特征能够描述为,其中i,j和k分别指示R区域中RTUD数据的窗口中心,POI和栅格中心。 请注意,是一个多维向量。 咱们使用k-means方法对BoW词典中的每一个特征进行聚类并将其转换为某个虚拟词。 所以,区域R中的特征词能够描述为一个文档,其中wordPOI是内部POI类别的集合,在此基础上,咱们能够应用主题模型来识别和分类多源文档。

 ②创建过程

  须要在较大的研究区域中提取大量的特征数据,这会致使在聚类过程当中效率低下。 当特征数量超过500,000时,咱们选择了500,000个数据点的随机子集,经过k均值聚类进行初步聚类,并经过轮廓估计进行迭代以优化结果。 基于经过初步聚类过程得到的聚类中心,计算出欧几里得距离,以估计每一个中心与其余未标记语义特征向量之间的类似性; 未标记的特征被分类为最接近的特征。

3.3 经过PTMs和SVM进行语义分类

 

 图4:(a)pLSA和(b)LDA的几率图形模型。 节点W,Z,D分别表示虚拟词,主题和文档(或图像),而α表示节点的Dirichlet分配

LDA模型中的主题。

  如图4所示,PTMs(包括几率潜在语义分析(pLSA)和LDA模型)旨在评估生成的虚拟单词和挖掘文档的潜在语义特征。 PTMs已被普遍应用于NLP领域。 并且,近年来在HSR图像的场景分类中取得了使人满意的结果。

①LDA解pLSA的过拟合问题

  pLSA利用文档,主题和单词之间的关系,分解单词wj的几率,这出如今BoW与几率和总几率公式结合的论文中。

 

   在等式(1)中,展现了潜在语义空间中的基本向量,而表明主题分布,能够将其视为给定文档的语义特征。 所以,咱们将向量集应用于表示文档。

  pLSA模型存在过拟合的问题,由于它表示的每一个文档只是某个主题离散几率的数字形式。 它没法在训练数据集以外挖掘语义特征。 为了解决这些问题,新的基于LDA的pLSA模型假设语义困惑参数受Dirichlet分配的约束。对于具备K个给定主题的某些文档,向量组中的每一个向量都遵循带有参数的Dirichlet分配。 LDA定义原始潜在语义分布的几率函数是解决pLSA缺点的关键。

②PTMs和SVM进行语义分类的过程

  基于OSM道路网络数据,咱们将研究区域划分为几个TAZ。 将每一个TAZ视为一个地块,咱们计算了全部要素类中视觉单词的分布频率,并将结果输入到PTMs模型中,以计算高维潜在语义特征。

  而后,将在先前的研究中已被证实在对高维特征进行分类方面具备很高的效率的SVM应用于咱们提出的模型中,以识别TAZ中的城市土地利用类型。 因为SVM是二进制分类器,所以咱们采用多分类器组合的方法来训练和分类每一个TAZ中的潜在语义特征。

  最终分类结果由每一个TAZ中最常出现的类别给出。

③本研究的训练过程

  在这项研究中,咱们在每一个类别中选择50%的训练样本,这些样本的特征被随机组合并输入到多类别SVM分类器中。 其他50%的数据用做测试数据。 SVM分类器由LIBSVM软件包实现。

  在训练过程当中,咱们使用训练数据集的25%做为验证数据集,并使用Kappa评估模型校准。 须要调整带有径向基函数(RBF)内核的SVM的两个敏感参数,惩罚C因子和内核参数NU。 咱们设置并经过网格搜索方法搜索最佳参数,其中优化目标是最大化Kappa。

4.结果

4.1 经过不一样的特征组合来进行场景分类

表2:经过语义特征进行不一样组合的场景分类结果

 

 

 

 

 图5:经过语义特征的不一样组合得出的基于LDA的土地利用分类结果。(a)光谱,纹理和SIFT,(b)光谱,纹理,SIFT和GIST,(c)POI,(d)RTUD,(e)POI和RTUD,以及(f)光谱,纹理,SIFT,GIST ,POI和RTUD。

 

 

图6:经过pLSA的场景分类结果混淆矩阵。 功能组合:(a)光谱,纹理和SIFT,(b)光谱,纹理和SIFT。 GIST,(c)POI,(d)RTUD,(e)POI和RTUD,以及(f)光谱,纹理,SIFT,GIST,POI和RTUD。

 

   表2显示了不一样的特征组合方法及其平均精度,图6显示了每种组合的分类结果(图5)中最接近平均准确度的混淆矩阵。 为了确保分类结果的可靠性和稳定性,咱们对每组重复进行了100次分类过程,并计算了平均分类准确性。

 ①LDA模型和pLSA模型对比并分析其缘由

  如表2和图5所示,HSR图像或社交媒体数据中基于PTM的语义特征可用于区分地块的功能类型。 关于SVM分类的准确性,LDA模型生成的语义特征比pLSA模型生成的语义特征稍高。 现有研究代表,在测量预测新文档的复杂性时,LDA比pLSA更好。

  咱们的研究区域位于广州市区,高度混合的土地利用斑块做为天然保护区中的主题混合文档,这将使LDA模型产生更好的分类结果。所以,这项研究采用了额外的二进制除法程序来优化LDA模型的敏感超参数α,相关参数对分类结果的准确性的影响将在如下部分讨论。

② 从结果分析仅使用HSR图像进行研究的局限性

  传统的基于HSR图像的场景分类方法仅考虑光谱,纹理和SIFT特征,只能在复杂的城市土地利用分类中得到较差的分类精度。将GIST特征用于宏观描述场景并不能提升分类的准确性,由于使用从遥感影像中提取的天然-物理语义特征对区分高度混合的土地利用斑块具备挑战性。

  如图6(a,b),7(a,b)和表3所示,仅应用纹理特征时,商业用地(图5(a,b)中的#1和#5)很容易与住宅混合 土地,工业用地和城市村庄,由于商业用地一般普遍分布在遥感影像中,并表现出复杂的空间格局。所以,从遥感图像中提取的天然物理特征不能反映城市功能区的内部特性和结构。

 

 

 

 

 图7.经过LDA的场景分类结果混淆矩阵。 功能组合:(a)光谱,纹理和SIFT,(b)光谱,纹理,SIFT和GIST,(c)POI,(d)RTUD,(e)POI和RTUD,以及(f)光谱,纹理, SIFT,GIST,POI和RTUD。

③社交媒体数据对结果的影响

  图6(c,d),7(c,d)显示了从社交媒体数据(如POI和RTUD)中提取的语义特征,它们是城市土地利用类型与人类活动(包括商业用地和居住用地)的高度相关性。 这两种数据的分类准确性明显提升; 总准确度和Kappa分别提升9.95%和16.58%。

  与POI相比,RTUD能够有效地区分居住区和城市村庄,这能够说明时间序列人口密度更可以反映城市区域内地面真实土地用途的类型。 基于POI的语义特征比RTUD更好地区分了城市村庄,这说明POI的分布与人们的室内习惯相比在城市村庄识别中具备更大的优点。

  如图5(c,d)所示,能够经过基于RTUD的语义特征来充分识别人类活动稀少的城市区域,例如绿地和公园地。 所以,将POI和基于RTUD的语义特征组合在一块儿进行分类。 与每种类型的特征(C组和D组)的独立应用相比,该模型得到了更好的结果,后者的整体准确度(OA)和Kappa分别增长了0.03-0.05和0.04-0.05。

④当同时使用HSR图像和社交媒体数据时获得的效果最好

  在特征组合测试的F组中,咱们将全部语义特征输入SVM以对土地利用类型进行分类,并得到最佳的分类结果,其中OA和Kappa超过0.80。 从实验结果中,咱们发现能够区分人类活动稀疏的区域(例如绿地和公园用地)和土地使用类型复杂的区域(例如商业用地和居住用地)。例如, 当只考虑基于遥感或基于社交媒体的语义特征时,如图5#2所示,当仅将公共管理服务用地划分为公园用地(图5(b)#2)和住宅用地(图5(e)#2)时,分类不正确。

  可是,经过融合两个建议的主要特征能够正确地识别地块(图5(f)#2)。 经过在建议的模型中将每一个HSR区中的HSR图像的天然-物理特性和社交媒体数据的社会经济特性融合在一块儿,能够得到最佳的分类结果。

 

 表3:经过语义特征的不一样特征组合,每种土地利用类型的场景分类精度

4.2 参数敏感性分析

  在本节中,咱们评估分类精度与咱们提出的模型的三个关键参数之间的相关性,其中包括样本窗口的大小构成BoW的聚类类别的数量以及PTM中使用的主题数量。 在先前的研究中已经充分讨论了用于提取HSR图像中地面成分的天然物理特性的样本窗口的大小因子。 根据Zhong(2015)的结论,咱们将HSR图像分割为25x25个像素的一组重叠图像块,以肯定光谱,纹理,SIFT和GIST特征。 每对相邻的补丁设置为重叠15个像素,以保留足够的空间信息。

 

 图8:将PTM的主题数设置为100,将LDA的Dirichlet主题分配参数α设置为0.8,使用不一样的k均值聚类数(x轴)对场景分类结果进行准确性评估(y轴)。 (a)pLSA和(b)LDA。

 

 图9:将k均值的聚类数设置为500,将LDA的Dirichlet主题分配参数α设置为0.8时,使用不一样的PTM初始主题数(x轴)对场景分类结果进行准确性评估(y轴)。 (a)pLSA和(b)LDA。

 

 图10.PTM的主题数设置为100,k均值的聚类数设置为100时,使用LDA的不一样Dirichlet主题分配参数α(x轴)进行场景分类结果的准确性评估(y轴)。

① 结合图分析各个参数敏感性

  先前的几项研究代表,视觉单词的数量和初始主题对基于PTM的场景分类的分类准确性有重大影响。 可是,得到最佳主题的方法仍然是一个未解决的问题。

  图8和图9显示了k均值簇数,PTM主题数和分类准确性之间的关系。pLSA和LDA模型都可以在某个窗口区域内得到相对较好的性能。 图8证实了k均值聚类数量的减小会致使基于PTM的场景分类的分类结果的准确性稳定而且几乎没有波动。

  所以,在固定K值的状况下,pLSA和LDA的准确性水平表现出最初的明显误差,并最终致使初始主题数量的增长(图9)。 因为Dirichlet主题分配参数α的最佳结果不肯定,所以基于LDA的场景分类结果的准确性表现出很大的波动性(图10)

  在多源空间数据融合场景分类领域,获取最佳初始主题数和α的方法还没有解决。 经过以上对模型参数的敏感性分析,咱们分别选择了k均值的聚类数和PTM的初始主题数,分别为500和240。

5. 讨论

  在有关HSR遥感和社交媒体数据分析的最新文献中,提升城市LULC分类准确度一直是一个重要问题。 可是,不多有研究有效地融合了从多源地理空间数据中提取的语义上的各类特征。 这项研究提出了一种有效的框架,经过融合从HSR图像和社交媒体数据(如高德兴趣点(POI)和RTUD)提取的语义特征,对城市土地利用进行分类。

①对本研究结果的讨论

  这项研究结合了从PTM得到的几种不一样的语义特征,并将其输入到SVM分类器中。 结果代表,HSR图像和社交媒体数据都可对城市土地利用类型进行高精度分类。

咱们的发现与之前的研究一致,即HSR图像有利于识别农村地区的天然成分,而社交媒体数据的使用对于人口密度高的大都市区更好。将全部功能组合到SVM分类器中后,结果得到了最高的准确性(OA = 0.865,Kappa = 0.828),这代表咱们的模型能够有效地融合HSR图像和社交媒体数据中的天然-物理和社会经济信息,从而得到更高分辨率的 城市土地利用分类。

②将来可进行的研究(数据方面)

  一方面,在将来的研究中,咱们指望引入更多开放的社交媒体资源(例如移动数据和浮动汽车轨迹); 另外一方面,基于全球敏感性分析(GSA),将评估来自不一样数据源的数据对不一样类型土地利用类型进行分类的适用性。 此外,咱们使用了大量的遥感图像样本和多种类型的开放式社交媒体数据来构建训练数据集,并对不一样类别和准确性进行敏感性分析。 这项工做将帮助咱们创建一个框架,以了解不一样级别的城市土地使用模式。

③更细粒度的土地利用方式来替代TAZ

  在许多涉及城市土地用途划分,场景分类和城市功能区分类的研究中,TAZ被用做基本单位,而在中国大城市的城市研究并不罕见。 他们的结果代表,使用TAZ来识别城市土地利用模式是合理和有效的。 可是,实际上确实存在城市地区的混合土地使用,甚至单个建筑物都具备不一样的功能。 面对这个问题,多源地理空间数据,包括社交媒体数据和HSR图像,可能会提供一种新工具来量化土地使用的混合性,并在将来区分实际的土地使用状况和城市规划。 所以,在将来的研究中,应该肯定更细粒度的土地利用方式来替代TAZ。

④土地混合使用问题

  这项研究的目的是在语义模型的框架内探索多源空间数据的整合,从而有效地分析每一个研究单位(TAZ)的主要土地利用类型。 可是,城市土地使用方式复杂多样,尤为是在中国的特大城市中。 例如,在咱们的研究区域中,许多多功能土地用途与生活和商业功能混合在一块儿,这增长了经过人工解释或培训样本选择来识别土地用途的难度。 尽管咱们已经对土地用途进行了硬分类,但已经得到了较高的准确性,但结果是基于对数据的准确和人工解释。 所以,在将来的工做中,应基于开放的社交媒体数据在将来的研究中考虑土地混合使用的问题。

6. 结论

研究课题的意义:

  快速的城市发展致使城市内土地利用类型的多样化和复杂化。 因为城市规划者和政府决策者必须考虑到土地利用的现状,所以及时而充分的城市土地利用信息无疑将促进城市的可持续发展。 可是,城市土地利用方式的复杂性和融合性给准确有效地绘制城市土地利用绘图带来了巨大挑战。

本研究的框架步骤:

   一个框架:经过融合从HSR遥感影像和多源社交媒体数据中提取的多源语义特征,在TAZ单位级别对主要城市土地利用类型进行分类。 首先,咱们从HSR图像和开放的社交媒体数据(包括POI和RTUD)中提取了各类特征,并创建了基于k均值的BoW和全部特征类别的字典。 在第二步中,引入了包含pLSA和LDA的PTM以提取多源语义信息。 最后,咱们将不一样类型的语义特征融合并输入到广州海珠区的多类SVM分类器中。

 结果:

   结果代表,该模型能够有效地融合从HSR图像和多源社交媒体数据中提取的天然,物理和社会经济语义特征,以得到最高的城市土地利用分类精度(OA = 0.865,Kappa = 0.828)。

将来工做:

  咱们可能会继续从如下三个方面来研究融合模型:首先,发现各类开放式社交媒体数据在检测城市土地利用方面的潜力; 其次,利用该模型提升了城市土地利用融合模式检测的准确性。 最后,讨论应用从城市土地利用图提取的空间信息进行深度学习的可行性。

相关文章
相关标签/搜索