【空间数据分析】全局莫兰指数(Global Moran’s I)
衡量空间数据是否存在聚集性或空间自相关性的统计量
空间自相关(Spatial Autocorrelation)描述的是:空间位置相近的单位,其属性值是否也相似?“相邻的空间单位之间是否相互影响”
----它衡量某个变量在空间上是否存在“聚集”现象,或者是“随机”分布,还是“离散”分布
Moran指数(又称莫兰指数)反映的是空间邻接或空间邻近的区域单元属性值的相似程度。Geary 指数与Moran指数存在负相关关系。
全局莫兰指数(Global Moran’s I)
全局莫兰指数(Global Moran’s I) 是一种用于衡量整个研究区域中变量是否存在空间自相关的统计方法。它可以告诉我们:
-
相似的值是否在空间上更可能聚集在一起(正空间自相关);
-
不同的值是否更可能相邻(负空间自相关);
-
或者空间上是否随机分布(无空间自相关)。
公式与含义
公式
课本上
公式
其中:
空间权重矩阵(W)
方法 | 含义 |
---|---|
邻接(0-1) | 相邻为1,不邻为0 |
距离倒数 | 越近权重越大:wij=1 |
距离带 | 指定范围内为1,超出为0 |
Global Moran's I 公式的本质是:拿“属性值是否相似”这件事,和“空间位置是否接近”这件事挂上钩,看它们是否一致。
所以这个式子是一个协方差(数值之间的相关性)和一个空间权重(地理上的关系)结合而来的
想知道 xi和 xj的值是不是“朝一个方向偏”:
协方差
都比平均值高 ⇒ 正相关;
一个高一个低 ⇒ 负相关
地理位置上的邻近性 —— 用 wij表示
例子:
手动计算全局莫兰指数(Global Moran's I)-----公式的含义和实际计算方法
全局莫兰指数-------判断某个变量(比如收入、房价、污染值)在空间上是不是聚集的。
-
如果高值聚在一起,低值也聚在一起 —— 就是正相关(值相似的靠得近);
-
如果高值旁边是低值、低值旁边是高值 —— 是负相关(异值相邻);
-
如果值是随机分布 —— 就是没什么空间自相关。
假设有 4 个地区,它们的属性值是房价(单位:万元),并且只考虑“是否相邻”的空间关系(1 表示相邻,0 表示不相邻)
已知:
-
A 与 B、C 相邻;
-
B 与 A、D 相邻;
-
C 与 A、D 相邻;
-
D 与 B、C 相邻
区域编号 | 房价 xi |
---|---|
A (1) | 100 |
B (2) | 120 |
C (3) | 80 |
D (4) | 90 |
空间权重矩阵 wij(邻接矩阵)
A | B | C | D | |
---|---|---|---|---|
A | 0 | 1 | 1 | 0 |
B | 1 | 0 | 0 | 1 |
C | 1 | 0 | 0 | 1 |
D | 0 | 1 | 1 | 0 |
计算:
空间权重总和 W
8 个邻接对,wij=1
W=8
计算分母:总离差平方和
整个数据的离散程度。用来做“标准化”,让莫兰指数的值可比较(在 -1 到 +1 之间)
计算分子:空间协方差
这是i 和 j 的“方向是否一致”的衡量:
如果都大于平均值 ⇒ 正 × 正 = 正值 ⇒ 值相似;
如果一个大一个小 ⇒ 正 × 负 = 负值 ⇒ 值相反;
如果都低于平均 ⇒ 负 × 负 = 正值 ⇒ 值相似。
它反映“值的相似性”
空间加权协方差
看“值相似”这个现象是不是主要出现在空间上接近的地方
只计算有邻接关系的那些 wij=1
加总这些值:
分子=56.25−43.75+56.25−168.75−43.75+131.25−168.75+131.25=−50
=−0.0286
Global Moran's I ≈ -0.0286(接近 0)
说明这组房价数据在空间上基本没有显著的聚集性或离散性,接近随机分布
系数,让整体结果不受区域数量的影响
过程步骤:
值域
莫兰指数值 | 含义 |
---|---|
I > 0 | 正空间自相关(相似值聚集)(高-高,低-低) |
I = 0 | 空间无自相关(随机分布) |
I < 0 | 负空间自相关(异值相邻)(高-低混合) |
一般来说,值越接近 +1 表示越明显的空间聚集,越接近 -1 表示越明显的空间离散。
进行检验
空间自相关的直观理解
可以类比于“时间序列”中前后数据点的相关性,空间自相关指的是“空间邻近区域之间的数据值是否相似”。
-
举例:如果一个城市周边的城市房价都很高,那么“房价”这个变量就具有正的空间自相关。
-
如果高房价的城市旁边是低房价的城市,那么就可能表现为负的空间自相关。
为什么要使用 Global Moran’s I
在空间数据分析中,莫兰指数具有重要意义:
-
检验空间聚集性:告诉你某个属性是否在空间上存在模式,而不是随机分布。
-
判断模型适用性:如果存在空间自相关,不能直接用传统回归分析,应该考虑空间回归模型。
-
探索空间结构:帮助识别空间现象背后的机制,例如“高发病率区域是否存在空间传播”问题。
需要注意
只是“全局”视角
Global Moran’s I 只反映总体趋势,如果你想找“局部热点/冷点”,就需要使用 局部莫兰指数(Local Moran's I) 或 Getis-Ord G* 指数。
拓展:
这个文章讲的也很详细
空间相关分析(一) 空间权重矩阵-CSDN博客
空间相关分析(二) 全局莫兰指数的理解与计算-CSDN博客
这里手动计算一下上面文章中出现的例子:
这个手算一下过程:
理解解释:
白话空间统计之:Moran's I(莫兰指数)-CSDN博客