莫兰指数:背景篇
2020-03-14 本文已影响0人
寻松点点
统计学的相关系数与莫兰指数有什么联系吗?
在Emmanuel Paradis的《Moran’s Autocorrelation Coefficient in Comparative Methods》[1]找到了解释。


相关系数R(Rorrelation ceofficient)
全局莫兰指数(Global Moran's I )
$$
I=\frac {n}{S_0} \cdot
\frac{\sum\limits_{i=1}^{n}\sum\limits_{j=1}^{n}w_{ij}(x_i-\bar x)( y_i-\bar y) }{\sum\limits_{i=1}^n {(x_i-\bar x)}^2 } =\frac{ \sum\limits_{i=1}^{n}\sum\limits_{j=1}^{n}w_{ij}(x_i-\bar x)( y_i-\bar y) }{ S^2 \cdot \sum\limits_{i=1}^{n}\sum\limits_{j=1}^{n}w_{ij}}
$$
注释:



多数书籍文献中都会提到:
全局莫兰指数I在0至1取值,为正相关,表示具有相似的属性集聚在一起(即高值相邻接或低值相邻接);全局莫兰指数I在0至-1取值,为负相关,表示具有相异的属性集聚在一起(即高值与低值邻接、低值与高值邻接);接近于0,则表示随机分布,或不存在空间自相关性
莫兰指数公式可以查到,莫兰指数的含义可以查到;莫兰指数的运用可以查到。但我想明白这个公式的由来,这个公式的取值为什么在[-1,1]之间。
简单地说,我想理解莫兰指数,而不是仅仅是去调用现有的API接口。类似Python学多了,很多功能只要调用包就好了。于是会开始排斥停留在调用包的层面,试着去了解背后的实现。
在地理信息系统中,空间自相关分析通常用ArcGIS进行教学。可看到空间经济统计学的文章,也有用Geoda进行莫兰指数的计算来进行空间自相关分析。说到统计学,那么R语言就和统计学联系上了。
R语言也可以进行莫兰指数计算,于是这样找到了Emmanuel Paradis[3][4]的《Moran’s Autocorrelation Coefficient in Comparative Methods》的文章,去年(2019年)写的,也挺新的,参考价值很大。