[toc]
空间数据分析学习笔记
空间数据模型篇
- 地图认知模型针对不同的使用者分为不同的模型
- 设计者
- 使用者
- 地球模型的3面(2 + 1)
- 任意水准面,大地水准面
- 地球表面
- 大地坐标:由点和角度共同确定
- 地理格网:用于空间要素定位的定位参考系统
- 由经线,纬线组成
- 地理坐标系 = 地理格网? (1-P17)
- 变形分三种:
- 长度
- 面积
- 角度
- 投影:地理坐标 –> 平面坐标
- 1:100万地形图 / 省区图:兰伯特投影;除此均为高斯-克吕格投影
- 空间数据逻辑模型:概念模型 -> 物理模型的桥梁
- 栅格的形状有正方形、矩形
- 栅格数据的分层表示,每一层表示一种属性
- 栅格单元的边长:L = 1/2 * |S (1-P45)
- 镶嵌数据模型:小面块拟合物体自然表面
- 三维空间数据模型:面模型、体模型、混合模型(面模型 + 体模型)
- 四叉树:二二分,全相同的就不用再分割了
- 按列合并:
- merge:需要共同变量
- cbind: 直接添加
- 按行合并:rbind(列名相同)
- 空间数据:有空间坐标 / 相对位置的数据
空间自相关篇
- 空间相关性:变量通过空间邻近与自己相关,即某地发生的事件会影响到旁边地点发生的时间
- 空间异质性:地理空间上的区域分布不均,发展不均
- 空间统计常用方法:
- 点模式分析方法:
- 一阶
- 样方计数法
- 核密度法
- 二阶
- K函数,L函数
- G函数、F函数
- 最近邻指数NNI
- 一阶
- 面状数据空间模式分析
- 空间自相关分析
- Moran Index
- Getis G
- Genry’s C
- 空间自相关分析
- 连续空间数据分析
- 确定性插值
- 局部性插值
- 反向权重距离插值
- 径向基函数插值
- 局部多项式插值
- 全局性插值
- 全局多项式插值
- 局部性插值
- 不确定性插值
- 普通克里金
- 简单克里金
- 泛克里金
- 块克里金
- 协同克里金
- 确定性插值
- 空间回归分析
- 空间自回归
- 地理加权回归
- 点模式分析方法:
- 空间统计的工具:R, ArcGIS, OpenGeoDa, SaTSan, WinBUGS
- 空间自相关分析:指在邻近区域上某变量的同一属性值之间的相关程度,主要是利用空间自相关系数进行度量并检验邻域上属性变量是否呈现高高相邻,低低相邻,高低间错分布
,即有无聚集性 - 空间正相关:在邻域上,某变量的同一属性值表现出相同 / 相似的相关程度,即属性值在空间区域上呈现高的地方,邻近区域也高。即呈现出聚集的趋势,为聚集分布
空间负相关:在邻域上,某变量的同一属性值表现出不同的相关程度,即属性值在空间区域上呈现高的地方,邻近区域反而低,即呈现出互斥的趋势,为均匀分布
空间不相关:在邻域上,某变量的同一属性值没有表现出任何依赖关系,即呈现随机分布
7. 空间自相关分析分为:
- 全局空间自相关分析
- 定义:在整个研究区域范围内分析变量在空间分布上的聚集程度
- 全局Moran’I:
- 公式:区域间的协方差和方差之比
- 反映属性变量在整个研究区域范围内的空间聚集程度
- 性质:
>0
: 空间正相关,聚集分布>0
: 空间负相关,离散互斥=0
: 空间不相关,随机分布
- 局部空间自相关分析
- 定义:在特定的局部区域范围内分析变量在空间分布上的聚集程度
- 局部Moran’I:
- 公式:同上,大体相同
- 反映属性变量在局部区域范围内的空间聚集程度
- 性质:同上
- 【注】不论哪种莫兰指数,要使莫兰指数要有意义,必须建立在已经做了显著性检验(基于蒙特卡罗的随机化零检验、Z显著性检验)的基础上
空间点模式分析篇
- 点模式分析方法分为两类:
- 基于密度的方法 –一阶效应(取决于绝对位置)
- 基于距离的方法 –二阶效应(取决于相对位置和距离)
- 某点的密度:该点在单位面积内事件点的数量 / 面积
- 若不进行显著性检验进行判断,则只能将当前观测到的频率分布与已知的频率分布做比较,去找显著性差异,从而判断点的分布类型
【注】一般将随机分布模式作为标准分布模式 - 点模式分析用到的方法汇总:
- 样方分析法:
- 样方大小:
2A(研究区域的面积) / n(研究区域点的数量)
- 显著性检验:
- K-S检验 (复杂)
- 方差均值比的开方检验 (比上一种更厉害~)
- ICS(聚集性指数)
ICS = s^2 / m - 1
- 结果
=0
: 随机分布>0
: 聚集分布<0
: 均匀分布
- ICS(聚集性指数)
- 缺点:不能反映样方里点的空间分布信息
- 样方大小:
- 核密度估计法:
- 基本思想:任意1个点在任意位置都有一个密度,这个密度是通过对以这个点为中心,指定带宽为半径的范围内事件点数量的统计,然后再除以这个范围的面积得出的结果。
这个密度反映了:事件点对该估值点的影响,距离事件点的距离越远,影响越小;反之,影响越大 - 带宽确定了,核密度函数的形式对密度估计值影响很小
- 基本思想:任意1个点在任意位置都有一个密度,这个密度是通过对以这个点为中心,指定带宽为半径的范围内事件点数量的统计,然后再除以这个范围的面积得出的结果。
- 最近邻距离法–最近邻指数NNI
- 使用每个点的最近邻距离作为判断点分布模式的依据
- G函数,F函数
- 使用每个点的最近邻距离的空间分布特征作为判断点分布模式的依据
- 通过图像表现分布模式
- K函数, L函数
- 使用不同尺度下的最近邻距离作为判断点分布模式的依据
- 样方分析法:
《空间数据分析》
《空间统计实战》