精华内容
下载资源
问答
  • 白话空间统计二十四:地理加权回归(三)

    万次阅读 多人点赞 2017-03-12 18:49:16
    如果说,空间统计有别于经典统计学的两大特征:空间相关性和空间异质性,莫兰指数等可以用来量化空间相关性,那么地理加权回归,就可以用来量化空间异质性。 在对全局回归问题的改进中,局部回归可以说是最简单的...

    本章有数学公式……对数学过敏者慎入……

    前文再续,书接上一回……上一次说到,在改进全局回归的基础上,GWR终于横空出世了,从此空间分析领域终于有了自己专用的回归算法。如果说,空间统计有别于经典统计学的两大特征:空间相关性和空间异质性,莫兰指数等可以用来量化空间相关性,那么地理加权回归,就可以用来量化空间异质性。

    在对全局回归问题的改进中,局部回归可以说是最简单的方法,GWR继续应用了局部回归的思想,但是在局部窗口的模式下,遵循了所谓的“地理学第一定律”,在回归的时候,使用了空间关系作为权重加入到运算中,下面通过一个示例来讲讲GWR的基本思想。

    首先看看全局回归和局部回归:

    在局部回归里面,设定一个窗口,然后按照设定的窗口大小,分别在每个局部中进行回归计算,实际上看来,就是一个缩小版的全局回归。

    在看看地理加权回归:




    地理加权和其他回归分析一样,首先要划定一个研究区域,当然,通常这个区域也可以包含整个研究数据的全体区域(以此扩展,你可以利用空间关系(比如k-临近),进行局部地理加权计算)……接下去最重要的就是利用每个要素的不同空间位置,去计算衰减函数,这个是一个连续的函数,有了这个衰减函数,当你把每个要素的空间位置(一般是坐标信息(x,y))和要素的值带入到这个函数里面之后,就可以得到一个权重值,这个值就可以带入到回归方程里面去。

     

    所以可以看到,最重要的就是这个距离衰减函数,正因为有个这个衰减函数,得出不同权重,这个方法才会被叫做“地理加权回归分析”。这个衰减函数的理论基础,正是Tobler提出所谓的“地理学第一定律(Tobler's First Law或者Tobler's First Law of Geography):位置越接近的数据,比远处的数据对结果的影响更大。这个影响在数学上,就化为了权重。

     

    利用这些公式,就可以对所有的样本点进行逐点的计算,每个样本点计算的时候,其他的参与计算的样本都会根据与这个样本点不同的空间关系赋予不同的权值,这样最后就可以得出每个不同样本的相关回归系数了。最后通过解读这些个系数,完成整个地理加权回归分析整个分析过程。

     

    一直在强调这个衰减函数,那么考虑一下如果没有衰减呢?没有衰减的话,就发现所有的权重都是一样的(权重全部为1,1乘以任何数,都等于其本身)……那这个方程就变成了全局回归方程了。这样脱离了地理学第一定律,就立马变回了经典统计理论。

     

    现在看看这个衰减函数如何来计算?

    下面先贴公式,有数学恐惧症的同学请略过:



    其中,W(ui,vi)是空间权重矩阵,这个概念请大家回头去看白话空间统计十七……不过鉴于大家难回头翻,我这里直接贴出来以前的内容吧:


    权重矩阵,我们看看看这个空间权重矩阵到底是个啥东东:

    左边这个东西,叫做无向图,由边那个,就是所谓的距离矩阵了。因为我们以前说过,在空间分析里面,需要进行空间关系的概念化,所以也通常称为空间权重矩阵。

    当然这个权重矩阵为了简单明了,所以用的直接就是用最短距离作了矩阵里面的元素,比如B和C的距离,直接通过矩阵可以查询到WBC = 2 。

    有权重矩阵之后,带入到矩阵中,得出如下方程:


    在实际应用中,常见的空间权重函数主要有以下几种:
    1、高斯函数:

    其中,b是带宽(窗口大小),dij是样本点i和j的距离(至于是哪种距离,就看选择了(欧式、曼哈顿、闵可夫斯基、球面、余弦等))。

    2、双重平方函数(bi-square)



    这两种距离函数都非常倚赖带宽b,那么这个带宽和确定呢?国际上最普遍的方法就是用Cleveland(1979)和Bowman(1984)提出的交叉确认(cross-validation,CV)方法来确定:


    这个方法,利用了拟合值来进行计算,其中


    就是i处的拟合值,(为什么不用观测值?答:观测值还要跟着一个非线性的残差……直接用拟合值,更容易计算),当CV值到达最小的时候,对应的b就是所需要的带宽。由于采用不同的空间加权函数会得到不同的带宽,那么为了取得最优的带宽,Fotheringham等在2002的论文中提出了这样一个准则:当GWR模型的AIC最小的时候,就是最佳带宽。

    好吧,这里又蹦出了一个新名词:AIC。。。那么这篇文章就以简介一下这个东东是个啥,来做一个结尾:

    Akaike information criterion、简称AIC,是衡量统计模型拟合优良性的一种标准,是由日本统计学家赤池弘次创立和发展的。赤池信息量准则建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性。(这句话来自百度)
    听完之后,反正虾神我的感觉是这样的:


    大家有兴趣自己去研究,最后贴出历史科普信息:

    下面这个老爷子就是赤池弘次,日文原版:


    有兴趣的同学,可以去他的纪念站点去看看

    http://www.ism.ac.jp/akaikememorial/


    本文的公式,摘自北京大学出版社的《空间计量经济学》沈体雁等编著,在虾神共享的书单里面有,有兴趣的同学之间去看。


    最后需要共享书单的,还是老规矩,通过公众号获取邮箱,然后发送一封需要啥东西的邮件即可。

    展开全文
  • 白话空间统计之:空间自相关

    万次阅读 多人点赞 2015-07-27 21:58:05
    空间自相关,肯定是空间统计里面第一个拦路虎了,很多人遇上了这个高大上的词汇,立刻就发现,这五个字我好像都认识,但是到底说了啥?不知道。如果翻开各种教材,从统计学到数学到物理学,各种解释都摆出了一副...

    白话空间统计之:空间自相关

    空间自相关,肯定是空间统计里面第一个拦路虎了,很多人遇上了这个高大上的词汇,立刻就发现,这五个字我好像都认识,但是到底说了啥?不知道。

    如果翻开各种教材,从统计学到数学到物理学,各种解释都摆出了一副“老子就是高大上学霸,屌丝学渣勿扰”的样子,这个东西真得就那么难么?虾神我就不信了,所以:I have a dream,就是写出一个最接地气的空间统计解释来。(好大的宏愿,阿弥陀佛老天保佑,别吹炸了。)

    首先,要明白一下空间自相关这个神奇的概念,不得不先说一个神奇的人物。他就是号称“近代地理学界的牛顿”的Waldo Tobler(金都 托布勒)教授。

    Waldo教授1930年生于瑞士,1961年在美国华盛顿大学获得博士学位,这一年也是风起云涌的一年,当今美利坚大统领奥巴马同学就是1961年出生的。

    似乎是老天爷见物理已经有了三大定律,而地理学一个也没有,于是在1969年(也有说1970年)的时候,上帝一挥手,让Waldo教授照亮地理学的天空吧。所以那一年,他发表了史称“地理学第一定律”的“Tobler’s First Law”(简称TFL),即为“all attribute values on a geographic surface are related to each other, but closer values are more strongly related than are more distant ones”翻译成大白话,就是:任何事情呢,都是有关系,只不过靠得越近,关系就越紧密。

    正如牛顿的三大定律开创了经典力学体系,地理学的第一定律也为计量革命提供了理论基础,从此,空间分析和空间统计领域再也离不开这个定律了。

    正如明代学者茅无仪评价孙子兵法“前孙子者,孙子不遗;后孙子者,不能遗孙子”,TFL也在地理学界做到了前者不遗,后者不能遗的境界。

    依照定律,空间中的每一个事务,都是有联系的,近的事务之间的联系紧密程度,要高于距离远的事务之间的联系程度。所谓的联系紧密程度,自然也可以说,两个事务会在某一方面,有相似的地方。

    那么空间自相关这个概念就被带出来了。

    什么是空间自相关呢?首先我们来看看下面一个例子:

    时间:课间操。

    地点:学校操场。

    当广播响起来的时候,所有学生都一路狂奔冲向操场(迟到要挨罚的),所以,校长在楼上,看见的应该是这样的一个场面:
    随机分布的学生群体
    怎是一个乱字了得,那么这就是所谓的“随机分布”,谁也不知道,哪个学生是哪个班的。

    随着体育老师的口令,慢慢得变成了下面这个场面:
    均匀排列的学生
    学生整整齐齐的占成了队列,每个人前后左右的距离都是一样,这个就是所谓的“均匀分布”,在这种均匀分布的情况下,照样没办法看出学生之间的关系。

    5分钟后,广播体操结束,同样随着体育老师的一声口令,解散,学生们就变成了下面这个样子:
    特征聚集的学生

    OK,现在就很明显的看出,不同的学生,自己就组成了自己的一个个小团体,这就是所谓的聚类。

    那么你作为校长,自然会在脑中脑补,为什么这几个学生会自然的聚在一起呢?肯定是共同的爱好或者共同的目的,至于这个团体,有哪些共同的爱好和共同目的,就是学生之间的某种特征了,比如学习好的会自动凑在一起;或者是喜欢打球的,会凑在一起。

    这种,每个学生,与他周围的学生之间,一般有一些共有的某种特征。理论上,如果有一个带有这种特征的学生出现在操场上,那么他身边出现的,就有很大可能与他有同样的特征,而且他们之间会产生潜在的依赖性。比如喜欢打球的学生,一个人肯定没办法打,所以自然需要有共同爱好的小伙伴在旁边。

    这种潜在的(因为没有很明显的表现出来,所以肯定是潜在的)的相互依赖性,就是所谓的“空间自相关”。

    对空间自相关的研究,是揭示空间数据分布的一个很重要的概念,而对空间自相关中的关联性程度的计算,就是研究空间自相关的主要方法了。

    那么,下一期,我们来聊聊衡量空间自相关的最重要的关联程度计算指标之一:Moran’s I(莫兰斯 I)值。

    展开全文
  • 前面的章节里面,我们看了很多关于空间分布模式的基本原理,从这一章节开始,我们讲一些具体的工具和算法的使用。 前面我们用莫兰指数、P值、Z得分啥的,可以得出一份数据是属于离散、随机还是聚集,并且通过各种...

    前面的章节里面,我们看了很多关于空间分布模式的基本原理,从这一章节开始,我们讲一些具体的工具和算法的使用。

    前面我们用莫兰指数、P值、Z得分啥的,可以得出一份数据是属于离散、随机还是聚集,并且通过各种指数,得出聚集或者离散的程度,这种指数就是我们在定量分析时候经常用手段之一。

    像莫兰指数这样的分析,在关注空间关系的同时,还要考虑属性,也就是并非单纯的在考虑空间上的聚集。而上篇文章我们说到,点数据分析里面,很多分析,并不需要(或者没有)数值型的属性,而仅仅考虑从空间位置上做分析。比如:纯粹空间位置数据聚集

    说到关于聚集,或者聚类,大家经常在网上看到这样的可视化:

    从上面可视化效果可以看到,一般只能表达XY两个属性维度,比如下面是全国各城市的气温,如果用温度进行聚类,是这个样子,可以很明显看见中国的气候分布,比如长江南北、关内关外,天山南北麓——

    但是,如果我用空间数据的空间位置作为聚类属性,那么就会变成这个样子——好像也蛮标准的:东北、华北、东南、华南、西北……

    但是这种聚类方式,叫做“空间聚类”,用的是空间维度为特征进行的属性聚类,实际上应该叫做“空间要素属性化”,是属于属性聚类的一种。至于啥叫空间聚类,先挖一坑,我们在后面的分析中会详细说明。

    请大家把“挖坑小能手”打在弹幕上

    跑题的内容先到这里,回到我们今天的内容。

    前面说到,在很多情况下,我们的分析并不一定要用到属性信息,比如这样的一种分析:

    在城市中,有各类POI的分布情况都不一致,比如下面这两份数据:

    左边是广州市越秀区所有的宾馆酒店,右边是越秀区所有的特色风味餐厅。二者的数据量都差不多,宾馆酒店的数量是589,而特色风味餐厅的数量是505。

    如果我们要比较两个行业之间的竞争谁更激烈的,那么能不能简单的比较单位密度呢?在越秀区整个区域的面积不变的情况下,酒店数量大于餐厅数量,论密度的话,肯定是酒店的密度更大,是不是就说明酒店的竞争更激烈呢?

    一份数据,数量相同的情况下,分布情况会决定他们的关系,如下所示:

    所以并不一定能够单纯的通过数量来决定他们的关系,否则就变成这个样子了:

    不过,如果总数不变的情况下,理论上肯定是这样的:例如在同一个班,语文的总成绩比数学的总成绩要高出一截的话,那么参加考试人数相同的情况下,确实可以得出“相较于数学,这个班学生的语文能力较强”这一结论。

    那么在空间上看,这个总数不变,通常是指我们的研究区域,所以我们可以利用下面这样一个算法:Average Nearest Neighbor(平均最近邻)。

    在个算法是ArcGIS空间统计工具箱里面的一个基础工具,位置位于:

    空间统计工具箱——分析模式工具集——平均最近邻

    平均最近邻可以得出一份数据的具体聚集程度的指数,通过这个指数,可以对比不同数据中,哪个数据的聚集程度最大。

    我们先来看看计算的方式和结果:

    参数非常简单,只需要输入你要计算的要素就行,其他所有参数都是可选,至于第四个参数“研究区域面积”这个,我在最后面在解释。

    执行结果如下:

    首先是一个通用型的警告,一般来说,做空间分析,建议都要用投影坐标系来进行分析,地理坐标系都会有这个警告。

    然后下面就是计算的结果了:

    从下往上看,首先还是PZ值,这里我就不解释了,免得说浪费篇幅,大家可以回头去看以前的文章:

    新版白话空间统计(10):空间统计中的零假设

    新版白话空间统计(11):ArcGIS中的PZ值标尺

    新版白话空间统计(12):P值的表达以及空间统计上的特性

    新版白话空间统计(13):随机的力量

    之后就是我们要关注的三个具体指标了:

    观测平均距离(Observed Mean Distance):每个要素的质心与其最近邻要素的质心位置之间的距离,然后计算所有这些最近邻距离的平均值。

    如下所示:

    计算公式:

    其中di 是每个要素,与他最近的要素之间的距离,如下图:

    Do = (4 + 6 + 7) / 3 = 5.6667

    预期平均距离:假设我们的数据,都是随机分布的,那么这些数据就应该平铺在整个研究区域中,这样平铺开来的数据预期的平均距离是。

    计算公式:

    计算的方法非常简单粗暴,首先假设在研究区域内,有n个点,研究区域的面积为A,那么计算的时候就直接套用以上公式:例如,我们有3个点(这里的点,一般取使用相同数量的要素覆盖相同的总面积),研究区域的面积为60,那么

    De = 0.5/sqrt(3/60) = 2.23606797749979

    接下去就是这个算法里面的核心指数了——最近邻指数(Nearest Neighbor Ratio)这个指数的算法也很简单,直接用观测平均距离除以预期平均距离:

    ANN = Do / De

    如果观察平均距离大于预期平均距离,那么ANN > 1 ,则表示离散

    反之,观测平均距离小于预期平均距离,则ANN < 1 ,则表示聚集

    我们上面计算的结果约等于0.52,则表示这份数据在空间上呈现了聚集状态。

    平均最近邻方法对面积值非常敏感(面积参数值的细微变化都能导致 z 得分和 p 值结果产生巨大变化)。比如下面这份数据,在不同的研究尺度下面,得到的结果也完全不一样:

    因此,平均最近邻工具最适用于对固定研究区域中不同的要素进行比较。

    所以我们拉回到上面那张工具界面的图,可以看见,最后一个参数就是面积参数,这个参数可以让我们选定一个固定面积来作为标准尺度,如果你不制定面积,工具会默认使用要素的外接矩形来作为你的研究区域,例如下面的情况一。

    而如果研究区域设定不一致,就有可能出现情况二,这样得到的结果就截然不同了。

    最后给出这种分析方法适用的一些场景:

    1、评估竞争区域或者物种领地聚集程度

    我们可以用这个工具量化并比较固定研究区域中的多种植物种类或动物种类的空间分布;也可以用来比较城市中不同类型的企业的密集程度而进行竞争分析。

    2、探索数据随时间变化的而发生的空间分布模式的变化

    我们可以利用不同时间段的数据,来评估固定研究区域中某一种类型的企业的空间聚类中随时间变化的而发生的更改。

    3、将观测到的分布信息与需要进行控制的分布信息进行比较

    比如在森林砍伐以获取木材的活动中,我们可以用已经砍伐过的区域的分布,与可以进行砍伐的区域分布信息进行比较,用以确定砍伐过的区域是否比期望进行砍伐更为聚类。

    这个分析工具,我们后面在做实例讲解的时候,还会不断的使用,这里就不做案例演示了。

    本章打完收工,预知后事,请听下回分解。

    展开全文
  • 新版白话空间统计(2):空间自相关

    万次阅读 多人点赞 2020-02-06 09:45:12
    空间自相关是学习空间统计学课程中的第一个拦路虎,据虾神所知,很多初学空间统计学的同学,在遇上这个词汇的时候,就准备放弃这一门本来可以很有意思的课程了。因为大家发现“空间自相关”这五个字,...

    CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D

    转发、转载和爬虫,请主动保留此声明。

    空间自相关是学习空间统计学课程中的第一个拦路虎,据虾神所知,很多初学空间统计学的同学,在遇上这个词汇的时候,就准备放弃这一门本来可以很有意思的课程了。因为大家发现“空间自相关”这五个字,无论是拆开来,还是任意自由组合,都是认识且了解的,but……五个字合起来之后,就不明觉厉了。

    那么什么叫做空间自相关呢?实际上要从我们能看懂的相关性分析说起,实际上空间自相关也是来源于单变量统计分析里面的相关性概念。

    啥叫相关性分析呢?相关性就是用于衡量两组变量之间的紧密程度。比如下面这两组数据:

    如果把上面的哭和笑,用数值进行表达,用一个数学公式就可以算出来,具体的计算公式我就不去亮了,有兴趣的同学自己去查。

    通过数学公式,可以计算出这个相关系数,相关系数的值一般都在【-1,1】之间,情况如下:

    但是自相关又是啥意思呢?最早自相关来自于时间序列分析——通常时间序列分析里面的数据,除去时序维度之外,只有一个属性维度,比如全天的气温:

    或者是原油期货数据:

    这种针对这种同一属性之间进行分析相关性的,就叫做“自相关”。

    有同学看到这里,可能会问,两组数据之间进行相关分析我们很好理解,同一组数据,怎么做相关分析?难道是要把数据——

    好吧,你虽然没有完全猜对,但是也差不多了——自相关分析的方法,就是用同样大小的窗口,把数据切分成若干块,比如如果仅分成两块的话:

    而如果分的更细,我们就可以得到若干个延时为1的序列,这些序列之间相关系数就可以很轻易的算出来了,当然,其中会有各种各样的数学公式和原理,我会(有可能的话)在另外的——黑话空间统计算法篇里面给有数学爱好的同学慢慢解释。

    那么得到这一系列的延时相关系数,就是时序分析里面很重要的“自相关图”——好吧,跑题了,不过这里大家记住,自相关的“”的含义,就是单一属性之间自行比较就好。

    这种有序列的单一属性,我们很容易发现一个问题,有些序列,天然具有相关性——比如气温,一个较低的气温,前后往往跟随着的是同样比较低的气温……很少有气温突然剧烈来回变化的。

    而有些序列则不然,比如上面用的原油期货数据,变化之间几乎没有规律——这种不具备相关性的序列数据,就是所谓的随机模式的数据。

    不过这种分析,仅适用于时间序列这种有明确前后相邻的单一序列数据上面,最初被认为很难移植到空间上,因为空间上没有明确的可以遵循的单一顺序——所以需要一种特殊的符合地理空间规则的建模方法,使之适用于广义的空间分析上面。

    所以空间自相关应运而生——那么这个空间自相关又是啥意思呢?我们先来看这样一个例子:

    时间:课间操。

    地点:学校操场。

    当广播响起来的时候,所有学生都一路狂奔冲向操场(迟到要挨罚的),所以,如果我是校长,在楼上,看见的应该是这样的一个场面:

    怎是一个乱字了得,那么这就是所谓的“随机分布”,代表了谁也不知道,哪个学生是哪个班的,哪个学生会出现在哪个位置之上,更别说想弄明白哪个学生与哪个学生之间的关系了。

    划重点:随机分布代表无法预测,所有的位置概率都是均等的。

    随着体育老师的口令,慢慢得变成了下面这个场面:

    学生整整齐齐的占成了队列,每个人前后左右的距离都是一样,这个就是所谓的“均匀分布”,在这种均匀分布的情况下,照样没办法看出学生之间的关系。

    画重点:在数据分析种,均匀分布与随机分布具有相同的含义。

    5分钟后,广播体操结束,同样随着体育老师的一声口令,解散,学生们就变成了下面这个样子:

    OK,作为校长的我,现在就很明显的看出,不同的学生,自己就组成了自己的一个个小团体,这就是所谓的聚类。

    那么作为校长,自然会在脑中脑补,为什么这几个学生会自然的聚在一起呢?肯定是共同的爱好或者共同的目的,至于这个团体,有哪些共同的爱好和共同目的,就是学生之间的某种特征了,比如中间那一波,是喜欢打篮球的,右边那批,是什么王者农药战队的,当然右上左下,还有两个单身狗……。

    这种,每个学生,与他周围的学生之间,一般有一些共有的某种特征。理论上,如果有一个带有这种特征的学生出现在操场上,那么他身边出现的,就有很大可能与他有同样的特征,而且他们之间会产生潜在的依赖性。比如喜欢打球的学生,一个人肯定没办法打,所以自然需要有共同爱好的小伙伴在旁边。

    这种潜在的(因为没有很明显的表现出来,所以肯定是潜在的)的相互依赖性,就是所谓的“空间自相关”。

    对空间自相关的研究,是揭示空间数据分布的一个很重要的概念,而对空间自相关中的关联性程度的计算,就是研究空间自相关的主要方法了。

    那么,下一期,我们来聊聊衡量空间自相关的表现形式:空间分布模式之聚集、离散与随机。

    CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D

    转发、转载和爬虫,请主动保留此声明。

    展开全文
  • 白话空间统计二十一:密度分析(二) 前文再续,书接上一回…… 上一次我们讲了不管怎么去分你的尺度,都有可能产生断崖式的变化,那么有没有一种方法,让我们能够尽量避免断崖式的变化呢?最简单的就是滑动...
  • 白话空间统计二十三:回归分析(一)

    万次阅读 多人点赞 2017-01-13 13:28:25
    2017年开篇文章,还是继续是虾神我的老本行:白话空间统计。所以虾神准备直接就在一棵树上吊死算哒——将空间统计进行到底。 所以,把虾神daxialu打造成《空间统计》领域的微信第一公众号,就是虾神我的野望所在...
  • 写这篇文章之前,我是纠结了很久的……一旦说道函数这种东西, 而且公式推理这种东西,基本上整个就变成的天书,而白话空间统计整个系列的核心目的还是科普,既然科普,自然就要让大...
  • 白话空间统计二十九:空间插值(一)

    千次阅读 多人点赞 2019-04-16 18:00:39
    鼓掌……终于到空间插值了,整个空间分析体系里面,虾神最擅长的领域之一……为什么敢说这么大的话呢,因为虾神是全公司,唯一一个,能够用笔和纸,完成插值分析全流程手算的正(bi...
  • 莫兰小传——献给伟大的统计学家,空间统计学先驱莫兰同学 我们前面说了空间分布模式有随机、聚集和离散三种,不过这三种说法都是所谓的“定性”的称谓,而在分析里面,我们更需要的是“定量”。 复杂的多个数据,...
  • 白话空间统计二十一:密度分析(四)

    万次阅读 多人点赞 2016-11-17 12:56:20
    白话空间统计系列断了好久了……虽然写了很多其他的文章,但是有同学问,还是系列性的文章效果比较好,当然这些文章大部分都能分开来读,没有啥前后联系,但是系列文章最大的特点就是能够形成知识体系,无论是对于写...
  • 白话空间统计二十四:地理加权回归(二)

    万次阅读 多人点赞 2017-03-05 19:29:46
    1994年,Fotheringham教授回到英国纽卡斯尔大学,担任地理系教授,在此期间,他最为经典的工作——研究空间异质性的地理加权回归(GWR)方法的系列论文相继发表,其中一篇论文的单篇被引用了1300多次,是GIS与空间分析...
  • ArcGIS地统计模块提供的探索性分析工具,与其他软件提供的那些妖艳货完全不同,他是专门针对地统计中克里金插值时候需要参数来进行设计的,如果有见识过同学,会发现有些工具,压根不知道是用来干嘛的,也读不懂有啥...
  • 空间统计学是统计学的一个分支,有很多与统计学相同的地方,也有很多有自身特点的,地方,今天我们就来聊聊空间统计学的四大基础理论: 首先就是空间概率 统计学是一门计算很研究概率的学问,一般的描述方式...
  • 白话空间统计十九:热点分析(上)

    万次阅读 多人点赞 2015-10-18 21:11:49
    通过得到的 z 得分和 p 值,我们可以知道高值或低值要素在空间上发生聚类的位置。但是这个工具的工作方式有些特殊:它查看邻近要素环境中的每一个要素。高值要素往往容易引起注意,但可能不是具有显著统计学意义的...
  • 白话空间统计二十四:地理加权回归(五)

    万次阅读 多人点赞 2017-04-06 13:16:06
    这是写概念的最后一节……从下一节开始,大家就可以告别枯燥的理论和概念了(此次应有掌声) 上一章节写到,地理加权中,空间关系...讲到带宽这个词,实际上如果一直跟的同学,应该很熟悉了,我在《白话空间统计第二十
  • 白话空间统计二十一:密度分析(五) 上次讲密度分析的时候,有同学问道带宽的问题,实际上我翻 了一下以前写的文章,在密度分析一、二里面,都对这个有过描述,详细的可以回去翻一下(很老的文章了……可能要翻...
  • 白话空间统计二十四:地理加权回归(一)

    万次阅读 多人点赞 2017-03-02 09:23:17
    当一个数据,在A区域内有很强的解释能力,比如在威海市,人口数量对财政收入的变化,可解释性超过了96%,但是同样居于鲁东的青岛,...这种在不同区域具有不同性质的情况,就是在空间分析里面无所不在的空间异质性了……
  • 白话空间统计二十九:空间插值(二)

    千次阅读 多人点赞 2019-04-22 08:03:06
    前文再续,书接上一回……上回书说到,空间插值可以对数据进行估算,这一张我们来具体说说空间插值的一些概念。首先,来说说插值的输入与输出问题。首先输入的肯定是用来进行插值...
  • 白话空间统计之:Moran's I(莫兰指数)

    万次阅读 多人点赞 2015-07-29 16:58:07
    Moran's I这个东西,官方叫做:莫兰指数,是澳大利亚统计学家帕特里克·阿尔弗雷德·皮尔斯·莫兰(Patrick Alfred Pierce Moran),在1950年提出的。一般是用来度量空间相关性的一个重要指标。
  • 在前面的话:白话空间统计系列还继续更新,因为这段时间在对《使用R语言进行空间统计》系列进行翻译翻译和编写,所以白话空间统计系列和使用R语言进行空间统计可能会交替出现,给大家的阅读带来的不便,请大家谅解...
  • 白话空间统计二十四:地理加权回归(四)

    万次阅读 多人点赞 2017-03-19 17:56:28
    所以地理加权回归,可能还要写上好几章的原理,如果想快进的同学,请直接去查阅ArcGIS帮助文档中的空间统计工具箱——空间关系建模——地理加权回归部分,安装了ArcGIS for desktop的同学直接可以打开帮助文档,也...
  • 白话空间统计二十四:地理加权回归(十)完结篇

    万次阅读 多人点赞 2017-07-03 18:24:02
    然后进行空间自相关验证: 标准化残差分布为随机。 至此,GWR全部就写完了,以后说不定还有不定期的番外篇,暂时不列入写作计划,大家对GWR还有些啥疑问的,可以通过我的公众号获取邮箱,和我一起讨论...
  • 新版白话空间统计(8):莫兰指数小结

    万次阅读 多人点赞 2020-04-10 08:19:13
    本节对前面写的莫兰指数部分留下的一下小问题进行解答,里面包括一些读者朋友们通过邮件提出的一些问题。Q1:ArcGIS中,计算莫兰指数的工具里面的那个Row(行标准化)是拿来干嘛的?A:...
  • 统计学的核心,在于在如此多的苹果中,选定需要参与回归的样本(统计抽样,是统计学的一个核心内容),统计抽样里面,有一个理论,就是抽样的样本,到达一定的平台期之后,再增加样本的数量,对最终的分析结果并不会...
  • 写在前面的话:我知道很多同学都在等克里金,但是空间插值这个系列我已经预定好了撰写的思路,所以暂时没办法直接跳过前面的内容直奔克里金,所以大家只能将就一下先把前面的内容看完...
  • 白话空间统计二十四:地理加权回归(七)ArcGIS的GWR工具扩展参数说明 近期无论是开发者大会,还是个人工作,相当的忙,所以停了一段时间……不过地理加权回归写到第七章,自我感觉也差不多了,无论是基础理论...
  • 空间统计上,有哪些描述性的概念呢? 首先当然是对地理分布进行度量的一系列概念。比如三大中心: 平均中心(加权平均中心) 中位数中心(加权) 中心要素(加权) 三大中心的概念可以用来类比经典统计中的均值、...
  • 白话空间统计二十三回归分析番外:残差可视化

    千次阅读 多人点赞 2017-03-27 10:41:46
    不过大家放心啦,作为微信平台里面专门讲空间分析和空间统计的公众号:虾神daxialu,老夫是不会让这种事情发生的……所以今天虽然还是讲回归分析,那么我也要弄成带有空间数据的回归可视化。 首先,还是用山东的...
  • 上回说到,统计分析,对比是核心。也就是所谓的:世事无绝对。人类对于任何事务首先的第一评价方式,就是对比。如果没有对比的话,单纯的数字会让我们觉得有些不...
  • 空间分析的根基,来源于60年代Waldo R. Tobler教授“地理学第一定律”的“Tobler's First Law”(简称TFL),即为“Everything is related to everything else, but near things are more related to each other。”...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,499
精华内容 599
关键字:

白话空间统计