精华内容
下载资源
问答
  • 核密度

    2018-12-17 10:43:08
    最近涉及到建模分析的时候,去研究了一下核密度函数模型,看了一些论文和博客,感觉还是有一点懵,最后又看了看知乎,决定自己写一篇关于核密度的东西。 1.核密度简介 简单地讲,核密度估计是对直方图的一个自然...

    最近涉及到建模分析的时候,去研究了一下核密度函数模型,看了一些论文和博客,感觉还是有一点懵,最后又看了看知乎,决定自己写一篇关于核密度的东西。

    1.核密度简介

    简单地讲,核密度估计是对直方图的一个自然拓展

    https://blog.csdn.net/unixtch/article/details/78556499

    这个链接是对核密度介绍比较详细的一篇文章,可以先去看一下,主要讲了从直方图到核密度估计,再到核函数和窗宽的估计。

    2.核密度估计

    这种估计的意思是,你给出模型一个解释变量,可以得到模型估计出来的被解释变量。如给出x_{t} ,模型用知道的有关x,y的全部知识,告诉你对 y_{t} 的估计值。以 x_{t} 点为中心,找了窗宽范围内的所有点(无视外面的点),以距离 x_{t} 远近为权重,给范围内每一个x所对应的y点做一个加权求和取平均。而权重设置和加和过程涉及到一定的规则,这个规则就是核函数。

    3.核函数

    核函数K(kernel function)就是指K(x, y) = <f(x), f(y)>,其中x和y是n维的输入值,f(·) 是从n维到m维的映射(通常,m>>n)。<x, y>是x和y的内积(inner product)(也称点积(dot product))。

    (1)举例:
    令 x = (x1, x2, x3, x4); y = (y1, y2, y3, y4);
    令 f(x) = (x1x1, x1x2, x1x3, x1x4, x2x1, x2x2, x2x3, x2x4, x3x1, x3x2, x3x3, x3x4, x4x1, x4x2, x4x3, x4x4); f(y)亦然;
    令核函数 K(x, y) = (<x, y>)^2.
    接下来,让我们带几个简单的数字进去看看是个什么效果:x = (1, 2, 3, 4); y = (5, 6, 7, 8). 那么:
    f(x) = ( 1, 2, 3, 4, 2, 4, 6, 8, 3, 6, 9, 12, 4, 8, 12, 16) ;
    f(y) = (25, 30, 35, 40, 30, 36, 42, 48, 35, 42, 49, 56, 40, 48, 56, 64) ;
    <f(x), f(y)> = 25+60+105+160+60+144+252+384+105+252+441+672+160+384+672+1024
    = 4900. 
    如果我们用核函数呢?
    K(x, y) = (5+12+21+32)^2 = 70^2 = 4900.

    (2)核密度估计中的核函数K(x)

    在核密度估计中,核函数一般选取标准正态概率密度函数ϕ(x)

           \phi (x)=\frac{1}{\sqrt{2\pi }}e^{-\frac{x^{2}}{2}}

    4.密度函数

         \hat{f}(x)=\frac{1}{nh}\sum_{i=1}^{n}K(\frac{x-x_{i}}{h})

    其中n为样本总数,x为当前输入变量,h为窗宽。

    对于数据较多的情况,可能就要用到多维核密度函数模型了,在论文中看到过一些,具体的如下:

    二维:\hat{f}(x,y)=\frac{1}{nh^{2}}\sum_{i=1}^{n}K(\frac{x-x_{i}}{h},\frac{y-y_{i}}{h})

    三维:\hat{f}(x,y,t)=\frac{1}{nh_{1}^{2}h_{2}}\sum_{i=1}^{n}K_{1}(\frac{x-x_{i}}{h_{1}},\frac{y-y_{i}}{h_{1}})K_{2}(\frac{t-t_{i}}{h_{2}})

    对于多维情况,如没有特殊的关系等,可以考虑直接将多个一维的相乘。

     

    参考:

    https://www.researchgate.net/publication/223677041_Visualising_space_and_time_in_crime_patterns_A_comparison_of_methods

    https://www.zhihu.com/question/27301358

    展开全文
  • 核密度估计是非参数检验的一种,已知一列数据,估计其密度函数的过程。计算公式如下,主要包括核密度函数和带宽(窗宽),常见的核函数为高斯函数和Epanechnikov函数,带宽则可以根据核函数求解。图1核密度估计原理...

    核密度估计是非参数检验的一种,已知一列数据,估计其密度函数的过程。计算公式如下,主要包括核密度函数和带宽(窗宽),常见的核函数为高斯函数和Epanechnikov函数,带宽则可以根据核函数求解。

    7a39e7e2292ab6a2e6e046db60bfcf34.png

    图1 核密度估计原理

    核密度估计在经济学、金融学,以及人文地理学中较为常用,主要是用来估计金融风险、国际贸易密度、人口及GDP密度,如图2。

    1fbba20bb692e59f6320ec93791532fa.png

    图2 国际贸易核密度图

    核密度图可以通过R、python、stata来制作,其中stata最简单且易于上手。一年的数据很好做,但是多年的数据做到一张图上,还是难倒了不少的同学。本教程首先讲解核密度估计的原理,然后手把手教学,从数据录入stata到制作图表,再到图表的调整,15分钟你就能作出一张多年核密度图了,你的毕业论文有救啦!详细教程请点击下方的阅读原文。

    展开全文
  • 求人不如求自己,这篇来分析一下这个核密度函数和核密度图。说的不对的地方还请大神指出。 概率密度 从数学上看,分布函数F(x)=P(X<x),表示随机变量X的值小百于x的概率。这个意义很容易理解。 概率密度f(x)是F...

    前言

    上一篇博客画了一张核密度函数,但是搜了半天也没找到怎么分析这个图。求人不如求自己,这篇来分析一下这个核密度函数和核密度图。说的不对的地方还请大神指出。
    在这里插入图片描述

    概率密度

    从数学上看,分布函数F(x)=P(X<x),表示随机变量X的值小百于x的概率。这个意义很容易理解。
    概率密度f(x)是F(x)在x处的关于x的一阶导数,即变化率。如果在某一x附近取非常小的一个邻域Δx,那么,随机度变量X落在(x, x+Δx)内的概率约为f(x)Δx,即P(x<X<x+Δx)≈f(x)Δx
    换句话说,概率密度f(x)是X落在x处“单位宽度”内的概率。“密度”一词可以由此理解。
    For me:
    概率密度也可以理解为概率密度函数道是概率分布函数的一阶导函数,斜率
    已知连续型随机变量的密度函数,可以通过讨论及定积分的计算求出其分布函数;当已知连续型随机变量的分布函数时,对其求导就可得到密度函数。
    对离散型随机变量而言,如果知道权其概率分布(分布列),也可求出其分布函数;当然,当知道其分布函数时也可求出概率分布。

    核密度估计

    核密度估计的原理其实是很简单的。在我们对某一事物的概率分布的情况下。如果某一个数在观察中出现了,我们可以认为这个数的概率密度很比大,和这个数比较近的数的概率密度也会比较大,而那些离这个数远的数的概率密度会比较小。基于这种想法,针对观察中的第一个数,我们都可以f(x-xi)去拟合我们想象中的那个远小近大概率密度。当然其实也可以用其他对称的函数。针对每一个观察中出现的数拟合出多个概率密度分布函数之后,取平均。如果某些数是比较重要,某些数反之,则可以取加权平均

    总结

    由原理可见,分析核密度函数时主要是要观察其面积,而不是取值,因为对应的取值是一个概率密度,只有与变量相乘才能得到该变量的概率取值。

    展开全文
  • ArcGIS核密度分析原理

    万次阅读 2018-09-23 09:40:09
    核密度分析: 使用核函数根据点或折线 (polyline) 要素计算每单位面积的量值以将各个点或折线 (polyline) 拟合为光滑锥状表面。 核密度分析所用到的参数: 输入点或折线要素 要计算密度的输入要素(点或线)。...

    核密度分析:

    使用核函数根据点或折线 (polyline) 要素计算每单位面积的量值以将各个点或折线 (polyline) 拟合为光滑锥状表面。

    核密度分析所用到的参数:

    输入点或折线要素

    要计算密度的输入要素(点或线)。

    Population 字段

    表示各要素的 population 值的字段。Population 字段表示遍布于用来创建连续表面的景观内的计数或数量。

    population 字段的值可以是整型或浮点型。

    以下列出的是该字段的选项和默认特性。

    • 如果不使用任何项目或特殊值,则选择 None,这样每一要素就只计数一次。

    • 如果输入要素包含 Z,则可以使用 形状。

    • 否则,默认字段为 POPULATION。以下条件同样适用。

      • 如没有 POPULATION 字段,但是存在 POPULATIONxxxx 字段,默认使用此字段。“xxxx”可以为任何有效字符,例如 POPULATION6、POPULATION1974 或 POPULATIONROADTYPE。
      • 如没有 POPULATION 字段或 POPULATIONxxxx 字段,但是存在 POP 字段,默认使用此字段。
      • 如没有 POPULATION、POPULATIONxxxx 或 POP 字段,但是存在 POPxxxx 字段,默认使用此字段。
      • 如没有 POPULATION、POPULATIONxxxx、POP 或 POPxxxx 字段,则默认使用 NONE。

    输出栅格

    输出核密度栅格。

    其总为浮点栅格。

    输出像元大小 (可选)

    输出栅格数据集的像元大小。

    如果专门进行设置,则是环境中的值。如果未设置环境,单元大小为输出空间参考中输出范围的宽度或高度较小值除以 250。

    搜索半径 (可选)

    在其范围内计算密度的搜索半径。单位基于输出空间参考投影的线性单位。

    例如,如果单位为米,若要包含一英里邻域内的所有要素,可将搜索半径设置为 1609.344(1 英里 = 1609.344 米)。

    默认值为输出空间参考中输出范围的宽度或高度的最小值除以 30。

    面积单位 (可选)

    输出密度值的所需面积单位。

    基于输出空间参考投影的线性单位选择默认单位。若要转换密度输出,可将此单位更改为合适的单位。线密度值同时转换长度和面积单位。

    例如,如果输入单位是米,则默认输出面积密度单位为平方米(点要素)或千米每平方千米(折线要素)。

    基于输入要素单位的默认密度单位有:

    • SQUARE_MAP_UNITS — 如果单位为未知,点或十进制度。
    • SQUARE_MILES — 用于英尺、码、英里或海里。
    • SQUARE_KILOMETERS — 用于米或千米。
    • SQUARE_INCHES — 用于英寸。
    • SQUARE_CENTIMETERS — 用于厘米。
    • SQUARE_MILLIMETERS — 用于毫米。

    应用范围:

    核密度分析工具用于计算要素在其周围邻域中的密度。此工具既可计算点要素的密度,也可计算线要素的密度。

    ps:如果你的数据为面要素,可以使用字段计算器计算出每个面的单位面积密度,之后提取面的中心点,将面的单位密度赋予中心点,最后将中心点作为核密度分析的输入数据。 (这里一个小伙伴问到过)

    核密度分析可用于测量建筑密度、获取犯罪情况报告,以及发现对城镇或野生动物栖息地造成影响的道路或公共设施管线。可使用 population 字段根据要素的重要程度赋予某些要素比其他要素更大的权重,该字段还允许使用一个点表示多个观察对象。例如,一个地址可以表示一栋六单元的公寓,或者在确定总体犯罪率时可赋予某些罪行比其他罪行更大的权重。对于线要素,分车道高速公路可能比狭窄的土路产生更大的影响,高压线要比标准电线杆产生更大的影响。

    展开全文
  • 原标题:核密度估计丨数析学院 核密度估计(kernel density estimation)是非参数统计检验中的重要方法之一,常用于估计未知的密度函数。本节将向大家介绍在 Python 中如何利用 Scikit-Learn 库中的相关工具,对数据集...
  • 核密度估计

    2020-04-05 17:43:00
    核密度估计 核密度估计属于非参数估计方法。概率分布是统计推断的核心问题,一旦给出联合概率密度,就能够回答变量子集之间的所有问题。可以说,参数统计的核心内容就是对密度的估计。通常在实际问题中,很多数据的分布...
  • R语言核密度

    2021-01-07 14:01:49
    核密度图 给定一个数据集,需要观察这些样本的分布情况,往往我们会采用直方图的方法来进行直观的展现。该方法简单,容易计算,但是直方图存在着如下的两大问题: 绘制直方图时,需要确定分组问题,如果分组不同,...
  • 参考自《R Graphics Cookbook》核密度曲线类似于概率密度曲线,其曲线下的面积是1,因此其y轴上的单位通常是小于1的核密度分布值。对这个核密度曲线求积分的结果为1,也就是其曲线下的面积为1(应该是这个意思)。实质...
  • 如果直接对一个点数据进行核密度分析,往往得到是一个矩形的栅格范围,而我们制图过程中通常希望能生成指定面范围的核密度结果。实际上仅需要设置几个小细节,就可以实现这个功能。下面以武汉市某类型的点数据为例,...
  • 热力图与核密度分析热力图是什么?热力图(Heatmap)是百度公司在2011年首先推出的一种采用重建或者插值算法将离散的数据转换成连续形式展示的免费大数据可视化产品,以LBS(基于位置的服务)平台手机用户地理位置数据为...
  • 在计算核密度时,可以使用障碍来改变要素的影响。插图OutRas = KernelDensity(InPts, None, 30)使用方法搜索半径(Python 中的 search_radius)参数值越大,生成的密度栅格越平滑且概化程度越高。值越小,生成的栅格所...
  • 线要素的核密度分析核密度分析还可用于计算每个输出栅格像元的邻域内的线状要素的密度。概念上,每条线上方均覆盖着一个平滑曲面。其值在线所在位置处最大,随着与线的距离的增大此值逐渐减小,在与线的距离等于指定...
  • 核密度估计Kernel Density Estimation(KDE)概述密度估计的问题由给定样本集合求解随机变量的分布密度函数问题是概率统计学的基本问题之一。解决这一问题的方法包括参数估计和非参数估计。参数估计参数估计又可分为...
  • 核密度估计简略教案

    2018-11-27 16:40:11
    核密度估计参考教案: 根据从一个总体中抽出的样本取估计总体分布的密度函数,在应用上有重要的意义。 关于密度函数的参数估计就是在假定该随即变量的密度函数的形式已知的前提下,对密度函数的参数进行估计。
  • 1.核密度估计图。import matplotlib.pylab as pltimport seaborn as snsdf = sns.load_dataset('iris')p1=sns.kdeplot(df['sepal_width'])plt.show()import matplotlib.pylab as pltimport seaborn as snsdf = sns....
  • 一、基本原理核密度估计(Kernel Density Estmation,KDE)认为在一定的空间范围内,某种事件可以在任何位置发生,但是在不同的地理位置上发生的概率是不一样的,如果在某一区域内其事件发生的次数较多则认为此区域内...
  • 核密度估计matlab程序

    2018-05-31 11:01:05
    matlab核密度估计程序,用于数据的预测,风险控制,预期收益等
  • 在介绍核密度评估Kernel Density Estimation(KDE)之前,先介绍下密度估计的问题。由给定样本集合求解随机变量的分布密度函数问题是概率统计学的基本问题之一。解决这一问题的方法包括参数估计和非参数估计。参数估计...
  • R语言与核密度估计非参数统计Tag内容描述:1、R语言与非参数统计(核密度估计),核密度估计是在概率论中用来估计未知的密度函数,属于非参数检验方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen...
  • ARCGIS核密度制图

    2021-04-09 10:11:02
    ARCGIS核密度制图 数据:湖南五星和四星高星级酒店 实验步骤 1.打开数据 2.定义投影和投影 4.在进行核密度之前改变地图显示单位,数据属性框-常规-单位(因为在这我们已经投影,输入单位应为米或者千米): 5....
  • Arcgis 核密度分析操作

    万次阅读 2020-02-28 14:17:07
    设置:核密度分析出来不是个矩形,而是特定面的范围 第1步: 生成能覆盖制定面范围 xx.shp 的大矩形, 点击 环境—处理范围—— 范围 部分选择想要输出范围的面层 xx.shp 点击 确定之后 就生成一个能覆盖...
  • ArcGIS核密度分析

    千次阅读 2020-09-10 22:43:49
    1. ArcToolbox → Spatial Analyst工具 → 密度分析 → 核密度分析 2. 3. 4.完成
  • 基于核密度估计的核偏鲁棒M-回归建模方法及应用
  • 1.核密度估计图。import matplotlib.pylab as pltimport seaborn as snsdf = sns.load_dataset('iris')p1=sns.kdeplot(df['sepal_width'])plt.show()import matplotlib.pylab as pltimport seaborn as snsdf = sns....
  • 非参数估计:核密度估计KDE

    万次阅读 多人点赞 2016-12-14 11:38:46
    http://blog.csdn.net/pipisorry/article/details/53635895核密度估计Kernel Density Estimation(KDE)概述密度估计的问题由给定样本集合求解随机变量的分布密度函数问题是概率统计学的基本问题之一。解决这一问题的...
  • 前面介绍了基础直方图的绘制教程,接下来,同样分享一篇关于数据分布的基础图表绘制-核密度估计图。具体含义我们这里就不作多解释,大家可以自行百度啊,这里我们主要讲解R-python绘制该图的方法。本期知识点主要...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 2,579
精华内容 1,031
关键字:

核密度