精华内容
下载资源
问答
  • R统计计算--差异性检验

    万次阅读 2018-08-09 17:49:55
    差异性检验: t检验、秩和检验(如wilcox检验)、Kolmogorov-Smirnov检验 组间差异检验:方差分析、Fisher检验、卡方检验 相关性分析:相关性检验(pearson、spearman和kendall等)、cos相关性检验 基本概念: 1....

    假设检验

    差异性检验: t检验、秩和检验(如wilcox检验)、Kolmogorov-Smirnov检验

    间差异检验:方差分析、Fisher检验、卡方检验

    相关性分析:相关性检验(pearsonspearmankendall)、cos相关性检验

    基本概念:

    1.假设检验是统计推断的一个主要部分

    2. 对某一个事情提出疑问,解决疑问的过程往往是先做一个和疑问相关的假设,然后在这个假设下去寻找有关的证据,如果得到的证据和假设相矛盾则否定这个假设

    3. 假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P<0.01P<0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为不假设成立

     

     

    4. 解决假设检验问题的同时,可能会犯错误。否定H0时犯的错误为第一类错误,接受H0时犯的错误为第二类错误,具体
    1H0为真,统计推断的结果否定H0,犯第一类错误

    2H0为假,统计推断的结果接受H0,犯第二类错误

    5. 检验水平a控制了否定H0时犯第一类错误的概率:如果检验是显著的,否定H0后,犯第一类错误的概率不会超过a,如果检验不是显著的,就不能否定H0

    6. 参数统计:即总体分布类型已知,用样本指标对总体参数进行推断或作假设检验的统计分析方法。

    7. 非参数统计:即不考虑总体分布类型是否已知,不比较总体参数,只比较总体分布的位置是否相同的统计方法。

    过程:

    1提出检验假设又称无效假设,符号是H0;备择假设的符号是H1

               H0:样本与总体或样本与样本间的差异是由抽样误差引起的;

               H1:样本与总体或样本与样本间存在本质差异;

              预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05α=0.01

    2选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用T检验,秩和检验等。

    3根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。

    差异性校验:

    一、 T校验

    概念:

    学生T-检验用于检验统计服从空假设为真的正态分布。用此可判断两组独立的数据集是否存在不同。T-检验适用于基于少量样本(少于30)且标准差未知的判断问题。多组间比较时慎用T检验

    统计原理:

    1、建立空假设H0μ1 = μ2即先假定两个总体平均数之间没有显著差异; 备择假设H1 μ1 ≠ μ2

    2、 给出显著性水平a(例如0.05

    3、计算统计量t值,μ1 μ2    是全量平均值  S方差

    4、计算相应的P

    5、确定是否可以拒绝空假设

    实现

    weights<-c(84.12,85.17,62.18,83.97,76.29,76.89,61.37,70.38,90.98,85.71,89.33,74.56,82.01,75.19,80.97,93.82,78.97,73.58,85.86,76.44) 
    weights2<-c(69.35,63.21,72.57,73.23,65.26,60.32,66.96,59.78,69.71,76.88,81.39,64.9,75.53,65.05,77.21,64.9,71.93,75.04,74.29,77.53) 
     boxplot(list(weights,weights2),main='A boxplot of two weight samples')
     abline(h=mean(weights),lwd=2,col='blue') 
     abline(h=mean(weights2),lwd=2,col='red')
    pvalue<-t.test(weights,weights2)$p.value
    

    可视化展现:

    pvalue=0.00049(<0.05)

    说明两组数据的平均值有显著差异

    二、秩和检验Wilcoxon

    概念:

    秩和检验是一种非参数校验方法用样本秩来代替样本值的检验法),它使用的空假设为,不假设正态分布的情况下,两个不同组的数据来自于同一个全量。

    统计原理:

    T检验,它假设两组样本之间的差异是服从正态分布(也适用于两组样本服从正态分布的情况)。但是,当不能确定正态分布的时候,可以采用wilcoxon秩和检验来做假设检验

     1)建立假设;

            H0:比较两组的总体分布相同;

            H1:比较两组的总体分布位置不同;检验水准为0.05

    2)两组混合编秩;

    3)求样本数最小组的秩和作为检验统计量T

    4)以样本含量较小组的个体数n1、两组样本含量之差n2-n1T值查检验界值表;

    5)根据P值作出统计结论。

    当相同秩次较多时,应用校正公式计算u

    现设12两总体分别抽取容量为n1,n2的样本,且设两样本独立。这里总假定 n1<>n2

    我们将这n1 + n2个观察值放在一起,按自小到大的次序排列,求出每个观察值的秩,然后将属于第1个总体的样本观察值的秩相加,其和记为R1,称为第1样本的秩和,其余观察值的秩的总和记作R2,称为第2样本的秩和。

    显然,R1R2是离散型随机变量,且有R1+R2=( (n1+n2)(n1+n2+1) )/2.

    实现:

    likes<-c(17,40,57,30,51,35,59,64,37,49,39,41,17,53,21,28,46,23,14,13,11,17,15,21,9,17,10,11,13,16,18,17,2,11,12,5,8,4,12,7,11,8,4,8,7,3,9,9,9,12,17,6,10) 
     likes2<-c(28,152,197,25,62,39,32,202,85,74,125,32,67,29,37,297,101,45,24,63,17,92,46,60,317,85,46,61,56,59,91,54,133,87,200,28,97,28,30) 
    boxplot(list(likes,likes2))
    Pvalue<-wilcox.test(likes,likes2)$p.value
    

    可视化展示

    pvalue=2.750569e-11 (<0.05)

    说明两组数据并不来自于同一个全量

    三、Kolmogorov-Smirnov检验

    概念:

    KS检验是一种非参数的、面向连续概率分布等价性的统计检验方法。

    双样本Kolmogorov-Smirnov检验可以比较两个数据集的累积分布

    统计原理:

    H0:样本服从指定的分布

    H1:样本不服从指定的分布

    ECDF:经验累积分布函数

    KS检验使用的是两条累计分布曲线之间的最大垂直差作为D值(statistic D)作为描述两组数据之间的差异。

    实现:

    set.seed(123) 
    x<-runif(n=20,min=0,max=20) 
     y<-runif(n=20,min=0,max=20) 
    plot(ecdf(x),do.points=F,verticals = T,xlim=c(0,20)) lines(ecdf(y),lty=3,do.points=F,verticals=T) 
    pvalue<-ks.test(x,y)$p.value
    

    可视化展现:

    pvalue=0.8319696 (>0.05)

    说明两组数据可能来自同一个分布

     T检验秩和检验KS检验
    条件

    1 已知一个总体均数

    2)可得到样本均数及样本标准差

    3)样本来自正态或近似正态分布

    样本独立

    分布不清

    两个样本容量均小于10

    适用于连续概率分布

    空假设

    两个总体平均值相同

    不假设正态分布的情况下,两个不同组的数据来自于同一个全量

    两组数据来自于同一个分布

    统计平均数秩和

    两条累计分布曲线之间的最大垂直差

     

    展开全文
  • 利用DEM数字高程模型计算坡度的差异性分析,帮助你学习有关DEM的算法
  • 【小记】显著性差异计算

    万次阅读 2020-01-16 09:59:26
    计算方法 文件 -> 选项 -> 加载项 -> 转到 -> 选中分析工具库 确定以后,在选项 数据 栏下最右侧就会出现 数据分析 选中数据 -> 选择数据分析 -> 选择分析工具:单因素方差分析 弹出参数设置栏: ...

    工具:Excel 2016

    计算方法

    文件 -> 选项 -> 加载项 -> 转到 -> 选中分析工具库
    在这里插入图片描述
    在这里插入图片描述
    确定以后,在选项 数据 栏下最右侧就会出现 数据分析
    在这里插入图片描述
    选中数据 -> 选择数据分析 -> 选择分析工具:单因素方差分析
    在这里插入图片描述
    弹出参数设置栏:
    在这里插入图片描述

    • 输入区域:划定一个待分析的数据区域,即从 A1 到 B18,也就是左上角到右下角
    • 分组方式:选择 列 表示每一列代表一组数据(行同理)
    • 标志位于第一行:勾选该选项就是告诉分析器,第一行是数据的名字,不是要分析的数据
    • α ( A ) \alpha(A) α(A):即显著性水平,即我们想要以 95% 的可靠性进行推断,或者说愿意冒 5% 的风险
    • 输出选项:输出区域表示我们想要将输出结果放在当前工作表的某个单元格内
      在这里插入图片描述

    第一张表 很好懂,都是基础的统计值

    第二张方差分析表

    • SS:平方和
    • df:自由度
    • MS:均方
    • F:检验统计量
    • P-value:观测到的显著性水平
    • F crit:临界值

    对于结果中我们需要注意的其实就只有三个部分:FP-valueF crit

    • F > F crit,那么表示两组数据是 有差异 的,再结合 P-value 看,若 0.01 < P-value < 0.05,表示 差异显著;若 P-value < 0.01,则表示 差异极显著
    • F < F crit,那么 P-value 肯定高于 0.05,则表示两组数据 无差异

    上例中,F > F crit,可以认为在 α = 0.5 \alpha = 0.5 α=0.5 的水平上显著,即 A、B 组数据在 α = 0.5 \alpha = 0.5 α=0.5 的水平上有显著差异。

    展开全文
  • tableau-表差异计算

    千次阅读 2017-11-17 20:36:00
    然后再销售额中可以找到差异计算.

    然后再销售额中可以找到差异计算.




    该功能中有排名,下面是排名类型


    展开全文
  • 针对空间邻近关系相似性的定量化计算问题,在确定邻近特征量的基础上,将相似性度量的要素模型和对准模型结合起来,建立了顾及排序差异的对象群邻近关系相似性计算方法,并验证了该方法的可用性。
  • 义务教育均衡中小学差异系数计算通用计算表excel简版, 说明: 1、在可操作的数据区录入数据后其余都是自动计算生成的,请勿试图解除工作表保护,设置破坏将影响数据的准确,后果自负; 2、本表用于均衡测算表,各...
  • 结果表明:分源预测与实测结果存在较大的差异性,从不同的角度分析了差异性存在的原因,总结该综掘工作面瓦斯涌出量的真实值,从而为确定综掘工作面合理配风量的计算和完善瓦斯防治措施提供了依据。
  • 原链接:https://wenku.baidu.com/view/bdd8abd882d049649b6648d7c1c708a1294a0a77.html
    展开全文
  • 导言:通过机器视觉来计算两个图片之间的差异性,可以快速有效辨别文件、图片是否被篡改,也能帮助用户轻松识别钓鱼网站,确保财产安全。 一、所需模块 pip install --upgrade scikit-image pip install --upgrade ...
  • 建立了区别回填料与岩土热物性差异的导热数值解模型,对比分析忽略热物性差异对桩基埋管换热计算的影响,研究表明:导热系数差异对桩基埋管长时间运行的换热热阻计算影响甚小;容积比热差异将引起桩基埋管较大的设计...
  • 总结一下衡量两个概率分布之间的差异性的指标:KL散度(Kullback–Leibler divergence、JS散度(Jensen-Shannon divergence)、交叉熵(Cross Entropy)、Wasserstein距离
  • 由一道课后题引发的思考,节约时间,先说结论:在数据量大时各个方法得到的值差距不大,...计算下列数据的第32位百分数 22 58 24 50 29 52 57 31 30 41 44 40 46 29 31 37 32 44 49 29 一、书上关于计算第p百分位数...
  • 样本量大的时候做差异性分析容易得到有显著性差异的结论,原因如下图, 求p值的过程中,n越大,Z0也越大,相对应的p就小了。当然这里默认方差变化不大的情况下,因为一般来说很多数据经过平均后方差不会变化很大,...
  • 统计学学习笔记——(4)差异性

    千次阅读 2017-11-15 14:49:23
    箱线图和IQR箱线图(Box Plot):是由一组数据的最大值(maximum),最小值(minimum),中位数(median),两个四分位数(quartiles)这五个特征值绘制而成的,它主要用于反映原始数据分布...其计算公式为: Qd=Q3−Q
  • 浅析Android与IOS的一些差异性

    千次阅读 2016-08-30 10:28:35
    GPS硬件差异,Android手机型号众多,导致GPS硬件参差不齐,定位速度、准确有较大偏差; 机能差异导致操作流畅度问题,内存不足导致崩溃; Android系统多元化,软件运行兼容不强; 分辨率的不统一,造成...
  • 根据应用领域的不同,目前主流的分布式并行文件系统可分为2类:面向高性能计算(HPC:High Performance Computing)应用的并行文件系统,典型代表如Luster、Panasas和PVFS;面向数据密集型计算(DISC: Data ...
  • 什么是边缘计算

    万次阅读 多人点赞 2018-07-07 16:59:44
    什么是边缘计算 为什么需要边缘计算 什么是边缘计算 边缘计算的优点 案例研究 云卸载 视频分析 智能家居 智慧城市 边缘协作 机遇和挑战 编程可行 命名 数据抽象 服务管理 私密 最优化方法 小结 ...
  • width和min-width的区别和差异性比较

    万次阅读 2018-05-24 15:33:39
     b、当父元素的宽度小于 子元素的width 时: 给子元素设置的宽度将会按照 该子元素在所有子元素宽度和所占的百分比,这个百分比,就是 子元素 占父元素宽度的百分比,计算公式:   子元素 宽度 = (该子元素宽度 /...
  • 目录参考 参考 AUC的CI google paper NCSS chapter AUC的比较 Medcalc的De Long方法 cnblog 整理的文献
  • 统计分布的距离/相似性计算

    千次阅读 2018-11-25 00:37:05
    统计分布的距离/相似性计算 KL散度(Kullback-Leible divergence) KL散度可以用于描述两个分布之间的距离,假设p(x)p(x)p(x)与q(x)q(x)q(x)是随机变量X的分布,则它们的KL散度为 D(p∣∣q)=∫−∞+∞p(x)logp(x)q...
  • RNA-seq中的基因表达量计算和表达差异分析 差异分析的步骤:1)比对;2) read count计算;3) read count的归一化;4)差异表达分析; 背景知识:1)比对:普通比对: BWA,SOAP开大GAP比对:Tophat(Bowtie2);...
  • 计算两个序列相关系数显著的有效自由度
  • 在这个“差异性”定义的基础上,出现了许多关于另一个概念“计算”的定义:从一个状态到另一个状态的转变以及他们之间转换发生的条件。对于一个进程来说,差异是十分重要的,因为如果没有差异性,我们的系统将没有...
  • 计算性理论与复杂介绍

    千次阅读 2019-01-26 20:15:37
    前言 原文:An Introduction to ...计算科学可以追溯到在这些现代计算机设备还没有被想象出来之前很长一段时间。在一个更经常被问到的问题中,围绕着编程语言、框架和库的问题,我们常常想当然地认为,计算机的基本...
  •  随着物联网的发展,经常听到「雾计算」和「边缘计算」这样的单词。  雾计算这个词相对来说是最近出现的一个词。因为和云相比位置上更接近设备,所以表示为雾,它是作为实现IoT的结构为Cisco等提倡,旨在为全球...
  • 对浮点数处理,涉及编译器、硬件等对浮点数2进制表示的细节不一致,都有可能,对同一输入的浮点数计算,产生不同的结果。 但是如果你愿意做大量的工作,让你的编译器“严格”符合IEEE 754编译模型以及限制你所...
  • (2)用秩和检验法检验两组数据的差异性 利用Matlab编译程序如下: clear; load('c.mat'); load('d.mat'); [p,h]=ranksum(c,d); 可得结果: p=6.666459108310351e-12 ,h=1 如果h1=1,则两组数据有明显...
  • 云平台作为提供云计算服务的基础,管理着数量巨大的CPU、存储器、交换机等大量硬件资源,以虚拟化的技术来来整合一个数据中心或多个数据中心的资源,屏蔽不同底层设备的差异性,以一种透明的方式向用户提供计算环境...
  • 计算是思科创造的一个术语,由OpenFog Consortium支持,该联盟由Arm、思科、戴尔、英特尔、微软和普林斯顿大学边缘实验室于2015年成立。其使命宣言(部分)内容如下: 我们的工作将定义分布式计算、网络、存储、...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 320,528
精华内容 128,211
关键字:

差异性计算