精华内容
下载资源
问答
  • MATLAB做T检验(ttest)

    千次阅读 2013-10-24 17:28:00
    t-检验: t-检验,又称student‘s t-...matlab中提供了两种相同形式的方法来解决这一假设检验问题,分别为ttest方法和ttest2方法,两者的参数、返回值类型均相同,不同之处在于ttest方法的是 One-sample and pa...

    t-检验:

    t-检验,又称student‘s t-test,可以用于比较两组数据是否来自同一分布(可以用于比较两组数据的区分度),假设了数据的正态性,并反应两组数据的方差在统计上是否有显著差异。

    matlab中提供了两种相同形式的方法来解决这一假设检验问题,分别为ttest方法和ttest2方法,两者的参数、返回值类型均相同,不同之处在于ttest方法做的是 One-sample and paired-sample t-test,而ttest2则是 Two-sample t-test with pooled or unpooled variance estimate, performs an unpaired two-sample t-test。但是这里至于paired和unpaired之间的区别我却还没搞清楚,只是在Student's t-test中看到了如下这样一段解释:

    “Two-sample t-tests for a difference in mean involve independent samples, paired samples and overlapping samples. Pairedt-tests are a form of blocking, and have greater power than unpaired tests when the paired units are similar with respect to "noise factors" that are independent of membership in the two groups being compared.[8] In a different context, paired t-tests can be used to reduce the effects ofconfounding factors in an observational study.”

    因此粗略认为paired是考虑了噪声因素的。

    在同样的两组数据上分别用ttest和ttest2方法得出的结果进行比较,发现ttest返回的参数p普遍更小,且置信区间ci也更小。

     

    最常用用法:
    [H,P,CI]=ttest2(x,y);(用法上ttest和ttest2相同,完整形式为[H,P,CI, STATS]=ttest2(x,y, ALPHA);)

    其中,x,y均为行向量(维度必须相同),各表示一组数据,ALPHA为可选参数,表示设置一个值作为t检验执行的显著性水平(performs the test at the significance level
        (100*ALPHA)%),在不设置ALPHA的情况下默认ALPHA为0.05,即计算x和y在5%的显著性水平下是否来自同一分布(假设是否被接受)
    结果:H=0,则表明零假设在5%的置信度下被拒绝(根据当设置x=y时候,返回的H=0推断而来),即x,y在统计上可看做来自同一分布的数据;H=1,表明零假设被拒绝,即x,y在统计上认为是来自不同分布的数据,即有区分度。

    P为一个概率,matlab help中的解释是“ the p-value, i.e., the probability of observing the given result, or one more extreme, by chance if the null  hypothesis is true.  Small values of P cast doubt on the validity of  the null hypothesis.” 暂且认为表示判断值在真实分布中被观察到的概率(?不太懂)

    CI为置信区间(confidence interval),表示“a 100*(1-ALPHA)% confidence interval for the true difference of population means”,即达到100*(1-ALPHA)%的置信度的数据区间(?)

     

    应用:常与k-fold crossValidation(交叉验证)联用可以用于两种算法效果的比较,例如A1,A2两算法得出的结果分别为x,y,且从均值上看mean(x)>mean(y),则对[h,p,ci]=ttest2(x,y);当h=1时,表明可以从统计上断定算法A1的结果大于(?)A2的结果(即两组数据均值的比较是有意义的),h=0则表示不能根据平均值来断定两组数据的大小关系(因为区分度小)

     

    临时学的,没经过太多测试,不一定对,还请高手指教。

     

     

    另外还有在某个ppt(http://jura.wi.mit.edu/bio/education/hot_topics/pdf/matlab.pdf)中看到这样一页

     

    参考资料:

    经验+自身理解

    matlab 7.11.0(R2010b)的帮助文档

    wikipedia

    http://www.biosino.org/pages/newhtm/r/schtml/One_002d-and-two_002dsample-tests.html

     

    本文中提到的pair应该如此理解:两个样本是有顺序的(比如两个病人24个整点的体温),两个同一序号(比如说6点)的体温为一个配对.而不配对的则不考虑这些,把24个体温放在一起看分布情况

    展开全文
  • t-检验:t-检验,又称student‘s t-...matlab中提供了两种相同形式的方法来解决这一假设检验问题,分别为ttest方法和ttest2方法,两者的参数、返回值类型均相同,不同之处在于ttest方法的是One-sample and paired...

    t-检验:

    t-检验,又称student‘s t-test,可以用于比较两组数据是否来自同一分布(可以用于比较两组数据的区分度),假设了数据的正态性,并反应两组数据的方差在统计上是否有显著差异。

    matlab中提供了两种相同形式的方法来解决这一假设检验问题,分别为ttest方法和ttest2方法,两者的参数、返回值类型均相同,不同之处在于ttest方法做的是 One-sample and paired-sample t-test,而ttest2则是 Two-sample t-test with pooled or unpooled variance estimate, performs an unpaired two-sample t-test。但是这里至于paired和unpaired之间的区别我却还没搞清楚,只是在Student's t-test中看到了如下这样一段解释:

    “Two-sample t-tests for a difference in mean involve independent samples, paired samples and overlapping samples. Pairedt-tests are a form of blocking, and have greater power than unpaired tests when the paired units are similar with respect to "noise factors" that are independent of membership in the two groups being compared.t-tests can be used to reduce the effects ofconfounding factors in an observational study.”

    因此粗略认为paired是考虑了噪声因素的。

    在同样的两组数据上分别用ttest和ttest2方法得出的结果进行比较,发现ttest返回的参数p普遍更小,且置信区间ci也更小。

    最常用用法:

    [H,P,CI]=ttest2(x,y);(用法上ttest和ttest2相同,完整形式为[H,P,CI, STATS]=ttest2(x,y, ALPHA);)

    其中,x,y均为行向量(维度必须相同),各表示一组数据,ALPHA为可选参数,表示设置一个值作为t检验执行的显著性水平(performs the test at the significance level

    (100*ALPHA)%),在不设置ALPHA的情况下默认ALPHA为0.05,即计算x和y在5%的显著性水平下是否来自同一分布(假设是否被接受)

    结果:H=0,则表明零假设在5%的置信度下不被拒绝(根据当设置x=y时候,返回的H=0推断而来),即x,y在统计上可看做来自同一分布的数据;H=1,表明零假设被拒绝,即x,y在统计上认为是来自不同分布的数据,即有区分度。

    P为一个概率,matlab help中的解释是“ the p-value, i.e., the probability of observing the given result, or one more extreme, by chance if the null  hypothesis is true.  Small values of P cast doubt on the validity of  the null hypothesis.” 暂且认为表示判断值在真实分布中被观察到的概率(?不太懂)

    CI为置信区间(confidence interval),表示“a 100*(1-ALPHA)% confidence interval for the true difference of population means”,即达到100*(1-ALPHA)%的置信度的数据区间(?)

    应用:常与k-fold crossValidation(交叉验证)联用可以用于两种算法效果的比较,例如A1,A2两算法得出的结果分别为x,y,且从均值上看mean(x)>mean(y),则对[h,p,ci]=ttest2(x,y);当h=1时,表明可以从统计上断定算法A1的结果大于(?)A2的结果(即两组数据均值的比较是有意义的),h=0则表示不能根据平均值来断定两组数据的大小关系(因为区分度小)

    临时学的,没经过太多测试,不一定对,还请高手指教。

    参考资料:

    经验+自身理解

    matlab 7.11.0(R2010b)的帮助文档

    wikipedia

    http://www.biosino.org/pages/newhtm/r/schtml/One_002d-and-two_002dsample-tests.html

    本文中提到的pair应该如此理解:两个样本是有顺序的(比如两个病人24个整点的体温),两个同一序号(比如说6点)的体温为一个配对.而不配对的则不考虑这些,把24个体温放在一起看分布情况

    展开全文
  • Mann-Kendall显著性检验 工具:1、MATLAB 2、DPS 3、示例数据(数据采用的是魏凤英老师《现代气候统计诊断预测技术》中的1900-1990年上海市的年平均气温数据) Mann-Kendall原理可详细参考...

    Mann-Kendall显著性检验

    工具:1、MATLAB
    2、DPS
    3、示例数据(数据采用的是魏凤英老师《现代气候统计诊断预测技术》中的1900-1990年上海市的年平均气温数据)
    Mann-Kendall原理可详细参考https://wenku.baidu.com/view/6fd3fe5b6edb6f1afe001f2f.html
    1.数据

    1900        15.4
    1901        14.6
    1902        15.8
    1903        14.8
    1904        15
    1905        15.1
    1906        15.1
    1907        15
    1908        15.2
    1909        15.4
    1910        14.8
    1911        15
    1912        15.1
    1913        14.7
    1914        16
    1915        15.7
    1916        15.4
    1917        14.5
    1918        15.1
    1919        15.3
    1920        15.5
    1921        15.1
    1922        15.6
    1923        15.1
    1924        15.1
    1925        14.9
    1926        15.5
    1927        15.3
    1928        15.3
    1929        15.4
    1930        15.7
    1931        15.2
    1932        15.5
    1933        15.5
    1934        15.6
    1935        16.1
    1936        15.1
    1937        16
    1938        16
    1939        15.8
    1940        16.2
    1941        16.2
    1942        16
    1943        15.6
    1944        15.9
    1945        16.2
    1946        16.7
    1947        15.8
    1948        16.2
    1949        15.9
    1950        15.8
    1951        15.5
    1952        15.9
    1953        16.8
    1954        15.5
    1955        15.8
    1956        15
    1957        14.9
    1958        15.3
    1959        16
    1960        16.1
    1961        16.5
    1962        15.5
    1963        15.6
    1964        16.1
    1965        15.6
    1966        16
    1967        15.4
    1968        15.5
    1969        15.2
    1970        15.4
    1971        15.6
    1972        15.1
    1973        15.8
    1974        15.5
    1975        16
    1976        15.2
    1977        15.8
    1978        16.2
    1979        16.2
    1980        15.2
    1981        15.7
    1982        16
    1983        16
    1984        15.7
    1985        15.9
    1986        15.7
    1987        16.7
    1988        15.3
    1989        16.1
    1990        16.2
    
    
    1. MATLAB实现

    参考网上多个代码可得
    https://www.ilovematlab.cn/thread-246993-1-1.html
    https://blog.csdn.net/qq_25102303/article/details/100727568
    http://wap.sciencenet.cn/blog-1103122-843106.html

    clc
    clear all
    A=xlsread('C:\Users\Administrator\Desktop\tem.xls');%输入数据文件
    x=A(:,1); % 时间列
    y=A(:,2); % 数据列
    N=length(y);
    n=length(y);
    Sk=zeros(size(y));
    UFk=zeros(size(y));
    s=0;
    for i=2:n
       for j=1:i
             if y(i)>y(j)
               s=s+1;
             else
               s=s+0;
             end
       end
       Sk(i)=s;
       E=i*(i-1)/4; 
      Var=i*(i-1)*(2*i+5)/72; 
      UFk(i)=(Sk(i)-E)/sqrt(Var);
    end
    y2=zeros(size(y));
    Sk2=zeros(size(y));
    UBk=zeros(size(y));
    s=0;
    for i=1:n
        y2(i)=y(n-i+1);
    end
    for i=2:n
       for j=1:i
             if y2(i)>y2(j)
               s=s+1;
             else
               s=s+0;
             end
       end
       Sk2(i)=s;
       E=i*(i-1)/4; 
      Var=i*(i-1)*(2*i+5)/72;
      UBk(i)=0-(Sk2(i)-E)/sqrt(Var);
    end
    UBk2=zeros(size(y));
    for i=1:n
       UBk2(i)=UBk(n-i+1);
    end
    h1=plot(x,UFk,'r-','linewidth',1.5);
    hold on
    h2=plot(x,UBk2,'b-.','linewidth',1.5);
    axis([min(x),max(x),-5,6]);
    xlabel('年份','FontName','TimesNewRoman','FontSize',12);
    ylabel('时间序列数据','FontName','TimesNewRoman','Fontsize',12);
    hold on
    plot(x,0*ones(N,1),'-.','linewidth',1); 
    ylim([-8 8]);
    h3=plot(x,1.96*ones(N,1),':','linewidth',1);
    plot(x,-1.96*ones(N,1),':','linewidth',1);
    legend([h1 h2 h3],'UF统计量','UB统计量','0.05显著水平','Location','NorthEast');
    f1=UFk;
    f2=UBk2;
    
    
    

    运行结果:
    在这里插入图片描述
    4. DPS实现
    时间序列->时间序列突变点分析
    在这里插入图片描述
    在这里插入图片描述
    《现代气候统计诊断预测技术》书里的图:
    书里的图
    同一组数据,做出的M-K结果,分析这三张图可知,MATLAB的结果图与其他两张图相比,还是有些差异(UF、UB曲线起点、交点等),但是DPS软件的结果与书中的图一样。
    附:Mann-Kendall检验还可在EXCEL中实现,但是还没尝试过,有时间了再尝试一下
    参考:http://www.docin.com/p-875075825.html

    展开全文
  • 前段时间审稿人给我文章的审稿意见中有要求对实验结果假设性检验,我了一番学习,网上这方面资料也比较少,记录如下。 参数检验是说我们能够以多大的置信度去相信某个命题,或者作出某个断言的出错概率是多少。 ...

    前段时间审稿人给我文章的审稿意见中有要求对实验结果做假设性检验,我做了一番学习,网上这方面资料也比较少,记录如下。

    假设性检验是说我们能够以多大的置信度去相信某个命题,或者作出某个断言的出错概率是多少。

    我们统计课学过的卡方检验什么的都属于参数检验,它们事先假定未知量服从正态分布;非参数检验是指未知量的分布也是未知的。Wilcoxon秩和检验是一种常见的用于判断两个分布列是否有显著区别的非参数检验方法,matlab调用非常简单。

    x=[0.8587,0.8591,0.8591,0.8569,0.8555,0.8390];
    y=[0.8583,0.8589,0.8637,0.8589,0.8613,0.8616];
    ranksum(x,y)
    ans =
    
        0.0823
    

    假设存在两个分布未知的变量x和y,各有一组观测值如上所示,ranksum是matlab自带的Wilcoxon秩和检验方法,用于判断两变量是否有显著性区别。输出结果就直接是p值,为0.0823,表示:认为x与y有显著性区别,这一断言的犯错概率是8.23% (at the default 8.23%).

    参考资料:
    ranksum文档
    关于假设性检验,你想要的都在这儿了!
    百度文库:非参数检验
    百度文库:参数假设检验

    展开全文
  • 参数估计和假设检验 区间估计 置信区间 ...用MATLAB做T检验(ttest) t-检验,又称student‘s t-test,可以用于比较两组数据是否来自同一分布(可以用于比较两组数据的区分度),假设了数据的正态性,...
  • 将两组测量值对应相减,再将所得差值看作服从正态分布的随机变量,然后再关于差值的均值的假设检验matlab:[h, p, ci, stats] = ttest(x, y, 'name', 'value'); ▷ OPTIONS: …'Alpha...
  • 多元线性回归及显著性检验Matlab程序完美版 一说明 1本程序是硕士教材数理统计杨虎刘琼钟波 编著 例4.4.1P133Matlab编程解答程序教材上例题只了回归方程显著性分析和一次回归系数显著性分析剔除x1后没有再检验x2和...
  • 什么情况下需要正态分布检验如何检验1. Shapiro-Wilk检验(W检验)2....什么情况下需要正态分布检验统计推断的前提假设是正态分布模型基于正态分布2.如何检验参考:https://bbs.pinggu.org/linkto.php?...
  • 1.熟悉Matlab内置线性规划函数的使用 2.对Iris数据集中的数据求取协方差和相关性系数矩阵。并对该数据集KL变换。 3.随机产生100组数据,每组数据有25个点,数据点为函数sin(2*pi*x)加上高斯噪声,使用Ridge回归对...
  • ttest__t检验matlab简析

    千次阅读 2014-04-15 16:41:00
    t-检验,又称student‘s t-test,...matlab中提供了两种相同形式的方法来解决这一假设检验问题,分别为ttest方法和ttest2方法,两者的参数、返回值类型均相同,不同之处在于ttest方法的是 One-sample and paired-
  • 二、 具体实现,从国家统计局获取湖南省过去十年的人口数据,作为原始数据,见Excel文件,利用MATLAB对灰色预测模型进行求解,具体MATLAB实现见如下代码: %MATLAB 2016a版 clear,clc; A=xlsread('分...
  • 上回说到,了VBM和SBM的指标提取及双样本T检验统计分析,那接下来我们还可以什么呢,可以从许多文献中看到,有的不仅仅只计算每个体素指标值之间的差异,还会想到要将其放到各个脑区上,比较指标在脑区之间的...
  • Matlab2010经典教程-MATLAB2010教程教程.rar MATLAB基础知识 3 第 1 节 Matlab 基本知识 3 一、 Matlab 的主要功能 3 二、 Matlab 的界面 3 M-文件(函数文件) 3 Matlab帮助系统 4 三 、关于变量 ...
  • matlab相关系数计算

    万次阅读 2018-07-17 01:00:31
    样本的相关性并不能代表总体也是相关的,因此需要做统计检验。常用的检验方法是t检验法。理论的方法是给定信度alpha,根据自由度n-2通过查表查出talpha,来给出是否通过检验。这是最一般也是最常用的两个序列的相关...
  • matlab的toolbox中也含有概率统计方面的库函数.概率方面的库函数主要有各种常见分布的分布函数、概率密度、分布率以及生成服从各种分布随机数的函数....以下我们主要对matlab在概率统计方面的内容一些介绍.
  • BP神经网络算法的matlab代码

    千次阅读 2020-12-10 21:38:26
    %生成数(使用0.1因子),之后13年的数据按统计方法标准化后输入,训练,仿真,对比结果。这个过程相当于插值计算% %输出结果请最后五句r1,r,l,plotyy(k,to,k,t),plotyy(k,a,k,f)% %这样的缺点是不能检验预测效果的...
  • 越来越多的统计学者提倡使用贝叶斯方法检验研究假设,也经常有实证研究的学者咨询如何使用贝叶斯因子(Bayes factor, BF)进行数据分析。本文首先介绍贝叶斯因子的相关问题,随后展示如何使用R软件包bain进行贝叶斯...
  • (3) 两组及多组独立的均匀分布的随机数统计和的概率密度直方图; (4) 用一个数学期望为0和不为0,方差为某值的高斯分布随机数,作为样本序列求自相关函数的估值,并用图形表示; (5)并计算出的自相关函数的...
  • 前面所的都是从时间尺度上研究的变化趋势,而从空间尺度上分析,能够更加直观地看出温度变化的地理位置。...定义检验统计量SSS: S=∑i=2n∑j=1i−1sign(Xi−Xj) S=\sum_{i=2}^n\sum_{j=1}^{i-1}si
  • 下表给出的是近两个世纪的美国人口统计数据(以百万为单位),对模型做检验,最后用它预报2010年美国的人口. 年份 1790 1800 1810 1820 1830 1840 人口 3.9 5.3 7.2 9.6 ...
  • 它是将需要做统计分析的数据和另一组标准数据进行对比,求得它和标准数据之间的偏差的方法。Matlab中的两个函数调用:kstest:如kstest(x),x为一向量,则将检查x是否属于标准正态分布;其它调用...
  • 频数表、直方图、折线图、饼状图等等,首先要的是如何把这些数据在matlab中表示。 先把数据写入一个纯文本数据文件 data.txt 中, 格式如上表,有 20 行、10 列,数据列之间用空格键或 Tab 键...
  • 秉承一向对统计学理论和方法的严谨态度,你对所有的数据都了统计学检验并给出了置信区间。这些统计分析结果并不只包含P值!你提供的一些数据涉及在不同处理下食草昆虫破坏的叶面积比例。当你准时完成报告时,一位...
  • R中的假设检验(二)方差分析画图

    千次阅读 2020-02-04 23:32:42
    还有好多事情等着我去,还有论文没写,还有fMRI没研究,还有matlab没有学,我真是个不务正业到极点了,555,希望以后会用到这些知识和手段,不然我巨亏。要赶紧抓时间学习专业知识和领域技术,能发文章的技术才是...
  • 在此,我们对这四种分布详细的介绍,并附上MATLAB代码。 四种分布的讲解摘自MATLAB 2016的统计学和机器学习工具箱,有兴趣的可以去查看英文原版。 另外,为了方便,上传文档为图片格式,可能有些模糊...

空空如也

空空如也

1 2
收藏数 28
精华内容 11
关键字:

matlab做统计检验

matlab 订阅