精华内容
下载资源
问答
  • 2021-04-18 04:51:18

    本帖最后由 xiaowu55 于 2016-3-25 22:30 编辑

    flag_go_on=1;

    num_of_loop=0;

    a = [];%存储剔除的变量下标

    xx = 1:k;%存储最原始的变量下标,如果有5个变量x,则存储1,2,3,4,5

    while flag_go_on

    cij=inv(X'*X);

    cii=diag(cij);

    F_fenweidian_1=finv(1-F_alpha,1,n-k-1);

    ci=sqrt(cii(2:end)*Se_square*F_fenweidian_1/(n-k-1));

    format_str='%15.4f';

    for ii=1:k-1

    format_str=[format_str '%13.4f'];

    end

    fprintf(['\r第%d次检验:\rcii: ' format_str '%13.4f\r ci:              ' ...

    format_str '\rβi:' format_str '%13.4f'],num_of_loop+1,cii,ci,beta_mao)

    if ~all(abs(beta_mao(2:end))>ci')

    flag_go_on=1;

    beta_1tok=beta_mao;

    beta_1tok(1)=[];

    fi_xin=beta_1tok.^2./cii(1:end-1)';

    min_fi=min(fi_xin);

    beta_index=find(fi_xin==min_fi)+1;

    %     这样就可以输出正确的下标了

    index_xx = xx(beta_index-1);

    fprintf('\r x%d 对y的线性影响最不显著(|β%d|=%0.4f)。 删除x%d, 进行第%d次计算:',...

    index_xx,index_xx,abs(beta_all(beta_index)), index_xx,loop_num + 2);

    xx(beta_index-1)=[];

    %         fprintf('\rx%d对y的线性影响最不显著( |β%d|=%0.4f )。删除x%d,进行第%d次计算:',...

    %         beta_index-1+num_of_loop,beta_index-1+num_of_loop,...

    %         abs(beta_mao(beta_index)),beta_index-1+num_of_loop,...

    %         num_of_loop+2)

    else

    fmt_str2='x%d';

    index_of_xi=find(index_of_xi_array);

    for i2=1:length(find(index_of_xi))-1

    fmt_str2=[fmt_str2 '、x%d'];

    end

    fprintf(['\r\r经过检验,剩余所有变量:' ...

    fmt_str2 '对y的线性影响均显著。检验结束。\r'],index_of_xi)

    flag_go_on=0;

    end

    if flag_go_on

    num_of_loop=num_of_loop+1;

    k=k-1;

    if ~k

    fprintf('\r\r警告:通过一一对所有变量做显著性检验,已剔除所有变量!');

    break;

    end

    beta_mao=beta_mao-beta_mao(beta_index)/cii(beta_index)*cij(beta_index,:);

    beta_mao(beta_index)=[];

    %    这样更改就没问题了

    k1 = (beta_index-1)*10+1;

    k2 = (beta_index)*10;

    k = k1:k2;

    format_str0(k)=[];

    fprintf(format_str0,beta_mao);

    %     fmt_str1='';

    %     for i1=1:beta_index-2

    %         fmt_str1=[fmt_str1 'β' num2str(i1) ' = %0.4f\r'];

    %     end

    %    for i1=beta_index:k+1

    %         fmt_str1=[fmt_str1 'β' num2str(i1-1+num_of_loop) ' = %0.4f\r'];

    %     end

    %     fprintf(['\rβ0 = %0.4f\r' fmt_str1],beta_mao)

    X(:,beta_index)=[];

    index_of_xi_array(beta_index-1+num_of_loop-1)=0;

    xi=X(:,2:end);

    x_ba=mean(xi);

    lxy=sum((xi-ones(n,1)*x_ba).*((Y-y_ba)*ones(1,k)));

    Sr_square=sum(beta_mao(2:end).*lxy);

    Se_square=St_square-Sr_square;

    end

    end

    这样更改后显示显著性的系数就没有问题了。

    更多相关内容
  • 线性回归的时候,检验回归方程和各变量对因变量的解释参数很容易搞混乱,下面对这些参数进行一下说明:1.t检验t检验是对单个变量系数的显著性检验 一般看p值; 如果p值小于0.05表示该自变量对因变量解释性很强。...

    做线性回归的时候,检验回归方程和各变量对因变量的解释参数很容易搞混乱,下面对这些参数进行一下说明:

    1.t检验:t检验是对单个变量系数的显著性检验   一般看p值;    如果p值小于0.05表示该自变量对因变量解释性很强。

    2.F检验:F检验是对整体回归方程显著性的检验,即所有变量对被解释变量的显著性检验

    3.P值:P值就是t检验用于检测效果的一个衡量度,t检验值大于或者p值小于0.05就说明该变量前面的系数显著,选的这个变量是有效的。

    4.R方:拟合优度检验

    5.调整后的R方:

    小结:

    t检验 --用于对各变量系数显著性检验 --判断标准:一般用p值 0.05来衡量  小于0.05 显著    大于0.05不显著

    F检验 --整体回归方程显著性检验(所有自变量对因变量的整体解释) --判定:

      需查统计分布表来确定

    P值:就是用于t检验和F检验的衡量指标。

    R方:整体回归方程拟合优度检验,R方的结果越接近于1越好,但是R方会因增加变量而增大,所以引进了调整R方检验。

    调整R方:对R方检验的提升,避免受增加变量对R方的影响,配合向后删除模型观测。

    不显著的原因概述:不显著有很多原因造成,可能是你的这个变量本身与被解释变量没有相关关系,所以不显著;也可能是解释变量过多,由多重共线性引起,也可能是其他原因。

    以上观点不一定完全正确,需进一步参考学习,欢迎大神来指正。

    在进行多元线性回归时,常用到的是F检验和t检验,F检验是用来检验整体方程系数是否显著异于零,如果F检验的p值小于0.05,就说明,整体回归是显著的。然后再看各个系数的显著性,也就是t检验,计量经济学中常用的显著性水平为0.05,如果t值大于2或p值小于0.05就说明该变量前面的系数显著不为0,选的这个变量是有用的。

    参考文献:

    F检验:

    F检验(F-test)

    最常用的别名叫做联合假设检验(英语:joint hypotheses test),此外也称方差比率检验、方差齐性检验。

    它是一种在零假设(null hypothesis, H0)之下,统计值服从F-分布的检验。

    其通常是用来分析用了超过一个参数的统计模型,以判断该模型中的全部或一部分参数是否适合用来估计母体。

    ————————————————

    原文链接:https://blog.csdn.net/sinat_25873421/article/details/80889757

    R方,调整后的R放,F检验:

    展开全文
  • 多元线性回归检验

    万次阅读 2020-07-13 10:43:33
    多元线性回归模型通常用来研究一个应变量依赖多个自变量的变化关系,如果二者的以来关系可以用线性形式来刻画,则可以建立多元线性模型来进行分析。 1.t检验 t检验是对单个变量系数的显著性检验,一般看p值;如果p...

    多元线性回归模型通常用来研究一个应变量依赖多个自变量的变化关系,如果二者的以来关系可以用线性形式来刻画,则可以建立多元线性模型来进行分析。

    1.t检验

    t检验是对单个变量系数的显著性检验,一般看p值; 如果p值小于0.05表示该自变量对因变量解释性很强。

    2.F检验

    F检验是对整体回归方程显著性的检验,即所有变量对被解释变量的显著性检验     

       

     

        

    F检验其通常是用来分析用了超过一个参数的统计模型,以判断该模型中的全部或一部分参数是否适合用来估计母体。

    3.P值

    P值就是t检验用于检测效果的一个衡量度,t检验值大于或者p值小于0.05就说明该变量前面的系数显著,选的这个变量是有效的。

    4.R方

    拟合优度检验

       

    R平方也有其局限性:R平方随着自变量的增加会变大,R平方和样本量是有关系的。因此,我们要到R平方进行修正。得到R平方值adjusted,来评判线性回归模型的拟合度。修正的方法:

         

    n为样本数量,p为特征数量

    • 消除了样本数量和特征数量的影响

    5.调整后的R方

    t检验 --用于对各变量系数显著性检验 --判断标准:一般用p值 0.05来衡量  小于0.05 显著    大于0.05不显著

     F检验 --整体回归方程显著性检验(所有自变量对因变量的整体解释) --判定:  需查统计分布表来确定

    P值:就是用于t检验和F检验的衡量指标。

    R方:整体回归方程拟合优度检验,R方的结果越接近于1越好,但是R方会因增加变量而增大,所以引进了调整R方检验。

    调整R方:对R方检验的提升,避免受增加变量对R方的影响,配合向后删除模型观测。

    不显著的原因概述:不显著有很多原因造成,可能是你的这个变量本身与被解释变量没有相关关系,所以不显著;也可能是解释变量过多,由多重共线性引起,也可能是其他原因。

     

    在进行多元线性回归时,常用到的是F检验和t检验,F检验是用来检验整体方程系数是否显著异于零,如果F检验的p值小于0.05,就说明,整体回归是显著的。然后再看各个系数的显著性,也就是t检验,计量经济学中常用的显著性水平为0.05,如果t值大于2或p值小于0.05就说明该变量前面的系数显著不为0,选的这个变量是有用的。

    https://www.cnblogs.com/tinglele527/p/12015449.html

    展开全文
  • 本文基于R做线性回归及各种检验

    R语言与多元线性回归方程及各种检验


    一、模型建立

    数据放在最后,自取试建立y与x1,x2,x3,x4,x5的线性回归方程
    试建立y与
    代码如下:

    a<-read.csv("eg2.1.csv",header=T);a
    b<-lm(y~x1+x2+x3+x4+x5,data=a)
    

    这里介绍一个包,可以把结果用表格显示:

    install.packages("flextable")
    library(flextable)#制作表格
    as_flextable(b)
    

    输出结果如下:
    在这里插入图片描述
    得到回归方程

    y = − 32 + 0.163 x 1 + 0.228 x 2 + 0.881 x 3 − 0.05 x 4 + 0.169 x 5 y=-32+0.163x_1+0.228x_2+0.881x_3-0.05x_4+0.169x_5 y=32+0.163x1+0.228x2+0.881x30.05x4+0.169x5

    二、多重共线性

    (1)产生的背景:

    1.经济变量间具有共同变化的趋势。例如,对于时间序列数据收入、消费、就业率等等,在经济上升时期均呈现增长的趋势,而在经济收缩期,又都呈现下降趋势。当这些变量同时作为解释变量进入模型时就会带来多重共线性问题。
    2.模型中引入了滞后变量,变量X常常与滞后变量高度相关
    3.利用截面数据建立模型也可能会出现多重共线性。利用截面数据建模时,许多变量变化与发展规模有关,会出现同步增长的趋势,如资本、劳动力、科技、能源等投入与产出的规模相关,这时容易产生多重共线性。
    4.样本数据自身的原因。例如,抽样仅仅限于总体中解释变量取值的一个有限范围,使得变量间变异不大;或由于总体受限,多个解释变量的样本数据相关,这时都可能出现多重共线性。

    (2)多重共线性的检验

    1.简单相关系数法:

    一般而言,如果每两个解释变量的简单的相关系数(0阶自相关系数)比较高,如大于0.8,则可认为存在严重的多重共线性。

    ab<-a[,c(2:6)]#只保留解释变量
    corr<-cor(ab);corr
    corrplot(corr,method="number",type="full",mar=c(0,0,0,0) ,bg="black",tl.col = "blue")
    

    其中corrplot函数详细见这篇文章:
    相关系数热力图
    在这里插入图片描述
    由上图可知,x1和x3的相关系数为0.73,初步判断不存在多重共线性。

    2.方差膨胀因子(vif)法

    一般vif大于10即可认为存在严重的多重共线性:
    通过建立x1~x2+x3+x4+x5的线性关系得到R方,那么x1的方差膨胀因子就是
    V I F = 1 1 − R 2 VIF=\frac{1}{1-R^2} VIF=1R21
    其他的类似,r语言有vif这个函数可以直接求:

    library(car)#检验多重共线性的包
    vif(b)#b是线性回归的结果
    

    VIF
    可以看出:vif值都小于10,即可判断出没有多重共线性

    3.矩阵 X T X X^TX XTX的条件数k

    条件数的定义为:
       k ( X T X ) = ∥ X T X ∥ ⋅ ∥ ( X T X ) − 1 ∥ = λ max ⁡ ( X T X ) λ min ⁡ ( X T X ) \,\,k\left( X^TX \right) =\left\| X^TX \right\| \cdot \left\| \left( X^TX \right) ^{-1} \right\| =\frac{\lambda _{\max \left( X^TX \right)}}{\lambda \min \left( X^TX \right)} k(XTX)=XTX(XTX)1=λmin(XTX)λmax(XTX)
    若k<100,则认为多重共线性的程度很小,在100到1000之间则认为存在中度或较强的多重共线性,若大于1000,则认为存在严重的多重共线性。
    在R软件中,用kappa()计算矩阵的条件数,其使用方法为:

    **kappa(z,exact=F)***

    其中z是矩阵,exact=F即不精确计算条件数,近似计算

    XX<-cor(ab)#先做出相关系数矩阵
    kappa(XX)#对相关系数矩阵做
    eigen(XX)#求特征值和特征向量
    

    在这里插入图片描述
    可以看出条件数的值为7,即不存在多重共线性。

    (3)多重共线性的修正

    本文虽然没有出现多重共线性的问题,但是如果出现了,该如何解决呢?
    本文主要通过逐步回归来修正多重共线性

    代码如下:

    
    aaa<-step(b)
    as_flextable(aaa)
    

    在这里插入图片描述
    得到最后的回归方程:

    y = − 18.43 + 0.249 x 2 + 0.986 x 3 y=-18.43+0.249x_2+0.986x_3 y=18.43+0.249x2+0.986x3

    二、异方差性的检验及修正

    1.异方差性的实质

    设模型为
    Y i = β 0 + β 1 x 1 i + β 2 x 2 i + . . . + β k x k i + u i ( i = 1 , 2 , . . . n ) \\ Y_i=\beta _0+\beta _1x_{1i}+\beta _2x_{2i}+...+\beta _kx_{_{ki}}+u_i\left( i=1,2,...n \right) Yi=β0+β1x1i+β2x2i+...+βkxki+ui(i=1,2,...n)
    如果其他假定均不变,但模型中随机误差项 u i u_i ui的方差为
    V a r ( u i ) = σ i 2 ( i = 1 , 2 , . . . n ) Var(u_i)=\sigma_i^2(i=1,2,...n) Var(ui)=σi2(i=1,2,...n)
    则称 u i u_i ui具有异方差性(heteroscedasiticity

    2.异方差性的检验

    1.图示检验法

    一般把标准化残差的绝对值大于等于2的观测值认为是可疑点,而把标准化残差值绝对值大于等于3认为是异常值

    rst <- rstandard(b)#标准化残差
    fit<-predict(b)#预测值
    library(ggplot2)#载入ggplot2包
    mn<-data.frame(rst,fit)
    ggplot(mn,aes(fit,rst))+geom_point()
    
    

    通过绘制出散点图可以看出:
    在这里插入图片描述
    标准化残差值大致在区间(-2,3)内 ,存在可疑点。是否存在异方差性还需要进一步检测。

    2.Goldfeld—Quandt检验

    install.packages("lmtest")
    library(lmtest)
    as_flextable(gqtest(b))
    

    在这里插入图片描述可以看出p值为0.4,即接受原假设,即不存在异方差

    3.White检验和H.glesjser检验

    White检验的统计量:

    w = n ∗ R 2   C h i S q u a r e ( k ) w=n*R^2~ChiSquare\left( k \right) w=nR2 ChiSquare(k)
    由于解释变量由5个,这个其实不太适合做white检验
    可以参考这篇文章:
    异方差与r语言实践

    3.异方差的修正

    加权最小二乘法:在r语言中代码非常简单
    这里取权重为1/abs(e)

    e<-resid(b)#e是标准化残差
    b1<-lm(y~x1+x2+x3+x4+x5,weights=1/abs(e),data=a)
    as_flextable(b1)
    

    在这里插入图片描述
    得到方程:
    y e = − 36 e + 0.187 x 1 e + 0.205 x 2 e + 0.883 x 3 e + 0.004 x 4 e + 0.158 x 5 e \frac{y}{\sqrt{e}}=\frac{-36}{\sqrt{e}}+0.187\frac{x_1}{\sqrt{e}}+0.205\frac{x_2}{\sqrt{e}}+0.883\frac{x_3}{\sqrt{e}}+0.004\frac{x_4}{\sqrt{e}}+0.158\frac{x_5}{\sqrt{e}} e y=e 36+0.187e x1+0.205e x2+0.883e x3+0.004e x4+0.158e x5
    其中e是残差

    数据链接
    链接:https://pan.baidu.com/s/1My6WTMXEZyIVfIM7A5oIbA?pwd=tjby
    提取码:tjby
    –来自百度网盘超级会员V4的分享

    展开全文
  • ##作业:分析影响中国人口...%基于矩阵运算的多元线性回归分析 %参数估计 x1=[15037 17001 18718 21826 26937 35260 48108 59811 70142 78061 83024 88479 98000 108068 119096 135174 159587 184089 213132]; x2=[18.8
  •  t检验回归系数的置信区间  当上述F检验结论是推翻H0时,并不见得每个解释变量都对yt有显著的解释作用(即不见得每一个都是重要解释变量),所以还应对每个解释变量的系数进行显著性检验。零假设
  • 当影响因变量的因素是多个时候,这种一个变量同时与多个变量的回归问题就是多元回归,分为:多元线性回归和多元非线性回归。这里直说多元线性回归。对比一元线性回归:1.1多元回归模型:1.2多元回归方程1.3估计的...
  • 多元线性回归多元线性回归模型实际中有很多问题是一个因变量与多个自变量成线性相关,我们可以用一个多元线性回归方程来表示。为了方便计算,我们将上式写成矩阵形式:Y = XW假设自变量维度为NW为自变量的系数,下标0...
  • 线性回归 T检验P值计算

    万次阅读 2019-02-21 19:08:00
    参考链接 1.http://blog.sciencenet.cn/home.php?mod=space&amp;uid=651374&amp;do=blog&amp;id=1053456&amp;from=space 2.https://blog.csdn.net/touch_dream/article/details/78716507 ...
  • 多元线性回归推导过程

    万次阅读 多人点赞 2018-08-06 20:26:23
    常用算法一 多元线性回归详解1 此次我们来学习人工智能的第一个算法:多元线性回归.文章会包含必要的数学知识回顾,大部分比较简单,数学功底好的朋友只需要浏览标题,简单了解需要哪些数学知识即可. 本章主要包括...
  • 多元线性回归

    千次阅读 2021-09-04 15:26:54
    多元线性回归通俗理解就是一个因变量与多个自变量之间的相关关系 scikit-learn中的线性回归使用 from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split from...
  • 满意答案进行多元线性回归统计数F, t 测验的小程序: clear,clc x=rand(50,10);y=rand(50,1); % example [n,k]=size(x); X=[ones(n,1),x];%构建结构阵X, A=X'*X; %求算信息阵A, C=inv(A); %求算信息阵的逆阵, b=X...
  • R多元线性回归分析

    千次阅读 2021-12-12 13:36:19
    执行多元线性回归分析以确定数据集中的哪些变量可以预测 MechaCar 原型的 mpg。 悬挂线圈的汇总统计。从制造批次中收集有关悬挂线圈的每平方英寸磅数 (PSI) 的汇总统计数据 悬架线圈的 T 检验。运行 t 检验以确定...
  • spss多元线性回归结果解读

    千次阅读 2020-12-29 01:06:25
    本文收集整理关于spss多元线性回归结果解读的相关议题,使用内容导航快速到达。内容导航:Q1:请高手帮忙分析下SPSS的多元线性回归结果吧~急啊~~~你的回归方法是直接进入法拟合优度R方等于0.678,表示自变量可以解释...
  • 回归方程的预报精度 回顾总结 十一、回归方程与回归系数的显著性检验 回归方程的显著性检验检验的是我们建立线性回归方程的合理性,因为我们不能肯定模型是正确的,也就是说我们需要检验 YYY与 x1,⋯ ,xmx_1,\...
  • 多元线性回归模型检验和预测

    千次阅读 2020-11-29 00:50:43
    t检验回归系数检验:单个自变量在模型中是否有效。二、回归模型检验检验回归模型的好坏常用的是F检验和t检验。F检验验证的是偏回归系数是否不全为0(或全为0),t检验验证的是单个自变量是否对因变量的影响是...
  • 多元线性回归模型

    千次阅读 2022-05-14 18:32:20
    对于多元线性模型而言,因变量若为连续型变量,则采用普通的线性模型;若因变量为离散型变量(类型变量或计数变量),则需采用广义多元线性模型。下面就线性模型展开说明讲解。 一、普通多元线性模型 我们用一个...
  • 利用MATLAB进行多元线性回归

    千次阅读 2021-04-21 02:46:03
    利用MATLAB进行多元线性回归 2.线性回归 b=regress(y,X) [b,bint,r,rint,s]=regress(y,X,alpha) 输入: y~因变量(列向量), X~1与自变量组成的矩阵, Alpha~显著性水平(缺省时设定为0.05) s: 3个统计统计 量:决定...
  • matlab建立多元线性回归模型并进行显著性检验及预测问题例子;x=[143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164]'; X=[ones(16,1) x]; 增加一个常数项 Y=[88 85 88 91 92 93 93 95 96 98 97 96 ...
  • 多元线性回归模型是一种简单而且有效的数学模型,一直在各领域广泛使用。一个多元回归模型建好后,如何评价模型的优劣呢?1. F值检验因变量的总变异(数据与均值之差的平方和,记为SStotal)由回归平方和(因变量的变异...
  • 多元线性回归分析

    2021-10-28 10:12:19
    取出自变量和因变量9,进行多元线性回归10,结果4,用线性回归模型的统计学库实现1,导入函数2,进行预测3,检验一下4,去掉bedroom,再次建模5,分析6,总结7,参考 1,概念 在回归分析中,如果有两个或两个以上的...
  • Python数学建模 多元线性回归

    千次阅读 2022-01-21 12:45:43
    文章目录基于Python的数学建模生成回归数据多元线性回归多重共线性检验(方差膨胀因子VIF)多重共线性处理变量间相关性分析正态检验Pearson相关系数建立多元回归模型拟合模型绘制拟合图异方差检验自相关性检验 ...
  • 线性回归模型属于经典的统计学模型,该模型的应用场景是根据已知的变量(自变量)来预测某个连续的数值变量(因变量)。例如,餐厅根据每天的营业数据(包括菜谱价格、就餐人数、预定人数、特价菜折扣等)预测就餐...
  • 多元线性回归常见问题

    千次阅读 2020-12-24 23:35:15
    0.多元线性回归多元线性回归是统计学中经常用到回归方法,一般需满足一下六个条件:随机误差项是一个期望值或平均值为0的随机变量;对于解释变量的所有观测值,随机误差项有相同的方差;随机误差项彼此不相关;解释...
  • Excel做多元线性回归

    千次阅读 2021-10-26 13:09:36
    一、EXCEL进行多元线性回归 1.首先需要下载一个数据分析的插件: 点击左上角文件->选项->加载项->分析工具库->转到-数据分析库->确定 下载好插件之后就可以看到这里多了一个数据分析 点击...
  • 多元线性回归分析(Stata)

    千次阅读 多人点赞 2022-01-14 10:12:47
    线性回归:因变量Y为连续性数值变量,例如GDP的增长率 0-1回归:因变量Y为0-1型变量,例如P2P公司研究借款人是否能按时还贷,那么Y可以设计为二值变量,Y=0时代表可以还贷,Y=1时代表不能还贷 定序回归:...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,204
精华内容 1,281
关键字:

多元线性回归系数t检验

友情链接: 77460772.zip