精华内容
下载资源
问答
  • 常数项是什么意思
    千次阅读
    2020-03-14 19:57:02

    如何理解线性回归中的常数项

    线性模型

    线性模型(linear model)试图学得一个通过属性的线性组合来进行预测的函数,即:

    f(x)=w1x1+w2x2+…+wdxd+b+e

    很容易理解,b是常数项,代表的是截距,而e是误差。

    线性模型
    以上图像代表的是一元线性模型,而多元线性模型则使用更多的自变量去描述因变量。
    从一元线性模型入手,我们可以发现:
    1)误差是实际的数据点和我们回归模型之间的差值,并不一定,有大有小,符合正态分布的规律。
    2)常数项解释的是,不被自变量所解释的,长期稳定存在的非随机部分,也可称为信息残留。

    常数项的存在帮助我们解决了一个问题:当所有的自变量为0的时候,因变量是什么?然而这样的解释仅具有数学意义。
    所谓的拟合过程,追求的是残差项的均值为0,且残差项的平方和最小。以此规则计算得出的各项参数,可以使得一条拟合曲线在我们的数据点中浮动,并最终找到一个位置,是的残差项的均值为0。此时,我们的截距就是常数项。可以说这是对解释变量留下的偏误进行线性修正。本身并不具备可以理解的现实意义。
    另外,常数项也被这样解读,它是一个恒为1的虚拟变量的参数。这帮助我们利用了本可能被忽略的因素。
    而且,残差项未必总是按标准正态分布,如果它们的均值不为0,而存在一个期望,事实上这个期望会被包括在常数项之中。帮助我们修正这正太分布的均值,使之为0。

    更多相关内容
  • 回归系数 回归系数表格列出了输出模型的偏回归系数估计值(本例只有自变量 和常数项 )。表格给出了非标准化系数(Unstandardized Coefficients),标准化系数(Standardized Coefficients),以及各偏回归系数...

    be5ec58b882d0db702030fc156d4a4a2.png

    线性回归是一种简单又强大的统计模型,可用于检测两个或者多个变量之间的线性关系。常用统计软件包括R,Python,SPSS等都有相应模块帮助我们轻松建立线性回归模型。但面对软件给出的一长串统计结果时,很多朋友不知道如何解释这些数字,从而无法对模型的有效性给出合理诊断。

    通过阅读本文,你将能理解报告中核心数字所代表含义,更精确的阐释回归分析结果。

    一般来说,回归分析报告主要包含以下三个部分:

    1.模型摘要

    bfd71374003ce325be80330e595d135c.png

    摘要告诉我们模型的拟合性如何。表中的

    叫相关系数,
    叫决定系数,Adjusted
    叫校正决定系数,这三个指标统计意义相似,通常情况下只看
    就好了。比如
    表示回归模型可以解释因变量(
    )的方差的
    ,拟合性还是不错的。

    2.方差分析

    2e2449f1492ec78c2508f23d7cb1949d.png

    方差分析的本质是检测

    是否显著大于0。重点在表格最后两列的F统计值和
    (表示对应
    值)。上表中
    , 假设检验有效,表明
    显著大于0,也就是说至少有一个自变量和
    存在显著的线性关系,因此我们的回归模型有统计学意义。

    3.回归系数

    265445587f8b0979a460d863a0984c25.png

    回归系数表格列出了输出模型的偏回归系数估计值(本例只有自变量

    和常数项
    )。表格给出了非标准化系数(Unstandardized Coefficients),标准化系数(Standardized Coefficients),以及各偏回归系数(是否为0)的t检验结果。

    非标准化系数表示各变量的拟合系数,比如

    的系数为
    ,表示
    每增加一个单位,
    将减小
    个单位。
    表示
    取0时,
    的预测值为
    。最后两列分别为
    值和
    值,我们只要看非常数项的
    值就好了,
    表示该偏回归系数统计有效,否则统计无效。

    综上,我们可建立回归方程

    特别说明:纳入哪些自变量进行回归预测是由研究者根据专业和经验结合统计结果决定,而不是单单根据统计结果来决定。当自变量较多需要进行筛选自变量时,不同的筛选方法、不同的纳入剔除标准,也会得到完全不同的结果,入选的不一定是最好的,没有纳入的也未必没有统计学意义。

    展开全文
  • 多元线性回归模型中的常数项

    万次阅读 2018-03-19 17:15:21
    作者:flyerye链接:https://www.zhihu.com/question/22450977/answer/250476871来源:...从定义来看,多元线性回归方程定义如下:这里的 a 为常数项, 为随机误差项,且服从标准正态分布( ),或者我们把它称作白...
    作者:flyerye
    链接:https://www.zhihu.com/question/22450977/answer/250476871
    来源:知乎
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    回答这个问题,我们先从定义出发,然后再结合个实际例子去理解。从定义来看,多元线性回归方程定义如下:

    Y=a+b_{1}x_{1}+b_{2}x_{2}+...+b_{n}x_{n}+\varepsilon

    这里的 a 为常数项, \varepsilon 为随机误差项,且服从标准正态分布( \sim N(0,1) ),或者我们把它称作白噪声(white noise)。通过图像,我们可以很好理解常数项和随机误差的含义:

    <img src="https://pic4.zhimg.com/50/v2-b3543732f4855d372e37c747e332362e_hd.jpg" data-rawwidth="419" data-rawheight="240" class="content_image" width="419"> 图一,一元线性回归示例

    上图是多元线性回归回归的一个特例,即一元线性回归。多元就是在一元的基础上,用更多的自变量对因变量进行解释。我们以一元为例,来看常数项和随机误差的含义。从图中可以看出,常数项是拟合的一元回归直线在因变量(Y)轴上的截距;误差是实际的点和回归直线之间的差,而随机则表示的是这个误差不是固定的,有大有小,没有特定的规律,服从标准正态分布。具体来说,常数项表示的是未被自变量解释的且长期存在(非随机)的部分,即信息残留。而随机误差是在自变量解释空间内,预测值和去掉常数项的实际值的误差。下图是从一个多元线性回归模型的视角去看问题:因变量(Y)代表需要解释的全体信息,模型里的Xi构成的空间是自变量解释空间,随机误差存在于自变量解释空间中。在自变量解释空间外,如果还有恒定的信息残留,那么这部分信息构成常数项。

    <img src="https://pic1.zhimg.com/50/v2-68beb4a4bd82ac547341ae0d5f123009_hd.jpg" data-rawwidth="283" data-rawheight="285" class="content_image" width="283"> 图二,多元线性回归模型解释因变量示意图

    作者:徐惟能
    链接:https://www.zhihu.com/question/22450977/answer/21409955
    来源:知乎
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    一言以蔽之,在计量经济学的线性回归模型中,常数项在很多情况下并无实际的解释意义。

    要论含义,常数项的数学含义是,平均来讲,当所有解释变量的值为0的时候,被解释变量的值是几?但是在计量经济学的实证模型中,这通常是无意义的,原因很简单,因为在很多时候,解释变量的定义域并不一定包括0,比如人的身高、体重等等。可是,即便所有的解释变量都可以同时取0,常数项依然是基本无意义的。我们回到线性回归的本质上来讲的话,所有参数的确定都为了一个目的:让残差项的均值为0,而且残差项的平方和最小。所以,想象一下,当其他的参数都确定了以后,常数项的变化在图像上表现出来的就是拟合曲线的上下整体浮动,当曲线浮动到某一位置,使得在该位置上,残差项的均值为0,曲线与y轴所确定的截距即为常数项。因此,可以理解为常数项是对其他各个解释变量所留下的偏误(bias)的线性修正。但是要说常数项具体的值所代表的解释意义,在通常情况下是无意义的。

    写到这里,有人可能会问,既然无意义,我们何不去掉常数项?答案是否定的,原因是,如果去除了常数项,就等于强制认定当所有解释变量为0时,被解释变量为0。如果这个断定不符合实际意义,而你执意去除常数项的话,你的线性估计将是有偏的。

    随机误差项的理解相对简单,在线性回归模型中,每一个观测值都有一个残差项,也叫随机误差项,它刻画的是模型的估计值和真实观测值之间的偏差。

    说实在的,区别不太大,而且有的时候去掉常数项各变量t值会有上升。
    平狄克的「econometrics」书中提到过「可以将常数项看作是值恒为1的一个虚拟变量的系数」(上述原话为英文,但是是这个意思)也就是说,它可能包含了一些你忽视掉的虚拟变量。
    而且带常数项的模型其实是对随机误差项的优化,我们在做OLS时总是假定随机误差项是标准正态分布的,但这很难满足。假设随机误差项的均值不是0,而是一个常数,那么加入常数项的模型就会使得随机误差项又变成了标准正态分布,它的期望就被含在常数项里了。总而言之,这样的模型更为靠谱。


    作者:邹日佳
    链接:https://www.zhihu.com/question/19664505/answer/12629408
    来源:知乎
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    展开全文
  • 记得有一个笑话,法国课改后,...例如,Planck为了凑实验数据而猜出来的黑体辐射公式 含有指数,其中 是频率, , 是热力学温度, , 是Boltzmann常数,一个带量纲 的常数。为了使 是无量纲量,必须让 的量纲是 。

    075807b82d896d610cb187e0316ad78f.png

    记得有一个笑话,法国课改后,大人问一年级小朋友,1+2等于几呀?小朋友回答,不知道,但是1+2=2+1,因为加法是个阿贝尔群。当然这回答不错。如果问,一个苹果加两个梨等于几?那么你必须像小朋友那样回答,等于两个梨加一个苹果;而不能回答“三个水果”,那样就失去了关于水果种类的一切信息,进而等式“一个苹果加两个梨等于三个水果”从右到左是不成立的。如果把所有苹果的集合当作线性空间的一个子空间,而把所有梨当作线性空间的另一个子空间,这个问题的答案就呼之欲出了:你当然不能把线性空间的两个独立分量直接数值相加。

    在生活中我们常会用到一些单位来描述物理量:长度,质量,时间,力,功率,能量,压强……我们怎么确定,哪些物理量是最基本的呢?比如说,力,牛顿第二定律指出,一个质点所受合力等于它的质量乘上加速度,而质量的单位是千克,加速度的单位是米每二次方秒,从而力的单位是千克米每二次方秒。经典力学中的所有结论都是从牛顿定律导出来的,而牛顿定律中出现的物理量只有长度,质量和时间,从而我们可以说,经典力学中的一切物理量的单位,都可以用米,千克,秒这三者来描述。

    1960年,第十一届国际计量大会公布了国际单位制(SI, Système international d'unités),确立了六个基本物理量:长度、质量、时间、电流强度、热力学温度、发光强度,分别对应六个标准单位:metre(m,米)、kilogram(kg,千克)、second(s,秒)、Ampère(A,安培)、Kelvin(K,开尔文)、candela(cd,坎德拉)。1971年又新增一个基本物理量:物质的量,单位是mole(mol,摩尔)。一切已知的物理量的单位都是这七个标准单位的组合。这七个最基本物理量,就像是苹果、梨、香蕉、桃子一样,虽然他们都是水果,但却是完全不相干的水果。

    现在,我们把长度、质量、时间、电流强度、热力学温度、物质的量、发光强度分别简记作

    ,把他们当作线性空间的一组基,而任意物理量的量纲就是这组基的线性组合。我们把物理量
    的量纲记作
    。下面用几个简单的例子来具体说明。
    例1
    速度的单位是
    ,那么它的量纲是

    力的单位是
    ,其中
    指Newton(牛顿)。它的量纲是

    功的单位是Joule(
    , 焦耳),由定义
    ,它的单位是
    ,量纲是

    电阻的单位是Ohm(
    , 欧姆),由欧姆定律的推论
    ,得电阻的单位是
    ,量纲是

    弧度的单位是
    ,由定义,一个角度所对应的圆弧长就是它的弧度,即
    ,其中
    是圆的半径,
    是在圆这个光滑流形上作线积分。从而弧度的单位应该是
    ,即它的量纲是

    我们把物理量的量纲

    所对应的向量
    称为物理量的量纲向量。把弧度这样量纲向量是零的物理量称作是无量纲的。当物理量的单位成倍变化时,物理量的数值也相应变化。若测量单位分别变化至
    倍时,物理量的值相应变化至
    倍。例如,密度定义是
    ,标准的单位是千克每立方米
    ,量纲是
    ;若把单位变成克每立方厘米
    ,由于
    ,那么

    一个物理量

    对另一个物理量
    的导数
    的量纲向量,应该是
    的量纲向量减
    的量纲向量。这可以从导数的定义看出来
    :由于
    的量纲相同,所以二者可以相减;而
    的量纲和
    的量纲相同,并且
    应该和
    的量纲相同。例如,速度的量纲是
    ,时间的量纲是
    ,那么加速度
    的量纲就是

    我们说两个物理量是独立的,若它们对应的量纲向量是线性无关的。

    例2
    速度、加速度和力是独立物理量。因为在
    下速度的量纲向量
    ,加速度的量纲向量
    和力的量纲向量
    是线性无关的。

    既然速度、加速度和力的量纲向量是线性无关的,那么其他所有经典力学的物理量的单位都可以用这三者的组合来表示。

    公理 若有两个相同量纲的物理量

    ,此二者仅依赖于一组有限数量的基本物理量,并且这组物理量仅是一个量纲下的(即
    都只有长度量纲,或者都只有时间量纲,等等),那么当这量纲的单位的大小变化
    倍时,比值
    不变。

    这是量纲理论的基本假设。让我们来举一个例说明它。

    例3
    三角形的面积是三条边长的函数。当长度的单位大小变化时,面积的数值变化,但两个三角形的面积的比值显然还是不变的。

    这假设说明比值

    仅是变化倍数
    的函数。因此可把比值记作

    命题

    代入定义就可验证上式。在这恒等式两边对

    求导,然后令
    ,得
    ,易验证初始条件
    成立。由于
    是方程的通解,代入初始条件就得解
    例4
    对一个直角三角形的面积
    ,其中
    是垂直的两边,有
    。若把标准单位
    变成
    ,那么

    我们可以对多组变量的函数

    作类似操作,其中每组变量
    是同类型物理量(可以是长度,质量,力,功,...),当然这些同类型物理量不是独立物理量,但不同的组
    相互都是独立物理量。那么,我们可以推出
    。这里的
    就是前面的量纲向量,但它不一定是长度量纲向量、时间量纲向量等的组合,而可以是速度、加速度或力量纲向量等的组合。称
    是量纲函数。假设
    就是上述
    的极大独立物理量组,那么显然
    是无量纲的。注意前面的
    的上标表示组别,而
    定义中的
    表示幂次。

    现在考察一般的形式

    ,其中
    都是物理量,但只有前面
    个在量纲意义下独立。记第
    个自变量
    的量纲为
    ,那么有
    。若令
    ,那么得到
    ,其中

    定理(Buckingham) 依赖于前

    个独立物理量的
    满足

    这个结论是所谓的

    定理。把
    的定义代入式中就得到
    例5
    质量为
    的质点在有心力
    作用下做轨道半径为
    的圆周运动。这个运动的一切信息都包含在这三个变量里,从而我们可以写运动周期
    是质量、有心力、轨道半径的函数
    。在
    下,周期的单位是
    ,量纲是
    ,量纲向量是
    。而质量的量纲向量是
    ,有心力的量纲向量是
    ,轨道半径的量纲向量是
    。易验证它们是线性无关的,从而可以把周期的量纲向量表示成这三个向量的线性组合,即
    ,那么根据
    定理的推论,立刻能得到
    。只要再做一次实验,确定常数
    就得到完整的关系式。当然,从牛顿第二定律
    出发就可求得

    当年牛顿发现,两个天体之间的引力大小与二者的质量之积成正比,并且还和
    负相关,即
    。引入一个常数
    ,记
    。设有质量
    的天体围绕固定的质量
    的天体做圆周运动,那么周期平方
    。在此之上,结合1618年开普勒根据大量观测数据发现的定律,天体圆周运动周期的平方比上轨道半径的立方是常数,那么得

    需要注意的是,一般对数和指数函数等函数只能把无量纲量作为自变量。因为把这样的函数进行幂级数展开,会得到包含不同幂次的项。例如,Planck为了凑实验数据而猜出来的黑体辐射公式

    含有指数项,其中
    是频率,
    是热力学温度,
    是Boltzmann常数,一个带量纲
    的常数。为了使
    是无量纲量,必须让
    的量纲是
    展开全文
  • 地址常数

    2021-07-09 01:01:23
    地址常数是一个宏汇编程程序表述式,地址常数用来表示指示字数据,地址常数通常分为A型常数、V型常数、Y型常数和S型常数四类。[1]中文名地址常数外文名address constant拼音dì zhǐ cháng shù定义一个宏汇编程...
  • 数据结构-矩阵-三角矩阵(Java语言)

    千次阅读 2020-02-03 21:53:27
    详细的代码可见github: ... 三角矩阵是方形矩阵的一种,因其非零系数的排列呈三角形状而得名。三角矩阵分上三角矩阵和下三角矩阵两种。上三角矩阵的对角线左下方的系数全部为零,下三角矩阵的对角线右上方的系数全部...
  • 通信原理包络是什么意思_通信原理复试问题准备

    千次阅读 多人点赞 2020-10-20 16:55:25
    什么是数字信号和模拟信号?二者的区别是什么?数字信号是信号参量的取值是离散的,模拟信号是信号参量的取值是连续的。区别是信号参量的取值是连续还是离散。3. 什么是数字通信?描述数字通信系统的主要优缺点?...
  • 常数项,表示自变量取值均为 0 时因变量的 平均水平,即回归直线在 y 轴上的截距(多数情况下没有实际意义,研究者也不用关心) § b :回归系数,在 多变量回归(多个自变量的回归)中也称偏回归系数 。自变量...
  • f ( x ) = a f(x)=a f ( x ) = a ≠ 0 0 0 为 0 0 0 次多项式 0 ...,只剩常数项) ...常数多项式里,如果连常数项也是 0 0 0 就又是一种特例,叫做[零多项式] 其他的就叫做[零次多项式]
  • 自然,我们也肯定想要分子的最低次数和分母的相同,以便我们可以在趋近0时可以约去,以得到一个常数(带一个无穷小量),极限就这样可以得出。也就是说,我们展开后的目标是这样的: 二.确定展开阶数 一般而言,大...
  • 可以这样理解:常数项为零时,ax1+bx2+cx3=0等价于ax1+bx2+cx3=0x 方程中每一都可以看成x的一次,所以叫齐次的这只是帮助理解的一种方式,不同地方齐次有不同含义 转载于:...
  • 括号内的另一部分必须与指数互为倒数,否则要想办法化成这种形式。变形完成之后,要保证指数部分仍然趋于∞。 当无法直接运用公式时,可以使用换元法,用另一个变量来表示原式。但要注意,新的变量趋向的值也可能...
  • 算法中的大O是什么意思

    千次阅读 2021-08-23 22:28:57
    O(n)这个大O表示的是最坏情况下的时间复杂度,就比如你举... 一般用大O表示算法复杂度只需要取次数最高的,而且去掉系数就OK了,不用每次都这么算的。 三重循环而且每重循环都执行n次的话直接O(n^3)就好了。 ...
  • 在你渐渐迷失在你的人生道路上的时候,千万不要因为走的太久,而忘记了我们为什么出发,做码农,也要清楚自己如何才能用有效的土地种植出 出色的产品,于是细节就需要把握一下。 如果你有兴趣可以关注一下公众号 ...
  • matlab中sqrt()是什么功能的函数?

    千次阅读 2021-04-18 06:44:55
    matlab常用函数- - 1、特殊变量与常数 ans 计算结果的变量名 computer 确定运行的计算机 eps 浮点相对精度 Inf 无穷大 I 虚数单位 inputname 输入参数名 NaN 非数 nargin 输入参数个数 nargout 输出参数的数目 pi ...
  • 相消的原理是什么

    千次阅读 2021-08-18 16:14:57
    那么这样的式子是什么意思呢? 就是说,如果我们要把一个分式,分解成两个分式进行加减运算,那么我们可以找到原分式分母的两因数即可进一步分解。 那么这样的式子是怎么来的呢? 我们先来看,分母互质的两个分数...
  • SPSS中 回归 B值为负数什么意思

    千次阅读 2021-01-14 03:47:12
    展开全部B值是指回归系数和截距(常数项),可以是负数(负相关时回归系数出现负值)。e5a48de588b63231313335323631343130323136353331333431366262SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能...
  • 升幂降幂是什么意思(升幂排列与降幂排列)2020-05-19 23:18:00共10个回答x的幂指的是x的指数,所以按x的降幂排序指的是在不改变原式的情况下,运用交换律,使算式按照x的指数由高到低排列.升幂排序只要反过来就可以了....
  • MYSQL中select的是详解

    千次阅读 2021-01-20 21:45:38
    例如:下面这个查询有两个输出列,前一个输出列对应一个非常简单的表达式(一个常数),而后一个输出列则对应着一个使用了多个算术运算符和两个函数调用的复杂表达式。 Select 17,format(sqrt(3*3+4*4),0)) 输出:17...
  • 算法时间复杂度-常数

    千次阅读 2014-02-26 21:20:03
    下面这个算法,也就是高斯算法,为什么时间复杂度不是O(3),而是O(1)。 int sum = 0,n = 100; /* 执行一次 */ sum = (1 + n) * n / 2; /* 执行一次 * ...根据我们推导大O阶的方法,第一步就是把常数项3改为1
  • 常数时间,意思就是无论n是什么值运算所花时间都一样。 线性时间则是说多大n就花多少时间。 多项式时间则意味着随着n增大,n每增加1所花的时间增长越来越多。对于n^2-3这样一个多项式时间来说,n=2的时候可能只要...
  • 黎曼猜想到底是什么意思

    千次阅读 多人点赞 2019-04-02 10:04:58
    整个式子的意思就是,通过修正调整之后,黎曼给出的素数计数函数  就完全等于  了。 5.1   函数与非平凡零点 要把   介绍清楚,先得引入一个   函数 : 为什么自变量用   ,不用   呢?...
  • 作者:东曦 ...来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明...至于百科引文下面为什么给了思路和推导过程,我想应该是后人根据某拉格朗日大佬的结论逆推出来的。下面讲讲思路和推导...
  • 2.7182818是什么意思

    千次阅读 2021-01-27 21:21:11
    展开全部自然对数的底数e台湾师大数学系二年级 赵国亨沧海桑田世事非 始终不变...在一家精神病院里,有个病患整天对着别人说,「我微分你我微分你」,也不知为什么,这些病患都有一点简单的微积分概念,总以为有一...
  • 时间常数

    千次阅读 2019-06-27 21:39:25
    对于一个包含多个电容、电感的网络,...对于复杂网络,时间常数法更加直观和方便。 现在考虑这样一个网络,输入为x,输出为y。网络包含N个抗性元件(电容C1,C2,C3……电感L1,L2,L3……)。则该网络传函为如下形式 ...
  • select从表中选取数据时需要使用select语句,也就是只从表中选出(select)必要数据的意思。通过(select)语句查询并选取出必要数据的过程称为匹配查询或或查询(query)。 1、基本列的查询: --查询一列或多列 ...
  • 什么是C语言函数

    万次阅读 2021-05-21 08:53:50
    什么是C语言函数int max(a,b)int a,b;{if (a>b) return a;else return b;}第一行说明max函数是一个整型函数,其返回的函数值是一个整数。形参为a,b。第二行说明a,b均为整型量。 a,b 的具体值是由主调函数在调用时...
  • 其中动量系数一般取(0,1),直观上理解就是要是当前梯度方向与前一步的梯度方向一样,那么就增加这一步的权值更新,要是不一样就减少更新。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 25,536
精华内容 10,214
热门标签
关键字:

常数项是什么意思