精华内容
下载资源
问答
  • 什么是外生变量和内生变量

    千次阅读 2020-05-19 21:03:50
    例如endog/exog被叫做因变量(dependent variable)/自变量(independent variable)、y/x、left hand side(LHS)/right hand side (RHS)、回归变数(regressand)/回归量(regressors)、outcome/design、响应变量/解释变量...

    python的计量经济学包statsmodels中使用endog和exog作为数据参数的变量名,即在估计问题中使用的观测变量。在不同的统计软件包或教科书中经常使用的其他名称,例如endog/exog被叫做因变量(dependent variable)/自变量(independent variable)、y/x、left hand side(LHS)/right hand side (RHS)、回归变数(regressand)/回归量(regressors)、outcome/design、响应变量/解释变量。

    endog/exog本身也就是内生变量/外生变量的意思。内生性指的是由系统内部因素引起的,外生反之。也就是说,内生变量指的是在计量模型中,由该模型解释或预测的变量。外生变量指的是在计量模型中,没有被该模型解释的变量(模型需要让外部设定这些变量)。

    在计量经济学和统计中,术语的定义更为正式,并根据模型使用不同的外生性定义(弱、强、严格)。在statsmodels中作为变量名的用法不能总是按照正式的意义来解释,但却试图遵循相同的原则。

    在最简单的形式中,模型将观察到的变量y与另一组变量x以某种线性或非线性形式联系起来:

    y = f(x, beta) + noise
    y = x * beta + noise

    然而,为了得到一个统计模型,我们需要对解释变量x和noise的属性做额外的假设。许多基本模型的一个标准假设是x与noise无关。在更一般的定义中,x外生意味着我们不必考虑x的解释变量是如何生成的——不管是design还是由一些潜在的随机分布生成。

    不过这不代表外生变量的性质不需要在模型中考虑。我们仍然需要注意一些基本统计假设。例如,在误差或噪声项随时间独立分布(或随时间不相关)的条件下,最小二乘法中的exog可以有滞后因变量。但是,如果误差项是自相关的,那么OLS就没有很好的统计特性。此时,正确的模型是ARMAX。statsmodel具有用于回归诊断的功能,以测试某些假设是否合理。

     

     

    展开全文
  • 基本概念:自变量和协变量

    万次阅读 2017-12-04 21:22:15
    协变量:在实验的设计中,协变量是一个独立变量(解释变量),不为实验者所操纵,但仍影响响应。同时,它指与因变量有线性相关并在探讨自变量与因变量关系时通过统计技术加以控制 的变量。常用的协变量包括因变量的前测...
    自变量是指研究者主动操纵,而引起因变量发生变化的因素或条件,因此自变量被看作是因变量的原因。
    协变量:在实验的设计中,协变量是一个独立变量(解释变量),不为实验者所操纵,但仍影响响应。同时,它指与因变量有线性相关并在探讨自变量与因变量关系时通过统计技术加以控制 的变量。常用的协变量包括因变量的前测分数、人口统计学指标以及与因变量明显不同的个人特征等。

    那协变量和控制变量有什么区别呢?
    协变量应该属于控制变量的一种。有些控制变量可以通过实验操作加以控制(如照明、室温等),也称为无关变量;而另一些控制变量由于受实验设计等因素的限制,只能借助统计技术来加以控制,即成了统计分析中的协变量,因而属于统计概念。
    ------------------------------------
    在用SPSS做处理时看到它让输因子,协变量。因子就是输自变量的地方!
    展开全文
  • 在谈及广义线性模型是什么之前,我想先...在线性回归中,往往我们会认为响应变量服从正态分布(且方差不变)、响应变量和解释变量之间服从线性关系,这时候我们使用线性回归才能得到好的效果,那么我们应该怎么理...

    在谈及广义线性模型是什么之前,我想先分析一下线性回归模型有什么限制。在这里先说明一点,以下分析的线性回归模型,是考虑了随机误差项的完整的线性回归模型。

    首先我想说明一下关于响应变量(y)的分布,以及响应变量和解释变量(x)之间的关系的区别。在线性回归中,往往我们会认为响应变量服从正态分布(且方差不变)、响应变量和解释变量之间服从线性关系,这时候我们使用线性回归才能得到好的效果,那么我们应该怎么理解这两者呢,首先来看一下图:

    这是一个很经典的线性分布的数据,可以看到随着x增大y也增大,而且两个的关系能够用一条直线近似表达,所以我们说x和y之间有线性关系。如果我们只看y的数据,也就是说把这个二维图降维到只有y轴:

    上图就相当于把最初的图的点投影到y轴上,这时候没有了x,反映的就是y的数据的分布状况。

    明白了什么是响应变量的分布之后,就开始正式讨论线性回归的局限性。首先,正如一开始说的,线性回归的响应变量需要服从正态分布,这是基于高斯-马尔可夫定理得到的:在线性回归模型中,如果误差满足零均值、同方差且互不相关,则回归系数的最佳线性无偏估计就是普通最小二乘法估计。或者简单来说,这时候使用最小二乘法的线性回归的估计效果最好。

    要说清楚这个结论,还是从头推导一次比较好。首先,我们还记得线性回归模型可以表达为:

    Yi=a0+a1Xi+eiY_i = a_0 + a_1 X_i + e_i

    a_0、a_1是非随机但不可观察的参数,X_i是非随机且可观察的一般变量,e_i是不可观察的随机变量,因此Yi是可观察的随机变量。对于一个把随机误差也考虑的完整的线性回归模型,模型的输出并不等于回归方程的输出,还需要加上随机误差项。响应变量因为考虑了随机误差而被看作随机变量。我们基于数据拟合一个线性回归模型,其实只是求出a_0、a_1这两个参数,主要是基于最小化损失函数(最小二乘法)得到的:

    Loss=(a0+a1XiYi)2Loss = \sum (a_0 + a_1 X_i - Y_i')^2

    其中,Y_i’是真实数据(观察数据),因为模型考虑了随机误差,所以这里可以假设,观察数据等于我们训练完成后的线性回归模型的输出,所以,当我们最小化了损失函数,我们就可以得到:

    Loss=((a0+a1Xi)(a0+a1Xi+ei))2Loss = \sum ((a_0 + a_1 X_i) - (a_0' + a_1' X_i + e_i))^2
    Loss=(ei)2Loss = \sum (e_i)^2

    以上的式子说明了,即使响应变量和解释变量确实服从线性关系,即使模型已经训练完成,因为随机误差的存在,损失函数也不可能等于0。在这里我们可以得到一个结论,对于一个训练完成的线性回归模型,它的损失函数和随机误差项是相关的。

    接下来我们再看另一个例子,现在我们基于数据做线性回归得到一个模型:

    在分位数回归中也提到这种数据分布,分布会随着x的增大越来越分散,也就是说方差变大,虽然基于线性回归的算法我们也依然可以得到一条回归直线,但不能说回归效果很好,因为它并没有反映出数据越来越分散的特征,所以我们才需要分位数回归。那么这种数据分布和随机误差项有什么联系呢,一开始提到随机误差项表征数据因随机误差无法完美落在回归曲线上,假如我们基于这个数据集和我们得到的线性模型,针对两个小范围的x的数据,画出随机误差项的分布,就可以得到:

    上图大概画出了两个范围的随机误差的分布状况(它们的均值都为0),可以看出,第一,随机误差的分布不是正态分布,第二,随机误差的分布的方差不是同一个数值。那么我们再回想一下,对于一开始提到的理想的数据分布,应该是数据对称地分布在回归曲线两侧,同时分散程度是接近的,这也就意味着,随机误差项服从正态分布,且独立同分布。

    经过上面的论述,我们就知道随机误差项服从正态分布时模型的效果最好,而因为响应变量的随机性主要受到随机误差的影响,所以可以认为响应变量也服从正态分布:

    yiN(a0+a1Xi,σ2)y_i \sim N(a_0 + a_1 X_i, \sigma^2)

    其中,期望等于回归函数的输出(假设随机误差的期望为0),方差等于随机误差的方差

    除此之外,我们还需要注意,在我们进行线性回归的时候,其实一开始就假设了解释变量和响应变量之间是服从线性关系的,假设他们之间不服从线性分布(以上图的数据分布为例),而我们依然采用线性回归,那么他们的残差就被模型认为是随机误差造成的,这也就导致了随机误差不服从正态分布。再回想一下,其实响应变量因为随机误差的存在才被认为是随机分布的,当随机误差不服从正态分布,响应变量也就不服从正态分布了。

    上面的结论也说明了,虽然响应变量的分布和响应变量解释变量之间的关系是两回事,但是它们之间是相互联系的。

    上面主要分析了线性回归要求响应变量服从正态分布才能有好的回归效果,这是第一个限制,第二个是要求响应变量和解释变量之间是线性关系,因为这两个限制条件,就导致了线性回归模型在有些情况下是不适用的,于是就有了我们的广义线性模型,它主要改进了线性回归的两个限制:不要求响应变量服从正态分布,以及响应变量和解释变量之间可以服从非线性关系。

    想浏览更多关于数学、机器学习、深度学习的内容,可浏览本人博客

    展开全文
  • 交互:用户操作->程序处理和响应操作->返回处理结果 js运行于js解释器\引擎 ->解释执行js的发展历程 1995 网景:领航者 –livescript sun java 1996 JavaScript1.1 –》ECMA–》ECMAScript

    1、什么是js?
    2、如何编写js?
    3、如何调试js?

    1、什么是js:专门编写网页交互的语言

    交互:用户操作->程序处理和响应操作->返回处理结果

    js运行于js解释器\引擎 ->解释执行

    js的发展历程

    1995 网景:领航者 –livescript
    sun java
    1996 JavaScript1.1 –》ECMA–》ECMAScript
    网景-JavaScript
    微软-JScript
    1999 W3C:DOM标准-专门操作网页的标准
    2004

    JavaScript=ES+DOM+BOM
    API:编程接口

    js能做什么:

    客户端数据计算
    表单输入验证
    浏览器事件触发和处理
    网页特殊效果
    服务器异步数据提交 Ajax

    2、如何编写js

    1、运行环境

    1、浏览器js引擎中
    浏览器包括两个引擎
    内容排版引擎
    脚本解释引擎
    2、独立安装的js解释器-node.js

    2、编写

    1、不需要网页直接在控制台中编写js
    Console:专门编写和测试js小程序的地方
    console控制台窗口
    .的
    log():控制台提供的一个功能
    接受一个字符串参数并在控制台输出
    注:大小写一定区分
    2、随网页一起编写
    1、在页面创建<script>标签
    2、在外部创建.js文件<script>引入
    3、任意元素事件属性中
    3、调试js
    bug:程序中出现的错误
    debuger:解决错误方法

    变量
    数据类型
    1、变量

    what:内存中存储一个数据的存储空间,并且起一个名字
    when:程序中每个数据都需要用变量保存,在使用变量执行
    why:让程序更加灵活
    how: 声明 赋值 取值
    声明:var 变量名;

    变量名命名规则:
    语义化
    驼峰式命名
    由数字、字母、下划线
    不能以数字开头
    不能使用保留字

    赋值:变量名 = 数据
    变量赋值 本质:新值替换旧值
    **注:任何运算都无法修改变量中的值
    只有赋值=才能改变**
    取值:使用变量名就相当于调用变量中的值

    特殊情况:
    1、仅声明 未赋值;
    2、未声明 取值
    ReferenceError:未定义找不到对象
    3、未声明 赋值

    var 声明
    声明提前:在执行代码之前会将所有的var声明提前,提前到当前作用域顶部,集中声明创建,再开始执行程序。
    赋值留在原地

    2.常量 :一旦创建并初始化后值不可改变的量

    const 常量名 = 常量值
    声明后必须赋值

    3.字面量:

    数据类型:内存中存储的不同数据的存储格式;

    2大类:

    1、原始数据类型:值直接保存在变量本地
    Number String Boolean undefined null
    Number:专门存储数字的数据类型
    String:专门存储字符串的数据类型
    Boolean:真|假
    undefined:undefined
    null:不指向任何地址
    2、引用数据类型:值不直接保存在变量本地

    Number:

    可以是整数,也可以是浮点数(小数)
    when:要参与算数计算或比较大小的数据
    10
    2 01101
    8 0,0o
    16 0x
    NAN:not a number
    Infinity
    所占空间
    64位2进制数字保存
    64bit
    8bit=1bytes
    舍入误差:计算机无法精确计算1/10导致的计算误差

    String:

    必须带引号
    所占空间:unicode
    字母 符号127 1字节
    汉字 2字节
    “hello老师”
    字符串一点创建 不可改变
    想改变只能用一个新字符串替代旧的字符串

    Boolean:表示2选一的时候
    undefined:变量未赋值的时候自动赋值
    null:

    数据类型转换
    运算符和表达式

    1、数据类型转换

    js是一门弱类型语言:
    1、js在声明变量的时候不需要规定变量的存储类型;
    2、赋值时,动态绝定变量数据类型;
    同一变量可先后保存不同数据类型
    3、js运算时,会根据需要自动转换数据类型

    大类:

    1、隐式转换:不需要程序员干预,js自动完成的类型转换
    无处不在
    仅讨论算数计算中隐试转换
    在算数计算中 一切数据都默认转换成数字在计算
    **注:在+运算过程中碰到字符串+变为字符串拼接
    另一个不是字符串的数据,都会被自动转成字符串**
    Boolean:
    true->1
    false->0
    **特殊情况:如果数据无法转换成数字类型
    会被转化成NAN
    参与任何计算结果永远是NAN**
    补:表达式:由数据、变量和运算符组成的公式
    默认从左往右 两两计算
    任何表达式都有一个运算结果
    所以任何表达式都可以当成一个值来用
    隐试转换仅影响表达式的运算结果,不会影响变量中存储实际值
    2、强制转换:程序员主动调用专门的函数(方法)执行转换
    when:隐试转换后的结果不是我们想要的结果时
    任意–>String:
    1、X.toString();
    除null和undefined以外任意对象都有toString();
    2、String(X);隐式转换原型
    任意–>Number:
    1、Number(X);隐式转换原型
    专用于将非字符串类型转数字
    如果想转字符串要求必须是由纯数字组成的字符串
    2、字符串转数字
    parseInt(str)
    从第一个字符开始依次读取每个字符
    只要碰到一个非数字字符就停止
    自动忽略开头的空格
    转整数
    parseFloat(str)
    找第一个小数点
    转浮点数
    Number(X) VS parseInt(str)/parseFloat(str)
    true
    “12px”
    任意–>Boolean
    Boolean()隐式转换原型
    5值转Boolean是false
    “” NAN undefined null 0

    这里写图片描述

    2、运算符和表达式:
    程序:让计算机按照人的想法去执行任务
    运算符:程序中模拟人思维运算或判断的符号
    表达式:由变量、数据和运算符组成的公式

    1、算数运算符:+ - * / % ++ –
    %取余(模运算)
    ++n:表达式返回n自增以后的新值
    n++:表达式返回n自增以后的旧值
    2、关系运算:将两个值作比较 true false
    < >= <= == === !=
    在关系运算中默认将所有类型都转换成数字
    特殊情况:如果参与比较的两个值都是字符串
    依次取出每个字符串的字符PK unicode
    **NaN:不等于 不大于 不小于任何值(包括自己)
    isNaN(num)专门用来判断 num是不是NaN**

    展开全文
  • javascript学习笔记(1) js文件的引入、变量的命名注释格式 一、javascript能用来干什么?– 1.数据的验证。– 2.将动态的内容写入到网页当中(ajax)。– 3.可以对事件做出响应。– 4.可以读写html中的内容。– 5...
  • 这篇文章解释了如何使用正则表达式提取器从第一个请求的响应中提取密钥,并将提取的密钥用于后续请求。我们称之为JMeter Extract并重复使用。 现在您可以使用其他提取器,JSON提取器Xpath提取器。我们已将此添加...
  • 谨慎使用全局变量

    2019-07-02 10:54:00
    背景 之所以写这篇文章,是因为有同事使用全局变量不当导致了bug。所以在解释标题之前,首先说一下业务背景。 很简单,就是有一个页面可以办理...其中接口3的请求参数依赖接口1接口2的响应参数,接口1接口2...
  • 广义加性模型(GAM)

    千次阅读 2019-11-03 16:13:00
    之前介绍过线性模型和广义线性模型,线性模型的意思就是响应变量和解释变量之间服从线性关系,广义线性模型就是指如果能通过一些变换,让原本不服从线性关系的响应变量解释变量,转换成线性关系,那么他们之间就是...
  • 广义线性模型

    千次阅读 2019-09-21 20:16:10
    之前提到过,线性回归模型有三个限制:响应变量服从正态分布,响应变量和解释变量之间服从线性关系,方差不变。 其实在构建一个线性模型的时候,除了上述的两个要求,我们还需要对解释变量进行具体的分析,主要有几...
  • 线性回归是一种统计方法,用于对响应变量和解释变量之间的线性关系进行建模。回归函数描述了给定解释变量的响应变量的期望值,并通过线性函数进行建模。在本文中,我们将回顾线性回归背后的理论,以及如何使用python...
  • 线性回归是一种统计方法,用于对响应变量和解释变量之间的线性关系进行建模。回归函数描述了给定解释变量的响应变量的期望值,并通过线性函数进行建模。在本文中,我们将回顾线性回归背后的理论,以及如何使用python...
  • 【填空题】注释是对PHP代码的解释和说明,PHP解释器将忽略备注中的所有文本,( )是以“//”开始,所在行结束时结束。【简答题】什么是中断响应?【单选题】选项( )不能描述测量系统动态特性的特征【简答题】进程PCB通常...
  • 1、解释什么是JMeter?JMeter是一款Java开源工具,用于性能负载测试。它旨在分析和衡量Web应用程序和各种服务的性能和负载功能行为。2、说明JMeter的工作原理?...变量和函数可以写入任何测试组...
  • 简单线性回归围绕一个响应变量和解释变量的某个特征之间的关系进行建模。 讨论问题: “如何对模型进行拟合” 虽然简单的线性回归对于现实世界的问题几乎不具有可用性,但是理解简单线性回归是理解许多其他模型的...
  • 线性回归模型尽管是最简单的模型,但它却有不少假设前提,其中最重要的一条就是响应变量和解释变量之间的确存在着线性关系,否则建立线性模型就是白搭。然而现实中的数据往往线性关系比较弱,甚至本来就不存在着线性...
  • 这一章主要介绍因变量为0-1变量时的情况,主要介绍三种定性响应回归模型,并且对probitlogit模型的估计检验给出更深的解释
  • 原文链接:http://tecdat.cn/?p=9384​tecdat.cn目录模型与数据估算值预测误差脉冲响应识别问题正交脉冲响应结构脉冲反应广义脉冲响应...这篇文章介绍了VAR文献中常用的脉冲响应函数的概念和解释。模型与数据为了说...
  • 回归模型是用于估计解释变量和响应变量之间关系的强大分析工具。 传统上,通常假定精确地观察数据并用清晰的值来表征数据。 但是,在许多情况下,这些数据是以不精确的方式收集的,并根据不确定的变量进行表征。 ...
  • 最小二乘法回归是通过预测变量的加权和来预测量化的因变量,其中权重是通过数据估计而得的参数,目标是通过减少响应变量的真实值与预测值的差值来获得模型参数(截距项斜率),具体而言,即使得残差平方最小。...
  • 最小二乘法回归是通过预测变量的加权和来预测量化的因变量,其中权重是通过数据估计而得的参数,目标是通过减少响应变量的真实值与预测值的差值来获得模型参数(截距项斜率),具体而言,即使得残差平方最小。...
  • R之相关性的显著性检验

    万次阅读 多人点赞 2017-12-26 19:26:01
    p 值可以解释如下:一个很小的p 值表示,在预测变量和响应变量之间的真实关系 未知的情况下,不太可能完全由于偶然而观察到预测变量和响应变量之间的强相关。因此,如果看到一个很小的p 值,就可以推断预测变量和...
  • 线性回归

    2017-10-26 21:21:45
    一、一元线性回归:一个响应变量和一个解释变量的一元问题。 一、一元线性回归:一个响应变量和一个解释变量的一元问题。 1.分析匹萨的直径与价格的数据的线性关系,数据如下
  • 响应数据绑定 整个小程序框架系统分为两部分:逻辑层(App Service) 视图层(View)。 WXML中写: {{}},双大括号括起来的是变量。 button按钮绑定了一个触发事件。 JS中写: 此部分可以在官方的文档中查看。...
  • Vuex概念及作用解释

    2020-10-03 17:16:29
    一、Vuex是什么? vuex是一个专门为vue.js应用程序开发的状态管理模式。 简单来说,可以把vuex看成...这些状态信息,我们可以统一放在一个地方,对它进行保存管理,而且他们还是响应式的。 注:在创建vuecil时若没有
  • 读书笔记_第八章

    千次阅读 2019-02-01 14:54:47
    #回归分析是统计学的核心 y~x,用x预测y,用解释变量来预测响应变量 #有效的回归分析本就是一个交互的,整体的,多步骤的过程,而不仅仅是一点技巧 #x:一个或多个预测变量(自变量或解释变量) #y:响应变量,因变量...
  • Weighted total traffic 根据权重按照请求和响应字节大小进行分配  Least current request 优先转发给那个当前处理最少请求的服务器  Least response time 优先转发给那个当前响应最快的服务器 Server variable ...
  • 推断关心的是预测变量和响应变量之间的具体关系,更加注重模型的可解释性 怎么建模?怎么估计XY之间的关系? 根据模型训练过程中训练集是否有有的标识相应变量(因变量),可分监督学习和无监督学习 根据是否对...
  • 多元线性回归模型及stata实现:总论

    千次阅读 2020-06-30 20:49:53
    Y: Dependent variable(因变量、应变量、反应变量、响应变量、被解释变量等) X1、X2⋯Xn:Independent variable(自变量、解释变量、控制变量) 如果重点探究一个因素与另一个因素的作用时,纳入模型的其他X通常...
  • 机器学习的输入称为解释变量,输出称为响应变量 组成监督学习经验的实例集合称为训练集,衡量程序性能的实例集合称为测试集 常见的监督机器学习有分类回归 分类的响应变量为离散值,回归的响应变量为连续值 降维:...
  • 它的解释参见源码里尤雨溪的注释。</em></p> 那好,现在就进入到拿当前的data对象去new Observer(value),现在你可能会疑惑,递归遍历的过程不是应该是纯命令式的、面向过程的吗?怎么代码...

空空如也

空空如也

1 2 3 4 5 ... 11
收藏数 214
精华内容 85
关键字:

响应变量和解释变量