精华内容
下载资源
问答
  • 统计学--变量、数据、抽样
    2019-10-19 22:24:55
    1. 变量值是变量的取值
    2. 变量的类型
      1.1 分类变量
      1.2 顺序变量
      1.3 数值型变量
      另,根据其取值不同又可分为:离散型变量、连续型变量
    3. 数据处理:将数据用图表等形式展现出来;
      数据分析:选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论,具体方法有描述统计和推断统计。
    4. 推断统计:
      如何利用样本数据来推断总体特征的统计方法。
    截面数据时间序列数据
    1. 统计量,根据样本数据计算得出,是样本的函数。
    2. 分类数据和顺序数据,一般是由文字来表述,又被称为定性数据和品质数据。
    3. 变量分类:
      分类变量、顺序变量、数值型变量。

    数据的来源:

    1. 间接来源—二手数据
      二手数据优点:搜集容易,采集成本低,并且能很快得到。
      局限性:相关性不够、口径可能不一致、数据也许不准确、也许过时。
    2. 直接来源:
      调查数据、实验数据

    二、调查数据

    1. 概率抽样:每一个单位都有一定机会(已知的,可计算的非零概率)被抽到,可以以相等(等概率抽样)也可以不相等(不等概率抽样)。
      特点:随机原则抽取样本;
      概率抽样可以依据调查结果,计算估计量误差,从而得到对总体目标量进行估计的可靠程度。也可以按照要求的精确度,计算出必要的样本数目。
    2. 概率抽样的方式:
      2.1. 简单随机抽样:
      从抽样框(抽样框包含所有总体单位的信息,作用:提供备选单位以供抽选,计算相应的概率)中进行;
      从总体中的N个单位一个一个地抽取,每个单位都是相等的,是一种等概率抽样;
      是一种最基本的抽样方式,是抽样方式的基础;
      特点:简单直观,在抽样框完整的时候,可以直接抽取样本,由于抽选的概率相同,用样本统计量对目标量进行估计及计算估计量误差都比较方便
      局限性:当N很大时,抽样框不宜选取;抽出的单位很分散;没有利用辅助信息提高估计的效率。
      2.2 分层抽样
      先划分不同层,然后从各层中抽取。
      保证了样本与总体结构相近。
      2.3 整群抽样
      分组(把这样的组称为群),然后直接抽群,对群中的所有的单位实施调查。
      优点:简化了编制抽样框的工作量,较为简便。
      缺点:估计精度比较差。
      2.4 系统抽样
      对总体中的所有单位进行排序,选取初始单位,按照一定的规则确定其他样本。
      2.5 多阶段抽样
      类似整群抽样,区别是从抽出的群里进行再次抽样,依次推广,即为多阶段抽样。
      优点:样本相对集中,节约调查费用。
      在较大规模的抽样调查中,多阶段抽样经常使用
    3. 非概率抽样:
      特点:抽取样本不遵循随机原则,而是根据研究目的对数据的要求,采用某种方法进行抽样。有如下几种:
      3.1 方便抽样
      依据方便的原则,自行确定入选单位。
      容易实施,但不能将结果推广到总体当中。
      3.2 判断抽样
      根据以往经验,有目的的地选取样本,主观的。又可分为:重点抽样、典型抽样、代表抽样。
      3.3 自愿抽样
      3.4 滚雪球抽样
      先对稀少群体调查,之后再请他们提供另外的调查对象,持续下去。
      特点:适合对特定顶群体进行研究、搜取资料。
      3.5 配额抽样
      类似于概率抽样的分层抽样,先分层、再在各层中进行方便抽样、判断抽样等选取单位。
      搜集数据:
      自填式、电话式、面访式、观察式。
      实验数据:
      随机原则分配给实验组和对照组。
      匹配,情况相同的每队单位分别分配给实验组和对照组。
    更多相关内容
  • 统计学里的变量(Variable)

    万次阅读 2018-06-16 22:16:24
    统计学变量分为

    ※ 版权所有,转载请联系作者 ※

    从前在学习数学的时候,有例如2X+4Y=20的式子,在这个式子中,2和4是常量(Constant),X和Y是变量,顾名思义,X和Y是不确定的变化的量值。

    在数学中,上面这个式子,可能是三个串成一条直线的珠子a、b、c,b可以左右滑动在中间,a和c在两边固定,2X表示ab的距离,4Y表示bc的距离,ac的距离是20,于是如果X=2,Y=4;X=3,Y=3,X和Y不是确定的值。在物理学中变量可能是速度、时间、距离、温度等等;在医学中变量可能是药物的有效作用时间,药品的价格,患者的年龄等;在社会学中变量可能是工资、利润、成本、年龄等;在教育学中变量可能是学生的学习成绩、毅力、智力、情商、创造力等;在心理学中变量可能是心理疾病程度、领导力等。所以很多时候还用Xi 和Yi 来表示第i个变量X或Y的值。

    1. 变量的分类(Type of variable)

    总而言之,这些变量是一些数值,可以数数或者测量出来,所以这些变量是量化的定量变量(或数值变量,quantitative or numeric variable)但是还有一些如性别、民族、肤色、喜欢与否、喜欢程度等进行分类的定性的变量(或分类变量/属性变量,qualitative, categorical or attribute variable),比如男和女,汉族、蒙古族等,白色肤色、黄色肤色、黑色肤色等。

    变量的概念在统计学里,变量也就是就是一种可以进行测量的数据条目(data item),对于变量的定义在统计学里非常重要,尤其是在进行SPSS分析的时候,需要明确定义一个变量的性质,否则将会引起歧义。其实当你打开SPSS软件时,数据录入界面上面就显示的全部是变量,如图黄色高亮的部分就是变量:

    就在上面所举的例子里面,可以发现,年龄是可以数的,民族和性别是可以分类的,温度是可以测量的,工资是可以计算的。也就是说这么多的变量也是各有不同的。像可以对数量多少(how many or how much)进行测量的称为定量变量,进行分类的称为定性变量。对于定量变量的数值进行加减求平均的计算是有意义的,但是对于定量变量进行加减求平均其实是没有意义的,如汉族乘以蒙古族并不能得出什么,白色肤色减去黄色肤色也不能得出什么。


    (1)在定性变量,存在着一些规律,如例子:性别、种族、肤色、血型、颜色这种类型的变量的信息之间没有等级区分,如并不能说性别男大于女,也不能给种族拍个优先顺序,所以这些变量是无序的,只作为分类,因此只给不同的类型取一个名字,所以这类变量称为无序变量(unordered-qualitative variable)。因此总结一下,无序变量是没有顺序、没有等级划分,但是能够被分类(classified)和计数(counted)的一种变量
    与命名变量对比的就是有序变量(ordered-qualitative bariable),这类变量可以进行等级划分,进行排序比较,比如喜欢的程度可以分为高中低,高中的年级可以是高一、高二、高三,学历可以分为小学、中学、高中、大学、研究生等。但是却不能知道每个等级之间具体相差的是多少,比如好与更好之间的差。这也是定性变量的一个性质。

    (2)在定量变量中也存在着一些规律,有些变量是离散的不能够连续的,称为离散变量(或非连续性变量,discrete or uncontinuous variable),这这类型的变量只能取到的是某些特定的值,而且这些值之间存在着一些“间隔/间隙”。比如,休假的日期只可以是4天、5天、7天等,一天每小时到达北京火车站的火车的数量等。

    不过,有些变量是连续变量(continuous variable,是在给定的范围内,可以取到任何的数值的变量,其实也就是可以有小数点的变量,离散变量中,不能说每小时到达2.3个火车,但是比如体重可以是50.3kg,每小时到达火车的数量只可能是2个或者三个,这是离散变量,但是体重可能是50.3kg,也可能是50.33kg,这个体重就是一个连续变量。连续变量通常四舍五入取小数点后三位。

    2. 变量的测量尺度(Measure of variable)

    在介绍变量的测量尺度之前,先简单的介绍一下测量(measurement)。测量就是将数分配给一个对象(object)或者事件(event)的特征(characteristic),这样可以使其与其他对象或特征进行比较。也就是用数值对事物或其特征进行比较。尺度(scale)就是为了测量而建立的准则。

    在统计学中,变量的测量尺度分有以下四个。

    (1)定类尺度/明目尺度(nominal scale)

    定类尺度是根据事物的特点对其进行分类的一种尺度,赋予定类尺度的数值只是为了区分种类,没有顺序大小而言,如在SPSS中可以将性别分为男女,男赋值1,女赋值2,虽然2>1,但并不代表女>男。同时在这里数值1与2也不可以相加,因为男+女并没有任何的意义。因此定类尺度并不能够进行数学计算。这样的例子还有民族、血型、颜色、肤色、电话号码等。

    (2)顺序尺度/等级尺度(ordinal scale)

    顺序尺度是给事物区分等级的一种尺度,是一种分类(即包含定类尺度的特点)。比如喜欢的程度有喜欢、比较喜欢、非常喜欢,学历有小学、初中、高中、大学、研究生,年级有一、二、三等。赋予的数值也是为了区分其等级,如学历的小学是1、初中是2、高中是3、大学是4、研究生是5,但是却不能将其相加,因为不能说小学(1)+初中(2)就等于高中(3)。等级之间存在差别,但是具体差异的程度却不是明确的,比如喜欢的程度中喜欢是1、比较喜欢是2、非常喜欢是3,却不能说非常喜欢(3)减去比较喜欢(2)就是喜欢(1)。因此顺序尺度的数值也是不可以进行数学计算的。

    (3)间隔尺度/等距尺度(interval scale)

    间隔尺度是指事物的数值之间具有一定的间隔,这个间隔是等距的,因此也被成为是等距尺度。比如华氏温度(不是温度差)、时间(不是小时),这样的数据是连续的,同时没有实际意义的0点。因为0°C并不代表没有温度,00:00也不代表是没有的时间。不过1°C、2°C、3°C、4°C...的间隔都是1°C;时间也是比如1:00、2:00、3:00间隔是1个小时。间隔尺度的对象有顺序、可以进行比较,也就是具有定类尺度和顺序尺度的所有特点。比如3点比2点晚,同时晚了1个小时(3-2=1);2017年比2018年早,而且早一年(2018-2017=1)。这类尺度研究的事物只能对其间隔进行计算,也就是说只可进行加减计算,却不能进行乘除计算,比如1点*2点并没有什么意义,2018年/2017年也没有任何意义。

    (4)比例尺度/定比尺度(ratio scale)

    有这样一类数据,连续的,同时存在类别、顺序、可以比较大小、有差异、可以相加、可以计算比例、也可以相乘,而且0点具有实际的意义,比如收入(income),0就代表没有任何收入,一个公司部门4个员工的月收入是A:2000、B:5000、C:8000、D:10000,B比A的月收入多3000,C的月收入是A的4倍,D的月收入是B的2倍。这样的数据还有,绝对温度,利润等。


    3. SPSS软件

    在SPSS分析软件中,如下图所示,“Type”列是选择变量类型(Variable Type)的地方,右面“Measure”列选的是测量尺度(Measure scale)的地方,因为SPSS一般是对数值进行处理,因此一般变量的类型(Type)会选择“Numeric“【仅在于说明是一般情况】


    Data->Define variable propertities就可以进行更详细的编辑,同时能够更具体看到SPSS中是如何定义尺度的。





    参考文献:

    Lind, D. A., Marchal, M. G. & Wathen S. A. (2011). Statistical Techniques in Business & Economics (15th ed.). McGraw-Hill/Irwin. 

    성태제.(2011). 현재 기초통계학-이해와 적용(6판). 학지사.

    “Measurement,”n.d., para 1.

    展开全文
  • 统计学当中关于变量的分类

    万次阅读 2018-11-29 10:46:18
    统计学中的变量指的是研究对象的特征,我们有时也称为属性,例如人的身高、性别等。  每个变量都有变量的值和变量的类型。我们按照变量的类型对变量进行划分。  统计学中的变量(variables)大致可以分为数值...

     统计学中的变量指的是研究对象的特征,我们有时也称为属性,例如人的身高、性别等。

      每个变量都有变量的值和变量的类型。我们按照变量的类型对变量进行划分。

      统计学中的变量(variables)大致可以分为数值变量(numrical)和分类变量(categorical)。

      数值型变量是值可以取一些列的数,这些值对于 加法、减法、求平均值等操作是有意义的。而分类变量对于上述的操作是没有意义的。

      数值变量又可以分为下面两类:

      离散型变量(discrete):值只能用自然数或整数单位计算,其数值是间断的,相邻两个数值之间不再有其他数值,这种变量的取值一般使用计数方法取得。

      连续型变量(continuous):在一定区间内可以任意取值,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。如身高、绳子的长度等。 
      和离散型变量相比,连续型变量有“真零点”的概念,所以可以进行乘除操作。

      分类变量又可以分为下面两类:

      有序分类变量(ordinal):描述事物等级或顺序,变量值可以是数值型或字符型,可以进而比较优劣,如喜欢的程度:很喜欢、一般、不喜欢 。
      无序分类变量(nominal):取值之间没有顺序差别,仅做分类,又可分为二分类变量和多分类变量 二分类变量是指将全部数据分成两个类别,如男、女,对、错,阴、阳等,二分类变量是一种特殊的分类变量,有其特有的分析方法。 多分类变量是指两个以上类别,如血型分为A、B、AB、O。

      有序分类变量和无需分类变量的区别是:前者对于“比较”操作是有意义的,而后者对于“比较”操作是没有意义的。

     

      这四种数据的等级从低到高依次为:无序分类变量(nominal) <有序分类变量(ordinal)< 离散型数值变量(discrete)< 连续型数值变量(continuous)。

     下面的一张图描述了它们之间的关系:

                     

    展开全文
  • 最后给大家分享100G免费资料领取,包括python入门,数据分析,包括数据分析、统计学、数据挖掘、机器学习等知识。在公众号「python风控模型」里回复关键字:学习资料,就可免费领取。 python风控模型

    Somers’ Delta (Somers’ D) 是对有序变量对之间一致性的度量。

    在统计学中,**Somers’D**有时被错误地称为 Somer’D,它是对两个可能相关的随机变量X和Y之间的序数关联的度量。Somers 'D等于-1时,表示 所有变量对都不一致。Somers 'D等于1时表示所有变量对都一致时。Somers 'D以 Robert H. Somers 的名字命名,他于 1962 年提出了它。

    序数变量是有序的,例如从最好到最坏或从最小到最大(李克特量表(Likert scale )是比较流行的序数量表之一。)

    图片

    一致性度量告诉您两对变量是如何连接的。这种连通性是由一致性和不一致定义的。简而言之,一致对“匹配”而不一致对不匹配。

    Delta 可以从列联表中的行类别预测列类别。更具体地说,不对称* Somers’ D 测量因变量的预测改进的程度,基于了解自变量的值。因此,在运行此测试时定义哪个变量是自变量以及哪个变量是因变量非常重要:您将获得 (X,Y) 和 (Y,X) 的两个不同结果。举一个简单的例子,假设您想知道客户满意度(1 到 5 的等级)是否取决于您的销售人员的友好程度(1 到 3 的等级)。如果您切换自变量和因变量,您将衡量客户满意度对销售人员的友好程度的影响。这可能是有趣的信息,但这不是您感兴趣的关系。

    解释

    Delta 是Pearson 相关系数的序数替代。与 Pearson 的 R 一样,Somers 'D 的范围是 -1 到 1:

    -1 = 所有变量都不一致

    1 = 所有对都一致

    **Somers’ D 的大值(趋向于 -1 或 1)表明该模型具有良好的预测能力。较小的值(在任一方向上趋于零)表明该模型是一个较差的预测器。**假设您在友好的销售人员/客户满意度场景中的 Delta 为 0.549。客户满意度是因变量,因此可以说友好的销售人员将客户满意度提高了 54.9%。

    Somers 'D 随着列联表维度的增加而增加,但确实倾向于低估表中的实际关联程度(Göktaş & İşçi,2011)。

    正式定义

    Somers ’ D 有多种定义。一种方法是“一致对的数量与不一致对的数量之差除以与自变量无关的对的总数”(牛津指数)。这个定义让您了解计算的复杂程度;找到一致/不一致的对不是一项快速的任务。此外,Delta 的具体公式取决于自变量的位置(Göktaş & İşçi,2011)。这就是通常使用软件来查找 Delta 的原因之一。

    Somers ’ D 有时也用Kendall 的 Tau定义:

    D(Y |X) = τ (X,Y)/ τ (X,X)

    在哪里:

    • (X,Y) 是一对二元随机变量。

    • τ 是 Kendall 的 Tau。

    或者,如果一个 X 大于另一个,则可以将其定义为两个对应条件概率之间的差值。Delta 和 Tau-b 之间的区别仅在于 Delta 校正了自变量上的并列对:

    Somers’ D 与 Gamma

    Somers 'D 和 Goodman 以及Kruskal 的 gamma 都可以找到两个有序变量之间的关联。与 Goodman 和 Kruskal 的 gamma 不同,Somers 'D 区分自变量和因变量。两者之间的区别可能是模糊的,但如果您知道您的数据和分析的目标(即,如果将一个变量标记为相关变量很重要),则应该清楚使用这两个过程中的哪一个。

    存在两个版本的 Delta:不对称和对称。非对称版本是迄今为止最受欢迎的版本,也是您在使用软件(例如SPSS)时可能会遇到的版本。当您阅读“Somers’ D”时,您可能正在阅读非对称版本(尽管很多作者并未阐明这一点)。对称版本——其中两个变量都被忽略为独立或相关——确实存在,因此在解释结果之前澄清你使用的是哪个是明智的。

    Somers’ D计算举例

    假设独立(预测变量)变量X取三个值,0.25 ,0.5 , 或0.75,独立(结果)变量Y取两个值,0或1 . 下表包含观察到的X和Y组合:

    ( Y , X对的 频率)

    图片

    图片

    因此, Somers '_D_等于

    图片

    按照之前定义,Somers’ D 的大值(趋向于 -1 或 1)表明该模型具有良好的预测能力。较小的值(在任一方向上趋于零)表明该模型是一个较差的预测器。该Somers 'D等于0.34,表示模型预测能力较差。

    版权声明:文章来自公众号(python风控模型),未经许可,不得抄袭。遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

    欢迎学习csdn学院更多金融风控相关知识《python金融风控评分卡模型和数据分析》
    在这里插入图片描述

    展开全文
  • 统计学基本概念的梳理,其中普通字体为贾俊平著《统计学(第六版)》中的重要概念,引用字体的内容为书中没有但相关的概念。 《统计学(第六版)》贾俊平 第1章 导论 统计学 statistics 统计学是收集、处理、分析、...
  • [统计学笔记一] 统计学的基本概念
  • 只能归于某一有序类别的非数字型数据,顺序数字虽然是有类别的,但是这些类别都是有序的。 如产品分为一等品、二等品、三等品、次品;考试成绩分为满分、优秀、及格、不及格。 1.1.3 数值型数据 是按数字尺度测量...
  • 统计学基础性概念有关笔记

    千次阅读 2020-03-29 18:16:51
    统计学笔记
  • 本材料对《医学统计学与SPSS软件应用》一书中的例题使用SPSS20简体中文版进行计算。用图示方式介绍各种过程的使用方法、变量设置及结果...其章节均按原著顺序编排,对各种统计方法的统计学意义未做详细介绍请参见原作。
  •  ----> 从变量大/小 向变量小/大一方进行累加 分别成为 向下/上累积  通过累积频数 可以看出某一类别以下/上的数值之间的频数之和      2.累积频率: 将各有序类别或组的百分比逐级累加起来得到的频数 也...
  • 统计学中的相关关系和三大相关系数 相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量。 由于研究对象的不同,相关系数有如下几种定义方式。 简单相关系数:又叫相关系数或线性相关系数,...
  • 统计学课后思考

    2021-01-13 05:23:22
    1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。...
  • 6.2 统计学分析方法

    千次阅读 2021-03-24 10:06:59
    统计学分析方法1 多变量分析方法的选择1.1 有因变量1.1.1 回归预测模型1.1.2 分类预测模型1.2 无因变量1.3 其他分析 1 多变量分析方法的选择 1.1 有因变量 建立有监督模型 有监督模型有两大通用目的: 分析哪些自...
  • statistic 统计量 variable 变量 categorical variable 分类变量 rank variable 顺序变量 metric variable 数值型变量 continuous variable 连续型变量 第2章 数据的搜集 probability sampling 概率抽样 non-...
  • 1.统计学含义 统计学,是一门关于数据收集、处理、分析、解释,并从数据中得出结论的科学。 数据收集:取得数据 数据处理:用图形等形式展示数据 数据分析:利用统计方法分析数据,并从数据中提取有用信息得出结论 ...
  • 统计学笔记1

    千次阅读 2021-12-05 08:10:27
    统计学 所研究的主要是随机变量。 数据的计量尺度 根据对研究对象计量的不同精确程度,人们将计量尺 度由低到高、由粗略到精确分为四个层次:定类尺度 、 定序尺度、定距尺度和定比尺度。 (1)定类尺度是按照客观现象...
  • 统计学中三大相关系数

    千次阅读 2020-08-16 16:36:11
    反应的都是两个变量之间变化趋势的方向以及程度,其值范围为-1到+1,0表示两个变量不相关,正值表示正相关,负值表示负相关,值越大表示相关性越强。 1.Pearson 两个变量(X, Y)的皮尔森相关性系数(ρX,Y)等于它们...
  • 变量及资料类型

    千次阅读 2020-03-03 20:07:13
    变量及资料类型 变量的类型决定资料的类型 一份统计资料中可能包括所有的变量类型 变量类型 变量变量值的性质分为不同类型: 类型 取值 举例 名义型变量 不连续数值 性别、种族、肤色、血型、颜色 ...
  • (3)等级资料:将观察对象按照其属性的顺序或者等级,并对各组的对象进行计数所得的资料。(下图中的病情改变情况,,分为恶化、无变化、好转、治愈,它具有等级的含义(治疗效果逐渐增加)) 【注:表1为原始数据...
  • 列联表分析还包括配对计数资料的卡方检验、行列均为顺序变量的相关检验。 Part7相关分析 研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。 单相关:两个因素之间的相关关系叫单...
  • 连续变量的统计描述 分类变量的统计描述 正太分布 二项分布 参数估计与可信区间 假设检验     二、连续变量的统计描述   1、统计方法  1.1 频数表  组数:不宜过多或过少,保证大多数...
  • 统计学_第一章_统计和数据

    千次阅读 2021-01-15 15:05:58
    (一)什么是统计学 定义:统计学是用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。 (二)统计分析数据的方法 可分为描述统计和推断统计,两大类。 1、推断统计 是研究如何通过样本数据推断总体...
  • 管理统计学

    千次阅读 2020-05-30 14:59:02
    统计工作、 统计资料、 统计学统计学是研究如何测定、收集、描述和分析大量客观现象总体数量的数据和给出正确认识的方法论科学。 2、学派及代表人物 (1) 政治算术学派: 创始人和代表人物,英国威廉·配地、...
  • 变量和常量都是统计学研究中的对象特征,在数量指标中,不变的数量指标称为常量或参数,可变的数量指标称为变量。 2.变量类型: 按照变量是否连续 :连续变量与离散变量。   离散变量 是指其数值只能用...
  • 卫生统计学 名词解释

    2021-01-14 08:43:50
    1.变量:研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量2.定量变量:是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或...
  • 关于统计学

    2021-11-02 19:42:59
    所谓“数理统计”并非独立于统计学的新学科,确切地说,它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而是属于数学...
  • 统计学原理 统计中的几个基本概念

    千次阅读 2020-04-24 21:05:38
    理论变量则是由统计学家用数学方法所构造出来的一些变量,比如,z 统计量、t 统计量、F 统计量等 变量及其类型 变量 基本分类 其他分类 分类变量 顺序变量 数字变量 随机变量 非随机变量 经验变量理论变量 总体 样本...
  • 统计学知识:相关系数

    千次阅读 2021-11-11 00:10:08
    相关系数的取值在-1到1之间: -1表示两个变量呈现负相关 0表示两个变量没有相关性 1表示两个变量呈现正相关 最后,相关系数是统计学中的一个概念,统计学你应该怎么入门?Peter建议你参考下面的这张图: 3种常见...
  • 怎么理解【分类变量,顺序变量,数值型变量】和【定类变量,定序变量,定距变量,定比变量】和【离散变量,连续变量】之间的关系? 变量划分 划分依据 备注 定类/定序/定距/定比 根据数据测量的尺度或者说...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 7,881
精华内容 3,152
关键字:

统计学顺序变量

友情链接: FFT.rar