精华内容
下载资源
问答
  • 统计学知识

    2019-08-05 22:07:00
    统计学知识

    统计学知识

    在这里插入图片描述

    展开全文
  • 现代心理与教育统计学知识
  • 【统计学】论统计学知识

    千次阅读 2018-10-30 14:55:24
    文章目录论统计学知识点前言一、 图形可视化说明具有哪些图形?二、数据度量标准三、概率分布四、统计假设检验五、相关和回归总结 论统计学知识点 前言      &...

    论统计学知识点

    前言

             统计学在数据分析的基础上,研究如何测定,收集,整理,归纳和分析数据规律,以便给出正确消息的学科。它在数据挖掘,自然语言处理,机器学习中都被广泛使用,比如博主之前的那篇关于规则与统计相结合的词义消岐方法研究学习笔记,其中作者就用到了统计学。


    一、 图形可视化

    说明

             所谓的图形可视化就是将自己的数据利用图形(各种各种的图形)展现出来,这样对于用户来说无疑是最直观的,最具明显的来分析自己的数据。比如博主最近遇到项目上的一个关于器件价格的一个问题,就是将指定的器件按照它的购买价格,购买时间使用图形可视化(折线图),这样我们就能很“舒服”的了解这个器件的基本信息。

    具有哪些图形?

    1. 饼图
    2. 条形图
    3. 热力图
    4. 折线图
    5. 箱线图
    6. 散点图
    7. 雷达图
    8. 仪表图

    例如图形如下所示
    饼图:
    在这里插入图片描述
    条形图:
    在这里插入图片描述
    这里就不一一列举了。
    资源
    在这里插入图片描述
    相应的案例:
    在这里插入图片描述
    获取链接: https://download.csdn.net/download/jiajikang_jjk/10751628

    二、数据度量标准

    1. 平均数

    2. 中位数
      说明:
      奇数 n 个数值,则中位数位置: n + 1 2 \frac{n+1}{2} 2n+1
      偶数 n 个数值,则中位数位置: n 2 \frac{n}{2} 2n

    3. 众数

    4. 期望

    5. 方差
      X是服从分布F的随机变量,如果 E ( X ) E(X) E(X) 是随机变数X的期望值(平均数u=E[X]),则随机变量X或者分布F的方差是:
      V a r ( X ) = σ 2 = ∑ E ( X − u ) 2 N Var(X)=\sigma^2=\frac{\sum{E(X-u)^2}}{N} Var(X)=σ2=NE(Xu)2
      连续随机变量
      如果随机变数X是连续分布,并对应概率密度函数 f ( x ) f(x) f(x),则方差是
      V a r ( X ) = σ 2 = ∫ ( x − u ) 2 f ( x ) d x = ∫ x 2 f ( x ) d x − u 2 Var(X)=\sigma^2=\int(x-u)^2f(x)dx=\int x^2f(x)dx-u^2 Var(X)=σ2=(xu)2f(x)dx=x2f(x)dxu2 此处 u的期望值 u = ∫ x f ( x ) d x u=\int xf(x)dx u=xf(x)dx
      离散随机变量
      如果随机变数X是具有概率质量函数的离散概率分布 x 1 → p 1 , . . . x n → p n x_1 \rightarrow p_1,...x_n \rightarrow p_n x1p1,...xnpn, 则:
      V a r ( X ) = ∑ i = 1 n p i ( x i − u ) 2 = ∑ i = 1 n ( p i x i 2 ) − u 2 Var(X)=\sum_{i=1}^{n}p_i(x_i-u)^2=\sum_{i=1}^{n}(p_ix_i^2)-u^2 Var(X)=i=1npi(xiu)2=i=1n(pixi2)u2

    6. 标准差
      方差开方就是标准差

    7. 标准分

    三、概率分布

    1. 几何概率
    2. 二项分布
    3. 正态分布
    4. 泊松分布

    四、统计假设检验

            假设检验是推论统计假设的一种方。而“统计假设”是可通过观察一组随机变量的模型进行检验的科学假说。一旦能估计未知参数就会希望根据结果对未知的真正参数值做出适当的推论。假设检验的种类包括:t检验,z检验,卡方检验,F检验,等等。
    这里博主只是提出知识点,并不过多深究(论述统计学的知识点)

    五、相关和回归

    • 相关
      1: 正线性相关
      2:负线性相关
    • 回归
      1:最佳拟合线预测
      2:线性回归
      3:逻辑回归

    总结

           以上五个部分的简单概括,都是关于统计学的相关知识点。前言也说明了关于统计学用到的范围特别的广泛。所以运用好统计学是非常重要的。

    说明

    本文翻译出处:《自然语言处理理论与实战》

    展开全文
  • 统计学知识点总结

    千次阅读 2016-03-19 13:28:27
    商务统计学知识点简单总结

    统计学的知识重在理解,但一些基本的概念和术语还是需要归纳总结的,总结的不是很全面,一些书还是要慢慢体会的。


    展开全文
  • 统计学知识回顾(一)统计学基本知识样本和总体总体方差样本方差标准差诸方差公式期望概率密度函数二项分布一个简单的案例二项分布的期望值泊松过程泊松分布大数定理正态分布标准正态分布Z分数经验法则 统计学基本...

    统计学基本知识

    此文目的旨在对统计学知识进行回顾

    样本和总体

    • 总体:研究对象的整个群体
    • 样本:从总体中抽取的部分,用于代表总体的整体情况
    • 数学符号的区别:
      总体均值常用 μ \mu μ,样本均值常用 X ‾ \overline{X} X

    总体方差

    • 方差:衡量变量或者一组随机数据离散程度的度量
    • 公式
      在这里插入图片描述
      其中 N 为总体数目

    样本方差

    • 由于很多统计情景下总体的数目无法直接测算,因此常常使用总体中的部分样本来对总体进行估计
    • 公式
      在这里插入图片描述
    • 其中 n 为样本数目。值得注意的是,总体的分布并不总是均匀的,如果样本选取的不好,比如样本恰好选择了总体当中数据分布较为集中的部分,所得到样本方差就会很小。在这种情况下,样本方差无法准确反映总体的方差,实际所选取的样本甚至可能并不包括总体均值。这个公式通常会低估总体方差。
    • 无偏估计:也称作无偏样本方差
    • 公式
      在这里插入图片描述
    • 通常这个指标更加接近总体方差

    标准差

    • 方差的平方根
    • 标准差使得离散程度的估计值恢复跟原始数据一样的量纲

    诸方差公式

    • 公式
      在这里插入图片描述
    • 证明过程此处不表,由原总体方差公式平方和展开求解可得。

    期望

    • 亦即总体的均值,此处一般指总体无穷的情形。因此在计算平均值时无法像有穷情形下一样,计算通常使用频率来代替,而频率则由概率分布得出。
    • 公式
      在这里插入图片描述

    概率密度函数

    前文所提到的统计量均为离散型数据,此处提出的概念为连续型数据。在连续型数据当中,想要估计变量恰好为某一个精确值的概率几乎是不可能的,这也可以解释为什么在我们的教材当中认为连续型变量当中等于某一固定值的概率为0。因此通常我们在估计概率的时候会允许一定的容差。在此前提下,统计学提出了概率密度函数的概念,以微积分为工具来测算在我们允许的容差范围内某一事件发生的概率,也就是一个抽象概念下的曲线面积——这一曲线就是概率密度函数。注意,所有事件发生的概率之和应当为1,因此曲线总面积也当为1。

    二项分布

    一个简单的案例

    • 连续抛五次硬币,并计算正面朝上的概率
    • 此处涉及排列组合的问题,通过计算可以看出一个神奇的地方,你会发现正面朝上0、1、2、3、4、5次的概率分别与正面朝上5、4、3、2、1、0次的概率一样。这是因为事件硬币正面朝上 n 次等同于事件反面朝上 5 - n 次,而在这个案例中正面朝上的概率与反面朝上的概率恰好相等。
    • 总结可得公式如下:
      在这里插入图片描述
      其中 N 是试验的次数,p 是事件A发生的概率,1-p 则是事件A的互斥事件发生的概率。二项式系数表示每次独立事件可能发生的所有情形。

    二项分布的期望值

    • 公式
      在这里插入图片描述
    • 证明
      核心点在于通过期望的计算公式提取出 np 项,通过换元把剩余部分转化为二项分布概率之和即为1。

    泊松过程

    假设 X 为一小时内通过的车辆,假设期望值的最好估计值是 λ \lambda λ 。则这个过程可以近似为60分钟内有多少车辆经过——这样便可以近似地看作一个二项分布。但是实际上一分钟很有可能通过不止一辆车,则这个时候可以选取更小的细分区间来近似:秒、毫秒…不断地重复这一过程,得到的结果就是泊松过程。

    泊松分布

    • 公式
      在这里插入图片描述
    • 证明
      本质上是使用二项分布的公式进行计算,但是二项分布公式中的试验次数 N 此时趋近于无穷大。

    大数定理

    • 核心思想:样本数量足够大的时候,样本均值将趋近于总体均值

    正态分布

    • 公式
      在这里插入图片描述
    • 均值会影响分布曲线的中心位置,而标准差则会影响分布曲线的陡峭程度。
    • 与二项分布不同的是,正态分布不能只看某一点的概率,所以应该看某一区间内曲线下的面积,即特定区间下的积分值。
    • CDF函数:累积分布函数。通过不同上限的累积分布函数值相减可得对应区间的概率。

    标准正态分布

    均值为0,标准差为1的正态分布

    Z分数

    • 离均值有多少个标准差远

    经验法则

    • 均值一个标准差区间:68%
    • 均值两个标准差区间:95%
    • 均值三个标准差区间:99.9%
    展开全文
  • 但是书本往往有这样一个缺点:读了后面忘了前面,想要复习的话又需要翻来翻去,回顾十分不易,我读了这本书后将书本中涉及的统计学知识点及计算方法做了一张表,供有需要的可以参考,本来想用表格形式的,但是数学...
  • 统计学知识梳理

    2018-10-25 22:10:42
    统计学大体可以分为两类: 描述性统计学:希望在不告诉别人所有数据的情况下介绍这些数据的情况。 推论统计学:从总体中获得一些样本,利用样本的数学计算,推断出总体的情况。...统计学的主要知识基本包括:...
  • 统计学知识大梳理 你的“对象” 是谁? o“对象”按照维度分为了两大类:统计学,概率论。 一维:就是当前摆在我们面前的“一组”,“一批”,哪怕是“一坨”数据。这里我们会用到统计学的知识去研究这类对象。 ...
  • 统计学知识补充

    2020-12-08 17:15:41
    1.k阶中心动差: 原点动差:mean=0 一阶动差:恒等于0 二阶动差:即方差 2.偏度:反映随机分布的对称程度,计算方式:三阶动差/标准差的3次方; ...当偏度大于0时,整体数据分布呈现右偏,如图带颜色的曲线(文字...
  • 需要了解和掌握的统计学知识如下:  基本统计量:均值、中位数、众数、百分位数、极值等  其他描述性统计量:偏度、方差、标准差、显著性等  其他统计知识:总体和样本、参数和统计量、ErrorBar  概率分布与...
  • 统计学知识总结

    2019-09-28 13:10:57
    统计学里经常提到分位数的概念,下面我们通过一个例子来简单解释一下。 假设有一千名学生参加了某次考试, 学生A得了75分,排名603,603/1000=60.3% 学生B得了94分,排名28,28/1000=2.8% 此时,A大约在60.3%的...
  • 用R语言写一个囊括大部分基础统计学知识的包,源于学习中经常出现不知道或找不到等问题,有了包就方便快捷。这也算是flag了,下次来记录报告进展。 1、2017/4/30 立flag,已经完成 可达矩阵
  • 统计学知识点汇总

    2017-03-31 00:59:27
  • 统计学知识大梳理

    2020-05-20 20:36:00
    作者:大师兄 来源:一个数据人的自留地学好统计学,让你成为高富帅,迎娶白富美,走上人生巅峰,不是不可能,但可能性只有0.00001%。从统计学的角度,这是小概率事件。但...
  • 统计学知识点梳理

    千次阅读 2020-05-21 20:40:31
    统计学 二维 事件 概率论 统计学 集中趋势描述 均值 分散度描述 方差、标准差 概率论 集中趋势描述 期望 分散度描述 方差 二、对“数据”的描述性分析 1、集中趋势度量:...
  • 统计学知识复习

    2017-01-08 02:28:44
    1、均匀分布没有众数 2、异常值的定义:①小于Q1(四分位数)- 1.5*IQR(四分位差Q3 - Q1) ②大于 Q3 + 1.5*IQR 3、当数据分布左偏或右偏时,mean 可能不在 IQR 中 4、IQR 无法反映全部数据 5、离均差:Σ(Xi - ...
  • 统计学知识点整理

    千次阅读 2019-03-12 15:32:09
    适用条件: [1]两样本均来自于正态总体 [2]两样本相互独立 [3]满足方差齐性(通过方差齐性检验) 方差齐性检验(Homogeneity of variance test)是数理统计学中检查不同样本的总体方差是否相同的一种方法。...
  • 统计学知识图谱 前言 前段时间想着系统学习统计分析方法,又想着基于应用的目的来学习,所以有了前篇《统计分析方法知识图谱》。写完之后开始学了张文彤老师的《SPSS20.0统计分析基础教程》的初中和高...
  • 数据分析必备的概率论和统计学知识 概率论基础 1. 随机事件与概率 随机事件是在随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件叫做随机事件(简称事件)。随机事件通常用大写英文字母A...
  • 统计学知识闯关!

    2020-08-06 17:00:00
    来源:数据分析1480本文长度为2800字,建议阅读8分钟闯下这十关,收获新知识!第1关:自由度是什么?怎样确定?答:(定义)构成样本统计量的独立的样本观测值的数目或自由变动的样本观测值...
  • 教育统计学知识总结1

    千次阅读 2020-04-26 19:21:28
    1、基础知识 方差;标准差;协方差;标准分;递归;迭代;最小二乘法;logistics回归;信效度;R2; 均值或样本平均、期望: 中位数: 是从小到大排列的 中位数不易受极端值的影响,因而中位数比均值稳健...
  • 用于统计分析,及空间分析相关的资源.更详细的了解统计学的相关知识
  • 文章目录一、统计学知识1. 众数(1)概念:(2)注意:(3)举例(4)总结2. 中位数(1)定义(2)注意(3)案例(4)总结3. 平均数4. 方差(1)定义(2)方法(3)公式(4)案例(5)总结5. 标准差(均方差)(1)...
  • 概率和统计学知识汇总

    万次阅读 2018-09-02 10:20:33
    因为在现实建模问题中,往往我们先得到和固定的反而是似然函数(其实也很好理解,客观的实验观察数据才是第一手最solid的材料),这时先验函数(可以理解为先验知识或者是对后验分布的一种假设和猜测)是可以选择的...
  • 那么站在统计学的角度来说,这个数据的背后到底隐含了什么样的信息呢?想要弄懂这个问题,我想我们可能需要温习一下如何描述一组数据的分布情况这一知识点。 0x01 温故而知新 工欲善其事,必先利其器。数据的...
  • 各层级统计学知识

    2019-09-17 21:12:41
    【入门基础】 随机变量、均值方差标准差、统计图表、概率密度、二项分布、泊松分布、正态分布、大数定律、中心极限定理、样本和抽样分布、参数估计、置信区间、伯努利分布、假设检验和p值、方差分析、回归分析...
  • 人力资本分析的重点归根结底还是在于分析,统计学作为数据分析的基础,是每一个尝试进入人力资本分析领域的小伙伴得不得了解的内容。 #统计学是学什么的 统计学习是一套以理解数据为目的的庞大工具集。 统计...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 37,389
精华内容 14,955
关键字:

统计学知识