精华内容
下载资源
问答
  • 如何用统计学分析数据
    千次阅读
    2021-12-11 17:15:38

    1.T-test,F-test(可用于一组数据的均值,方差统计学差异检验)python t_statistic, p_value = ttest_rel(vib_left, elec_left)

    #解释:

    配对样本t检验用于检验两个相关的样本是否来自具有相同均值正态总体。实质是检验两相关样本之差的均值和零之间的差异大小。

    适用情况有:为了比较两种方法(或两种产品、两种仪器等)的差异,因此令两种方法分别对同一受试对象进行试验,再对两方法所得结果进行对比而得出结论。

    #使用t检验比较这两组k个样本的均值、使用F检验比较这两组k个样本的方差,

    #均值越大、方差越小说明在当前指标上该模型更好更稳定(这里说的指标是正向指标)

    #可以看到t检验的p值<0.05,说明拒绝原假设,即两个模型在该指标上取值的均值有差异;

    #F检验的p>0.05,说明接受原假设,即两个模型结果的稳定程度一致(方差)。

    2.计算单因素方差分析的显著性差异时间范围-anonva1 p-value,

    p = anova1(y)对样本数据执行单因子方差分析并返回p值。将每一列视为一个单独的组。该函数检验以下假设:列中的样本是从具有相同均值的总体中抽取的,而其他假设是总体均值并不完全相同

    MATLAB中的 anova1()函数 单因素方差分析_漂流瓶jz_新浪博客 (sina.com.cn)

    3. ks-test检验 matlab kstest2(X1,X2)

    <分布情况未知>

    %原假设向量中的数据来自具有相同分布的总体,logical=1表示在默认5%的显著性水平上否定原假设,=0则不否认原假设

    更多相关内容
  • 目录 一、为什么要学习统计学 ...2. 学习统计学,让我们理清思路,学会分析事物之间各种各样的关系, 例如A越多,B越多,这样的句子能说明A和B的相关性,不能说明因果关系,但因果关系一定是相关关系
  • 该报告时由本人根据自己所开发的以项目进行编写,图形化展示
  • 七周学会数据分析良心教程(数据思维统计学excel数据可视化sqlpython).zip |- 七周学会数据分析良心教程(数据思维统计学excel数据可视化sqlpython).zip |- 七周学会数据分析良心教程(数据思维统计学excel数据...
  • ,作者是R.L.奥特(R.Lyamn Ott),M.朗格内克(Michael Longnecker)。
  • 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。统计学主要又分为描述统计学和推断统计学。给定一组...
  • 从高的角度来看,统计学是一种利用数学理论来进行数据分析的技术。象柱状图这种基本的可视化形式,会给你更加全面的信息。但是,通过统计学我们可以以更富有信息驱动力和针对性的方式对数据进行操作。所涉及的数学...
    本文讲述了数据分析师应当了解的五个统计基本概念:统计特征、概率分布、降维、过采样/欠采样、贝叶斯统计方法

    从高的角度来看,统计学是一种利用数学理论来进行数据分析的技术。象柱状图这种基本的可视化形式,会给你更加全面的信息。但是,通过统计学我们可以以更富有信息驱动力和针对性的方式对数据进行操作。所涉及的数学理论帮助我们形成数据的具体结论,而不仅仅是猜测。

    利用统计学,我们可以更深入、更细致地观察数据是如何进行精确组织的,并且基于这种组织结构,如何能够以最佳的形式来应用其它相关的技术以获取更多的信息。今天,我们来看看数据分析师需要掌握的5个基本的统计学概念,以及如何有效地进行应用。

    特征统计

    f43062b01b4fd99496a6a7f117043a61.gif

    特征统计可能是数据科学中最常用的统计学概念。它是你在研究数据集时经常使用的统计技术,包括偏差、方差、平均值、中位数、百分数等等。理解特征统计并且在代码中实现都是非常容易的。请看下图:

    e5401037b3ec5703ea981c57dc9c87e1.png

    上图中,中间的直线表示数据的中位数。中位数用在平均值上,因为它对异常值更具有鲁棒性。第一个四分位数本质上是第二十五百分位数,即数据中的25%要低于该值。第三个四分位数是第七十五百分位数,即数据中的75%要低于该值。而最大值和最小值表示该数据范围的上下两端。

    箱形图很好地说明了基本统计特征的作用:

    • 当箱形图很短时,就意味着很多数据点是相似的,因为很多值是在一个很小的范围内分布;

    • 当箱形图较高时,就意味着大部分的数据点之间的差异很大,因为这些值分布的很广;

    • 如果中位数接近了底部,那么大部分的数据具有较低的值。如果中位数比较接近顶部,那么大多数的数据具有更高的值。基本上,如果中位线不在框的中间,那么就表明了是偏斜数据;

    • 如果框上下两边的线很长表示数据具有很高的标准偏差和方差,意味着这些值被分散了,并且变化非常大。如果在框的一边有长线,另一边的不长,那么数据可能只在一个方向上变化很大

    概率分布

    e3a7ae4b74a29cab513b986861abd310.gif

    我们可以将概率定义为一些事件将要发生的可能性大小,以百分数来表示。在数据科学领域中,这通常被量化到0到1的区间范围内,其中0表示事件确定不会发生,而1表示事件确定会发生。那么,概率分布就是表示所有可能值出现的几率的函数。请看下图:

    38deb4470ec3b0c00d9d985202af66c7.png 682c4620487c9922dfe99aa328c67724.png 24b1f2d204321f4e9c6fcc524d17dbb3.png

    常见的概率分布,均匀分布(上)、正态分布(中间)、泊松分布(下):

    • 均匀分布是其中最基本的概率分布方式。它有一个只出现在一定范围内的值,而在该范围之外的都是0。我们也可以把它考虑为是一个具有两个分类的变量:0或另一个值。分类变量可能具有除0之外的多个值,但我们仍然可以将其可视化为多个均匀分布的分段函数。

    • 正态分布,通常也称为高斯分布,具体是由它的平均值和标准偏差来定义的。平均值是在空间上来回变化位置进行分布的,而标准偏差控制着它的分布扩散范围。与其它的分布方式的主要区别在于,在所有方向上标准偏差是相同的。因此,通过高斯分布,我们知道数据集的平均值以及数据的扩散分布,即它在比较广的范围上扩展,还是主要围绕在少数几个值附近集中分布。

    • 泊松分布与正态分布相似,但存在偏斜率。象正态分布一样,在偏斜度值较低的情况下,泊松分布在各个方向上具有相对均匀的扩散。但是,当偏斜度值非常大的时候,我们的数据在不同方向上的扩散将会是不同的。在一个方向上,数据的扩散程度非常高,而在另一个方向上,扩散的程度则非常低。

    如果遇到一个高斯分布,那么我们知道有很多算法,在默认情况下高思分布将会被执行地很好,因此首先应该找到那些算法。如果是泊松分布,我们必须要特别谨慎,选择一个在空间扩展上对变化要有很好鲁棒性的算法。

    降维

    957701a588c7e0cc3d854a0cf4963580.gif

    降维这个术语可以很直观的理解,意思是降低一个数据集的维数。在数据科学中,这是特征变量的数量。请看下图:

    4eb1957b22878dd96eeb6a9115ed1901.png

    上图中的立方体表示我们的数据集,它有3个维度,总共1000个点。以现在的计算能力,计算1000个点很容易,但如果更大的规模,就会遇到麻烦了。然而,仅仅从二维的角度来看我们的数据,比如从立方体一侧的角度,可以看到划分所有的颜色是很容易的。通过降维,我们将3D数据展现到2D平面上,这有效地把我们需要计算的点的数量减少到100个,大大节省了计算量。

    另一种方式是我们可以通过特征剪枝来减少维数。利用这种方法,我们删除任何所看到的特征对分析都不重要。例如,在研究数据集之后,我们可能会发现,在10个特征中,有7个特征与输出具有很高的相关性,而其它3个则具有非常低的相关性。那么,这3个低相关性的特征可能不值得计算,我们可能只是能在不影响输出的情况下将它们从分析中去掉。

    用于降维的最常见的统计技术是PCA,它本质上创建了特征的向量表示,表明了它们对输出的重要性,即相关性。PCA可以用来进行上述两种降维方式的操作。

    过采样和欠采样

    18532e1391a86b8710caa360f5dfdcdd.gif

    过采样和欠采样是用于分类问题的技术。例如,我们有1种分类的2000个样本,但第2种分类只有200个样本。这将抛开我们尝试和使用的许多机器学习技术来给数据建模并进行预测。那么,过采样和欠采样可以应对这种情况。请看下图:

    62b09286aec6425937f8714e01b536c5.png

    在上面图中的左右两侧,蓝色分类比橙色分类有更多的样本。在这种情况下,我们有2个预处理选择,可以帮助机器学习模型进行训练。

    欠采样意味着我们将只从样本多的分类中选择一些数据,而尽量多的使用样本少的分类样本。这种选择应该是为了保持分类的概率分布。我们只是通过更少的抽样来让数据集更均衡。

    过采样意味着我们将要创建少数分类的副本,以便具有与多数分类相同的样本数量。副本将被制作成保持少数分类的分布。我们只是在没有获得更多数据的情况下让数据集更加均衡。

    贝叶斯统计

    cd92f183035ad1bf6563d9410ff324dc.gif

    完全理解为什么在我们使用贝叶斯统计的时候,要求首先理解频率统计失败的地方。大多数人在听到“概率”这个词的时候,频率统计是首先想到的统计类型。它涉及应用一些数学理论来分析事件发生的概率,明确地说,我们唯一计算的数据是先验数据(prior data)。

    5e78685020472399f42316a730f85290.png

    假设我给了你一个骰子,问你掷出6点的几率是多少,大多数人都会说是六分之一。

    但是,如果有人给你个特定的骰子总能掷出6个点呢?因为频率分析仅仅考虑之前的数据,而给你作弊的骰子的因素并没有被考虑进去。

    贝叶斯统计确实考虑了这一点,我们可以通过贝叶斯法则来进行说明:

    f65fc590dd4717a05dc8d22e43e3ffef.png

    在方程中的概率P(H)基本上是我们的频率分析,给定之前的关于事件发生概率的数据。方程中的P(E|H)称为可能性,根据频率分析得到的信息,实质上是现象正确的概率。例如,如果你要掷骰子10000次,并且前1000次全部掷出了6个点,那么你会非常自信地认为是骰子作弊了。

    如果频率分析做的非常好的话,那么我们会非常自信地确定,猜测6个点是正确的。同时,如果骰子作弊是真的,或者不是基于其自身的先验概率和频率分析的,我们也会考虑作弊的因素。正如你从方程式中看到的,贝叶斯统计把一切因素都考虑在内了。当你觉得之前的数据不能很好地代表未来的数据和结果的时候,就应该使用贝叶斯统计方法。

    作者:George Seif

    长按👇关注- 关于数据分析与可视化 -设为星标,干货速递

    NO.1

    往期推荐

    Historical articles

    一行代码制作数据分析交叉表,太便捷了

    最全整理!37 个 Python Web 开发框架总结

    Linux 操作必备 150 个命令,速度收藏~

    决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost总结

    分享、收藏、点赞、在看安排一下?

    297af77ac7077a4f252974b03cab9a72.gif

    d334e2f6e3ca444818de08e8ad0abb87.gif

    b787c348154d18139589b1e88c96c782.gif

    1f724b5b2810e355fad3fa325d9114ee.gif

    展开全文
  • 统计学中常用的数据分析方法汇总

    千次阅读 2021-06-22 19:49:59
    统计学分析方法01 | 描述统计1.集中趋势分析2.离中趋势分析3.相关分析4.推论统计02 | 假设检验1.参数检验2.非参数检验03 | 信度分析1.重测信度法2.复本信度法编辑3.折半信度法编辑04 | 列联表分析05 | 相关分析1.单...

    新增内容日志
    20210712
        大数定律和中心极限定理

    01 | 描述统计

    描述统计是通过数据、可视化图表的形式,对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。

    1.集中趋势分析

    利用平均数、中数、众数等统计指标来表示数据的集中趋势。
    例如被试的平均成绩多少?是正偏分布还是负偏分布?
    在这里插入图片描述

    2.离中趋势分析

    靠全距、四分差、平均差、方差(协方差:用来度量两个随机变量关系的统计量)、标准差等统计指标来研究数据的离中趋势。
    比如用两个班级的四分差或百分点来比较,就可以得知哪个班级内的成绩分布更分散

    3.相关分析

    探讨数据之间是否具有统计学上的关联性。
    可以是单方面相关,也可以说互相相关。

    4.推论统计

    5.大数定律和中心极限定理

    ①大数定律
    概率论历史上第一个极限定理属于伯努利,也被称之为“大数定律”。在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。
    例如抛硬币,出现正反面的概率不尽相同。但是当抛的次数到大一定数量时,两种结果的概率往往各自趋向于二分之一。同样的,我们要统计一个地区的生育率,当统计样本达到一定数量时,概率基本会稳定在一个区间。


    ②中心极限定理
    当样本量越来越大时,样本均值会趋向于正态分布(钟形曲线)。正态分布有两个量来描述,一个是均值,一个是方差。中心极限定理对样本分布不做要求(离散,连续,非正态分布都可以)。
    许多统计要求样本是正态分布的,此时中心极限定理可以承担桥梁的作用,实现数据样本的正态分布,满足统计检验方法的先决条件。
    比如要用统计检验的方法,比较一个地区男人跟女人秃头的平均年龄是否有差异,但是当样本量较小的时候,样本是离散分布的。但通过中心极限定理,当样本量达到一个阈值,那么样本就可以实现正态分布。

    02 | 常见数值

    1.平均值

    2.加权平均值

    我们常用平均数表示一组数据的‘平均水平’。把在一组数据里,一个数据出现的次数称为权。
    学校算期末成绩,期中考试占30%,期末考试占50%,作业占20%,假如某人期中考试得了84,期末92,作业分91,则其算术平均数就是: (84+92+91)/3=89
    其加权平均数就是:
    (8430%+9250%+91*20%)=89.4

    3.箱线图常用参数

    添加链接描述

    02 | 假设检验

    1.参数检验

    在已知总体分布的条件下(一般要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。

    ① U检验 :当样本含量n较大时,样本值符合正态分布
    ② T检验:当样本含量n较小时,样本值符合正态分布

    2.非参数检验

    不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。
    主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。

    03 | 信度分析

    信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种:重测信度法、复本信度法、折半信度法、α信度系数法。

    1.重测信度法

    问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。

    2.复本信度法编辑

    让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。
    在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。

    3.折半信度法编辑

    折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。

    04 | 列联表分析

    列联表是观测数据按两个或更多属性(定性变量)分类时所列出的频数表。

    05 | 相关分析

    1.单相关

    两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量

    2.复相关

    三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量相关

    3.偏相关

    在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系称为偏相关。

    06 | 方差分析

    使用条件:
    各样本须是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等。

    1.单因素方差分析

    一项试验只有一个影响因素,或者存在多个影响因素时,只分析一个因素与响应变量的关系

    2.多因素有交互方差分析

    一顼实验有多个影响因素,分析多个影响因素与响应变量的关系,同时考虑多个影响因素之间的关系

    3.多因素无交互方差分析

    分析多个影响因素与响应变量的关系,但是影响因素之间没有影响关系或忽略影响关系

    4.协方差分祈

    传统的方差分析存在明显的弊端,无法控制分析中存在的某些随机因素,使之影响了分祈结果的准确度。协方差分析主要是在排除了协变量的影响后再对修正后的主效应进行方差分析,是将线性回归与方差分析结合起来的一种分析方法

    07 | 回归分析

    1.一元线性回归分析

    一个自变量X与因变量Y有关,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布

    2.多元线性回归分析

    多个自变量与因变量Y的关系,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布 。

    3.Logistic回归分析

    线性回归模型要求因变量是连续的正态分布变里,且自变量和因变量呈线性关系,而Logistic回归模型对因变量的分布没有要求,一般用于因变量是离散时的情况

    08 | 聚类分析

    聚类与分类的不同在于,聚类所要求划分的类是未知的
    sklearn里面非常有名的k-means就是一种聚类分析方法,属于无监督的机器学习算法,在建模前不知道分类结果,通过算法来实现自动分类

    从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等

    09 | 判别分析

    根据已掌握的一批分类明确的样品建立判别函数,使产生错判的事例最少,进而对给定的一个新样品,判断它来自哪个总体

    1.与聚类分析区别:

    • 聚类分析可以对样本逬行分类,也可以对指标进行分类;而判别分析只能对样本
    • 聚类分析事先不知道事物的类别,也不知道分几类;而判别分析必须事先知道事物的类别,也知道分几类
    • 聚类分析不需要分类的历史资料,而直接对样本进行分类;而判别分析需要分类历史资料去建立判别函数,然后才能对样本进行分类

    2.分类方法

    • Fisher判别分析法
      以距离为判别准则来分类,即样本与哪个类的距离最短就分到哪一类,适用于两类判别
      以概率为判别准则来分类,即样本属于哪一类的概率最大就分到哪一类,适用于适用于多类判别
    • BAYES判别分析法
      BAYES判别分析法比FISHER判别分析法更加完善和先进,它不仅能解决多类判别分析,而且分析时考虑了数据的分布状态,所以一般较多使用

    10 | 主成分分析

    Principal Component Analysis,PCA,sklearn中非常常用的算法之一。

    11 | 因子分析

    寻找隐藏在多变量数据中、无法直接观察到却影响或支配可测变量的潜在因子、并估计潜在因子对可测变量的影响程度以及潜在因子之间的相关性的一种多元统计分析方法

    12 | 时间序列分析

    时间序列通常由4种要素组成:趋势、季节变动、循环波动和不规则波动。
    主要方法:移动平均滤波与指数平滑法、ARIMA横型、量ARIMA横型、ARIMAX模型、向呈自回归横型、ARCH族模型

    13 | 其他分析方法

    多重响应分析、距离分祈、项目分祈、对应分祈、决策树分析、神经网络、系统方程、蒙特卡洛模拟等。

    展开全文
  • Excel 做统计学分析

    千次阅读 2021-03-19 20:35:25
    数据分析插件 1、进入 Excel 点击选项 2、在加载项中点击转到 3、打开分析工具库扩展 4、选择数据标签页,点击数据分析 5、选择适合数据分析方法,这里以方差分析为例 6、配置分析需要的选项 在输入区域...

    数据分析插件

    1、进入 Excel 点击选项
    mark

    2、在加载项中点击转到
    mark

    3、打开分析工具库扩展
    mark

    4、选择数据标签页,点击数据分析
    mark

    5、选择适合数据的分析方法,这里以方差分析为例
    mark

    6、配置分析需要的选项

    • 在输入区域输入对应的数据,
      mark

    • 利用鼠标指针框选带有样本分组标志的数据集,比如下图这样
      mark

    • 选中标志位于第一行,用于标记分组名称

      α(A)是显著性水平,0.05代表95%的可信度

      mark

    • 选中输出区域,将输出结果打印在Excel中,或者可以选新建工具表组

    7、最后,生成对应的分析结果
    mark

    表里的统计值

    • 组:分组名称
    • 观测数:每组样本数量
    • 求和:总值
    • 平均:平均值
    • 方差:方差值
    • SS:平方和
    • df:自由度,用于其他统计量计算
    • MS:均方,由于各误差平方和的大小与观测值的多少有关,为了消除观测值多少对误差平方和大小的影响,需要将其平均。
    • F:检验统计量,用于假设检验计算的统计量
    • P value:显著性水平,估计总体参数落在某一区间内,可能犯错误的概率
    • F crit:临界值,在相应显著水平下的F临界值

    查看组间有无差异

    代表两组数据有差异:F > Fcrit

    代表两组数据无差异:F < Fcrit

    查看差异显著性(可信度)

    差异显著:0.01 < P value < 0.05

    差异极显著:P value < 0.01

    后续更新其他分析方法。

    展开全文
  • 数据分析 数据挖掘与统计学应用 系列课程03 第三章 R获取数据 (共39页).pptx 数据分析 数据挖掘与统计学应用 系列课程04 第四章 数据预处理 (共114页).pptx 数据分析 数据挖掘与统计学应用 系列课程05 第五章 ...
  • 本书适用于各种学科的高年级本科生和研究生,目的在于为学生解决研究项目中约到问题、基于数据做出决策。
  • 统计学 分类数据分析

    2020-06-08 19:31:14
    统计学 分类数据分析 分类数据和x2x^2x2统计量 拟合优度检验 列联分析: 独立性检验 列联表的相关系(三个系数) 1.分类数据和x2x^2x2统计量 分类数据 x2x^2x2统计量 其中 k为求和的项数, l 为要估计的参数个数 ...
  • 数据分析 数据挖掘与统计学应用 系列课程03 第三章 R获取数据 (共39页).pptx 数据分析 数据挖掘与统计学应用 系列课程04 第四章 数据预处理 (共114页).pptx 数据分析 数据挖掘与统计学应用 系列课程05 第五章 ...
  • 数据分析 数据挖掘与统计学应用 系列课程03 第三章 R获取数据 (共39页).pptx 数据分析 数据挖掘与统计学应用 系列课程04 第四章 数据预处理 (共114页).pptx 数据分析 数据挖掘与统计学应用 系列课程05 第五章 ...
  • 数据分析面试题-统计学数据科学面试常见知识点
  • 数据分析 数据挖掘与统计学应用 系列课程03 第三章 R获取数据 (共39页).pptx 数据分析 数据挖掘与统计学应用 系列课程04 第四章 数据预处理 (共114页).pptx 数据分析 数据挖掘与统计学应用 系列课程05 第五章 ...
  • 统计学方法与数据分析(上下册)

    热门讨论 2013-12-29 11:32:47
    作者把统计数据的收集与分析过程总结成"四步法",并把"四步法"的讲解贯穿始终,利用实例逐步展开并阐明在设计调查研究或试验时所需要的统计技术和思路,然后讲解直观、有效的"四步法"来收集并分析数据,非常利于...
  • 统计学之方差分析

    2021-01-07 06:17:35
    方差分析中,由于各种因素的影响,研究所得的数据呈现波动状,这种波动可以分为组间波动和组内波动两种情况。 食物1 食物2 食物3 3 5 5 2 3 6 1 4 7 均值:2 均值:4 均值:6 引入三个概念及算法: ...
  • 【清华大学大数据 数据分析 统计学 系列课程】 全套清华大学数据分析 统计学 系列课程 01 第一章 统计学习方法概论 (共32页).pptx 全套清华大学数据分析 统计学 系列课程 02 第二章 感知机 (共28页).pptx 全套...
  • 商业统计学类型数据分析讲义.pptx
  • :博主是正在学习数据分析的一员,博客记录的是在学习过程中一些总结,也希望和大家一起进步,在记录之时,未免存在很多疏漏和不全,如有问题,还请私聊博主指正。 博客地址:天阑之蓝的博客,学习过程中不免有困难...
  • 统计学方法与数据分析 国际名著 上下册 R。L。奥特著 张忠占译 科学出版社
  • 数据分析 数据挖掘与统计学应用 系列课程03 第三章 R获取数据 (共39页).pptx 数据分析 数据挖掘与统计学应用 系列课程04 第四章 数据预处理 (共114页).pptx 数据分析 数据挖掘与统计学应用 系列课程05 第五章 ...
  • 【清华大学大数据 数据分析 统计学 系列课程】 全套清华大学数据分析 统计学 系列课程 01 第一章 统计学习方法概论 (共32页).pptx 全套清华大学数据分析 统计学 系列课程 02 第二章 感知机 (共28页).pptx 全套...
  • 如果统计学中最基本、核心的思想:样本估计总体,你都没概念,就别说自己会数据分析了。 学数据分析究竟要懂哪些统计学?全都给你梳理好了,拿走不谢 但多数人在学习统计学知识时会无比头疼,因为统计学的书籍里...
  • 【清华大学大数据 数据分析 统计学 系列课程】 全套清华大学数据分析 统计学 系列课程 01 第一章 统计学习方法概论 (共32页).pptx 全套清华大学数据分析 统计学 系列课程 02 第二章 感知机 (共28页).pptx 全套...
  • 【清华大学大数据 数据分析 统计学 系列课程】 全套清华大学数据分析 统计学 系列课程 01 第一章 统计学习方法概论 (共32页).pptx 全套清华大学数据分析 统计学 系列课程 02 第二章 感知机 (共28页).pptx 全套...
  • 本书据Duxbury Press第5版译出。...作者使用实例来引入主题,并把统计概念和实际问题联系在一起进行讲解,介绍了统计数据的收集和分析过程,讨论了如何解释数据分析的结果,并专门讲述了如何写数据分析报告。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 69,022
精华内容 27,608
关键字:

如何用统计学分析数据