统计学 订阅
统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识,其应用范围几乎覆盖了社会科学和自然科学的各个领域。 [1] 展开全文
统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识,其应用范围几乎覆盖了社会科学和自然科学的各个领域。 [1]
信息
学科门类
一级学科
外文名
Statistics
学科特点
应用广泛
中文名
统计学
主要分支
社会统计学、数理统计学 [2]
统计学发展过程
统计学的英文statistics最早源于现代拉丁文Statisticum Collegium(国会)、意大利文Statista(国民或政治家)以及德文Statistik,最早是由Gottfried Achenwall于1749年使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。十九世纪,统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里士多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”、“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说,它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而是属于数学的范畴。“城邦政情”(Matters of state)阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十余种纪要,其内容包括各城邦的历史、行政、科学、艺术、人口、资源和财富等社会和经济情况的比较、分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算术”这个名词所替代,并且很快被演化为“统计学”(Statistics)。但统计学依然保留了城邦(state)这个词根。 与“城邦政情”阶段没有很明显的分界点,本质的差别也不大。“政治算术”的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。1690年英国威廉·配弟出版《政治算数》一书作为这个阶段的起始标志。威廉·配第用数字、重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此,威廉·配第的《政治算术》被后来的学者评价为近代统计学的来源,威廉·配第本人也被评价为近代统计学之父。配第在书中使用的数字有三类:第一类是对社会经济现象进行统计调查和经验观察得到的数字。因为受历史条件的限制,书中通过严格的统计调查得到的数据少,根据经验得出的数字多;第二类是运用某种数学方法推算出来的数字。其推算方法可分为三种:(1)以已知数或已知量为基础,循著某种具体关系进行推算的方法;(2)通过运用数字的理论性推理来进行推算的方法;(3)以平均数为基础进行推算的方法”;第三类是为了进行理论性推理而采用的例示性的数字。配第把这种运用数字和符号进行的推理称之为“代数的算法”。从配第使用数据的方法看,“政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点,统计实证方法和理论分析方法浑然一体,这种方法即使是现代统计学也依然继承。 [3]  在“政治算术”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。十九世纪末,欧洲大学开设的“国情纪要”或“政治算数”等课程名称逐渐消失,代之而起的是“统计分析科学”课程。当时的“统计分析科学”(Science of statistical analysis)课程的内容仍然是分析研究社会经济问题。“统计分析科学”课程的出现是现代统计发展阶段的开端。1908年,“学生”氏(William Sleey Gosset的笔名Student)发表了关于t分布的论文。这是一篇在统计学发展史上划时代的文章,它创立了小样本代替大样本的方法,开创了统计学的新纪元。 现代统计学的代表人物首推比利时统计学家奎特莱(Adolphe Quelet),他将统计分析科学广泛应用于社会科学,自然科学和工程技术科学领域,因为他深信统计学是可以用于研究任何科学的一般研究方法.现代统计学的理论基础概率论始于研究赌博的机遇问题,大约开始于1477年。数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。在概率论进一步发展的基础上,到十九世纪初,数学家们逐渐建立了观察误差理论,正态分布理论和最小平方法则。于是,现代统计方法便有了比较坚实的理论基础。统计学(statistics):收集、处理、分析、解释数据并从数据中得出结论的科学。描述统计(descriptive statistics):研究数据收集、处理和描述的统计学方法。推断统计(inferential statistics):研究如何利用样本数据来推断总体特征的统计学方法。变量(variable):每次观察会得到不同结果的某种特征。分类变量(categorical variable):观测结果表现为某种类别的变量。顺序变量(rank variable):又称有序分类变量,观测结果表现为某种有序类别的变量。数值型变量(metric variable):又称定量变量,观测结果表现为数字的变量。均值(mean):均值也就是平均数,有时特指算术平均数,这是相对其他方式计算的均值,求法是先将所有数字加起来,然后除以数字的个数,这是测量集中趋势,或者说平均数的一种方法。中位数(median):也就是选取中间的数,要找中位数,首先需要从小到大排序,排序后,再看中间的数字是什么。众数(mode):众数也就是数据集中出现频率最多的数字。 [4]     为了将统计学应用到科学,工业以及社会问题上,我们由研究母体开始。这可能是一个国家的人民,石头中的水晶,或者是某家特定工厂所生产的商品。一个母体甚至可能由许多次同样的观察程序所组成;由这种资料收集所组成的母体我们称它叫时间序列。为了实际的理由,我们选择研究母体的子集代替研究母体的每一笔资料,这个子集称做样本。以某种经验设计实验所搜集的样本叫做资料。资料是统计分析的对象,并且被用做两种相关的用途:描述和推论。描述统计学处理有关叙述的问题:资料是否可以被有效的摘要,不论是以数学或是图片表现,以用来代表母体的性质?基础的数学描述包括了平均数和标准差。图像的摘要则包含了许多种的表和图。推论统计学被用来将资料中的数据模型化,计算它的机率并且做出对于母体的推论。这个推论可能以对/错问题的答案所呈现(假设检定),对于数字特征量的估计(估计),对于未来观察的预测,关联性的预测(相关性),或是将关系模型化(回归)。其他的模型化技术包括变异数分析(ANOVA),时间序列,以及数据挖掘。相关的观念特别值得被拿出来讨论。对于资料集合的统计分析可能显示两个变量(母体中的两种性质)倾向于一起变动,好像它们是相连的一样。举例来说,对于人收入和死亡年龄的研究期刊可能会发现穷人比起富人平均来说倾向拥有较短的生命。这两个变量被称做相关的。但是实际上,我们不能直接推论这两个变量中有因果关系;参见相关性推论因果关系(逻辑谬误)。如果样本足以代表母体的,那么由样本所做的推论和结论可以被引申到整个母体之上。最大的问题在于决定样本是否足以代表 整个母体。统计学提供了许多方法来估计和修正样本和收集资料过程中的随机性(误差),如同上面所提到的透过经验所设计的实验。参见实验设计。要了解随机性或是机率必须具备基本的数学观念。数理统计(通常又叫做统计理论)是应用数学的分支,它使用机率论来分析并且验证统计的理论基础。任何统计方法是有效的只有当这个系统或是所讨论的母体满足方法论的基本假设。误用统计学可能会导致描述面或是推论面严重的错误,这个错误可能会影响社会政策,医疗实践以及桥梁或是核能发电计划结构的可靠性。即使统计学被正确的应用,结果对于不是专家的人来说可能会难以陈述。举例来说,统计资料中显著的改变可能是由样本的随机变量所导致,但是这个显著性可能与大众的直觉相悖。人们需要一些统计的技巧(或怀疑)以面对每天日常生活中透过引用统计数据所获得的资讯。测量的尺度统计学一共有四种测量的尺度或是四种测量的方式。这四种测量(名目、顺序、等距、等比)在统计过程中具有不等的实用性 。等比尺度(Ratio measurements)拥有零值及资料间的距离是相等被定义的;等距尺度(Interval measurements)资料间的距离是相等被定义的但是它的零值并非绝对的无而是自行定义的(如智力或温度的测量);顺序尺度( Ordinal measurements)的意义并非表现在其值而是在其顺序之上;名目尺度(Nominal measurements)的测量值则不具量的意义。 以下列出一些有名的统计检定方法以及可供验证实验数据的程序Fisher最小显著差异法(Fisher's Least Significant Difference test )学生t检验(Student's t-test)曼-惠特尼 U 检定(Mann-Whitney U)回归分析(regression analysis)相关性(correlation)皮尔森积矩相关系数(Pearson product-moment correlation coefficient)史匹曼等级相关系数(Spearman's rank correlation coefficient )卡方分布(chi-square )创立时期德国的斯勒兹曾说过:“统计是动态的历史,历史是静态的统计”。可见统计学的产生与发展是和生产的发展、社会的进步紧密相联的。统计学的萌芽产生在欧洲,17世纪中叶至18世纪中叶是统计学的创立时期。在这一时期,统计学理论初步形成了一定的学术派别,主要有国势学派和政治算术学派。
收起全文
精华内容
下载资源
问答
  • 统计学

    万次阅读 2015-12-14 20:16:40
    统计学 在编程过程中,少不了数学的参与。 标准偏差(StdDev,StandardDeviation)-统计学名词。一种量度数据分布的分散程度之标准,用以衡量数据值偏离算术平均值的程度。标准偏差越小,这些值偏离平均值就越少,...

    统计学

          在编程过程中,少不了数学的参与。以下内容主要涉及到统计学中标准差与方差的基本概念与计算方法。不喜勿喷!

          标准偏差(Std Dev,Standard Deviation) -统计学名词。一种量度数据分布的分散程度之标准,用以衡量数据值偏离算术平均值的程度。标准偏差越小,这些值偏离平均值就越少,反之亦然。标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量。

    标准差

          标准差也被称为标准偏差,或者实验标准差,标准差(Standard Deviation)描述各数据偏离平均数的距离(离均差)的平均数,它是离差平方和平均后的方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度,标准偏差越小,这些值偏离平均值就越少,反之亦然。标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量。平均数相同的两个数据集,标准差未必相同。

          例如,A、B两组各有6位学生参加同一次语文测验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67。这两组的平均数都是70,但A组的标准差应该是18.708分,B组的标准差应该是2.37分,说明A组学生之间的差距要比B组学生之间的差距大得多。

    总体标准偏差与样本标准偏差区别

    总体标准偏差:针对总体数据的偏差,所以要平均。

    样本标准偏差:针对从总体抽样,利用样本来计算总体偏差,为了使算出的值与总体水平更接近,就必须将算出的标准偏差的值适度放大,即。 

    样本标准偏差 ,代表所采用的样本X1,X2,...,Xn的均值。

    总体标准偏差 ,代表总体X的均值。

    例:有一组数字分别是200、50、100、200,求它们的样本标准偏差。

     = (200+50+100+200)/4 = 550/4 = 137.5

    =[(200-137.5)^2+(50-137.5)^2+(100-137.5)^2+(200-137.5)^2]/(4-1)

    样本标准偏差 S = Sqrt(S^2)=75 

    计算步骤

    样本标准偏差的计算步骤是:

    步骤一、(每个样本数据 减去样本全部数据的平均值)。

    步骤二、把步骤一所得的各个数值的平方相加。

    步骤三、把步骤二的结果除以 (n - 1)(“n”指样本数目)。

    步骤四、从步骤三所得的数值之平方根就是抽样的标准偏差。

    总体标准偏差的计算步骤是:

    步骤一、(每个样本数据 减去总体全部数据的平均值)。

    步骤二、把步骤一所得的各个数值的平方相加。

    步骤三、把步骤二的结果除以 n (“n”指总体数目)。

    步骤四、从步骤三所得的数值之平方根就是总体的标准偏差。

    方差 统计学意义

          当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小。因此方差越大,数据的波动越大;方差越小,数据的波动就越小。

          样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。

          方差和标准差是测算离散趋势最重要、最常用的指标。方差是各变量值与其均值离差平方的平均数,它是测算数值型数据离散程度的最重要的方法。标准差为方差的算术平方根,用S表示。方差相应的计算公式为 

          标准差与方差不同的是,标准差和变量的计算单位相同,比方差清楚,因此很多时候我们分析的时候更多的使用的是标准差。

          最近进展:方差不仅仅表达了样本偏离均值的程度,更是揭示了样本内部彼此波动的程度,也可以理解为方差代表了样本彼此波动的期望。当然,这个结论目前是在二阶统计矩下成立。

    展开全文
  • 统计学教材

    2017-01-18 20:40:28
    统计学
  • 统计学教材统计学教材统计学教材统计学教材统计学教材统计学教材统计学教材统计学教材统计学教材统计学教材统计学教材统计学教材统计学教材统计学教材统计学教材统计学教材统计学教材统计学教材统计学教材统计学教材...
  • 漫画统计学

    2017-09-21 23:08:26
    漫画统计学 漫画统计学 漫画统计学漫画统计学漫画统计学漫画统计学漫画统计学 漫画统计学漫画统计学漫画统计学
  • 虽然大家公认英国人威廉·配第(1623-1687)发表的《政治算数》是现代统计学的正统,但两千多年前的中国人早就已经娴熟地运用“添兵减灶”这样的“统计学计策”迷惑敌人了。 威廉·配第运用数字、重量、尺度,分析...
  • 深入浅出统计学

    2017-08-18 14:05:06
    统计学
  • 陈希孺院士经典书籍,学习数理统计学的最佳教材! 包括数理统计学简史,数理统计学教程和高等数理统计学 三本专著。 统计学在AI,机器学习等新领域的基本理论,值得好好去研究。
  • freedman统计学

    2018-06-08 00:38:01
    统计学是数据挖掘的基础,本书是freedman的经典统计学教材
  • 统计学精要

    2014-06-29 17:43:16
    统计学精要统计学精要统计学精要统计学精要统计学精要
  • 管理统计学管理统计学管理统计学管管理统计学理管理统计学统计学
  • 统计学书籍

    2018-05-28 13:59:20
    统计学书籍,mendenhall著,以清晰简洁的方式介绍了统计学概念,本书很少涉及理论严格的数学证明,而是给出了大量与实际应用紧密结合的例子和练习
  • 书本教程源码,有注释,有数据,非常适合学习统计学的朋友们来进行下载
  • 应用统计学

    2015-02-24 22:01:56
    应用统计学
  • 应用统计学统计学与社会经济.doc
  • 统计学讲义

    2015-08-29 16:21:40
    关于统计学的培养计划,让统计学的初学者对学习统计学有一个初步了解3371
  • 本软件是为临床医师量身定做的一款简明医学统计学处理软件,界面直观,全傻瓜化操作,即使仅初通统计学也极易上手。内置《医学统计学傻瓜教程》,能使您在数小时内即可学会进
  • 空间统计学

    2018-04-12 22:27:28
    空间统计学讲义,想做空间经济的可以选择下载学习,内容还是不错的,也很简单
  • 医学统计学

    2018-09-14 11:04:08
    《医学统计学》分21章,本次再版侧重于三个方面:第一部分主要介绍医学统计基础理论与基本方法,针对《卫生统计学》多元分析方法薄弱的情况,加强了不同类型资料的回归分析方法与软件结果解释,增加了诊断试验的分析...
  • 白话统计学

    2019-01-31 16:49:05
    本书对统计学原理和术语进行了简洁、清晰而准确的解释,并通过大量实例讲述统计技术的操作方法。书中涵盖了社会科学研究所使用的大部分统计原理和方法,诸如集中趋势、变异程度、正态分布、z分数、标准误等基本概念...
  • 统计学.pdf

    2021-09-27 07:25:39
    统计学.pdf
  • 统计学的应用

    2021-09-02 19:37:33
    统计学的应用
  • 统计学基本概念

    2019-01-09 17:27:28
    统计学基本概念和方法统计学基本概念和方法
  • 统计学知识

    2019-08-05 22:07:00
    统计学知识

    统计学知识

    在这里插入图片描述

    展开全文
  • 王海玲统计学讲义

    2019-02-26 15:49:09
    与视频配套的王海玲统计学讲义,讲解很清晰,统计学考研必备
  • 应用统计学,相当有用的统计学基础理论。 针对统计学基础及应用进行综合论述。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 94,226
精华内容 37,690
关键字:

统计学