统计学 订阅
统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识,其应用范围几乎覆盖了社会科学和自然科学的各个领域。 [1] 展开全文
统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识,其应用范围几乎覆盖了社会科学和自然科学的各个领域。 [1]
信息
学科门类
一级学科
外文名
Statistics
学科特点
应用广泛
中文名
统计学
主要分支
社会统计学、数理统计学 [2]
统计学发展过程
统计学的英文statistics最早源于现代拉丁文Statisticum Collegium(国会)、意大利文Statista(国民或政治家)以及德文Statistik,最早是由Gottfried Achenwall于1749年使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。十九世纪,统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里士多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”、“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说,它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而是属于数学的范畴。“城邦政情”(Matters of state)阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十余种纪要,其内容包括各城邦的历史、行政、科学、艺术、人口、资源和财富等社会和经济情况的比较、分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算术”这个名词所替代,并且很快被演化为“统计学”(Statistics)。但统计学依然保留了城邦(state)这个词根。 与“城邦政情”阶段没有很明显的分界点,本质的差别也不大。“政治算术”的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。1690年英国威廉·配弟出版《政治算数》一书作为这个阶段的起始标志。威廉·配第用数字、重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此,威廉·配第的《政治算术》被后来的学者评价为近代统计学的来源,威廉·配第本人也被评价为近代统计学之父。配第在书中使用的数字有三类:第一类是对社会经济现象进行统计调查和经验观察得到的数字。因为受历史条件的限制,书中通过严格的统计调查得到的数据少,根据经验得出的数字多;第二类是运用某种数学方法推算出来的数字。其推算方法可分为三种:(1)以已知数或已知量为基础,循著某种具体关系进行推算的方法;(2)通过运用数字的理论性推理来进行推算的方法;(3)以平均数为基础进行推算的方法”;第三类是为了进行理论性推理而采用的例示性的数字。配第把这种运用数字和符号进行的推理称之为“代数的算法”。从配第使用数据的方法看,“政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点,统计实证方法和理论分析方法浑然一体,这种方法即使是现代统计学也依然继承。 [3]  在“政治算术”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。十九世纪末,欧洲大学开设的“国情纪要”或“政治算数”等课程名称逐渐消失,代之而起的是“统计分析科学”课程。当时的“统计分析科学”(Science of statistical analysis)课程的内容仍然是分析研究社会经济问题。“统计分析科学”课程的出现是现代统计发展阶段的开端。1908年,“学生”氏(William Sleey Gosset的笔名Student)发表了关于t分布的论文。这是一篇在统计学发展史上划时代的文章,它创立了小样本代替大样本的方法,开创了统计学的新纪元。 现代统计学的代表人物首推比利时统计学家奎特莱(Adolphe Quelet),他将统计分析科学广泛应用于社会科学,自然科学和工程技术科学领域,因为他深信统计学是可以用于研究任何科学的一般研究方法.现代统计学的理论基础概率论始于研究赌博的机遇问题,大约开始于1477年。数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。在概率论进一步发展的基础上,到十九世纪初,数学家们逐渐建立了观察误差理论,正态分布理论和最小平方法则。于是,现代统计方法便有了比较坚实的理论基础。统计学(statistics):收集、处理、分析、解释数据并从数据中得出结论的科学。描述统计(descriptive statistics):研究数据收集、处理和描述的统计学方法。推断统计(inferential statistics):研究如何利用样本数据来推断总体特征的统计学方法。变量(variable):每次观察会得到不同结果的某种特征。分类变量(categorical variable):观测结果表现为某种类别的变量。顺序变量(rank variable):又称有序分类变量,观测结果表现为某种有序类别的变量。数值型变量(metric variable):又称定量变量,观测结果表现为数字的变量。均值(mean):均值也就是平均数,有时特指算术平均数,这是相对其他方式计算的均值,求法是先将所有数字加起来,然后除以数字的个数,这是测量集中趋势,或者说平均数的一种方法。中位数(median):也就是选取中间的数,要找中位数,首先需要从小到大排序,排序后,再看中间的数字是什么。众数(mode):众数也就是数据集中出现频率最多的数字。 [4]     为了将统计学应用到科学,工业以及社会问题上,我们由研究母体开始。这可能是一个国家的人民,石头中的水晶,或者是某家特定工厂所生产的商品。一个母体甚至可能由许多次同样的观察程序所组成;由这种资料收集所组成的母体我们称它叫时间序列。为了实际的理由,我们选择研究母体的子集代替研究母体的每一笔资料,这个子集称做样本。以某种经验设计实验所搜集的样本叫做资料。资料是统计分析的对象,并且被用做两种相关的用途:描述和推论。描述统计学处理有关叙述的问题:资料是否可以被有效的摘要,不论是以数学或是图片表现,以用来代表母体的性质?基础的数学描述包括了平均数和标准差。图像的摘要则包含了许多种的表和图。推论统计学被用来将资料中的数据模型化,计算它的机率并且做出对于母体的推论。这个推论可能以对/错问题的答案所呈现(假设检定),对于数字特征量的估计(估计),对于未来观察的预测,关联性的预测(相关性),或是将关系模型化(回归)。其他的模型化技术包括变异数分析(ANOVA),时间序列,以及数据挖掘。相关的观念特别值得被拿出来讨论。对于资料集合的统计分析可能显示两个变量(母体中的两种性质)倾向于一起变动,好像它们是相连的一样。举例来说,对于人收入和死亡年龄的研究期刊可能会发现穷人比起富人平均来说倾向拥有较短的生命。这两个变量被称做相关的。但是实际上,我们不能直接推论这两个变量中有因果关系;参见相关性推论因果关系(逻辑谬误)。如果样本足以代表母体的,那么由样本所做的推论和结论可以被引申到整个母体之上。最大的问题在于决定样本是否足以代表 整个母体。统计学提供了许多方法来估计和修正样本和收集资料过程中的随机性(误差),如同上面所提到的透过经验所设计的实验。参见实验设计。要了解随机性或是机率必须具备基本的数学观念。数理统计(通常又叫做统计理论)是应用数学的分支,它使用机率论来分析并且验证统计的理论基础。任何统计方法是有效的只有当这个系统或是所讨论的母体满足方法论的基本假设。误用统计学可能会导致描述面或是推论面严重的错误,这个错误可能会影响社会政策,医疗实践以及桥梁或是核能发电计划结构的可靠性。即使统计学被正确的应用,结果对于不是专家的人来说可能会难以陈述。举例来说,统计资料中显著的改变可能是由样本的随机变量所导致,但是这个显著性可能与大众的直觉相悖。人们需要一些统计的技巧(或怀疑)以面对每天日常生活中透过引用统计数据所获得的资讯。测量的尺度统计学一共有四种测量的尺度或是四种测量的方式。这四种测量(名目、顺序、等距、等比)在统计过程中具有不等的实用性 。等比尺度(Ratio measurements)拥有零值及资料间的距离是相等被定义的;等距尺度(Interval measurements)资料间的距离是相等被定义的但是它的零值并非绝对的无而是自行定义的(如智力或温度的测量);顺序尺度( Ordinal measurements)的意义并非表现在其值而是在其顺序之上;名目尺度(Nominal measurements)的测量值则不具量的意义。 以下列出一些有名的统计检定方法以及可供验证实验数据的程序Fisher最小显著差异法(Fisher's Least Significant Difference test )学生t检验(Student's t-test)曼-惠特尼 U 检定(Mann-Whitney U)回归分析(regression analysis)相关性(correlation)皮尔森积矩相关系数(Pearson product-moment correlation coefficient)史匹曼等级相关系数(Spearman's rank correlation coefficient )卡方分布(chi-square )创立时期德国的斯勒兹曾说过:“统计是动态的历史,历史是静态的统计”。可见统计学的产生与发展是和生产的发展、社会的进步紧密相联的。统计学的萌芽产生在欧洲,17世纪中叶至18世纪中叶是统计学的创立时期。在这一时期,统计学理论初步形成了一定的学术派别,主要有国势学派和政治算术学派。
收起全文
精华内容
参与话题
问答
  • 统计学

    万次阅读 2015-12-14 20:16:40
    统计学 在编程过程中,少不了数学的参与。 标准偏差(StdDev,StandardDeviation)-统计学名词。一种量度数据分布的分散程度之标准,用以衡量数据值偏离算术平均值的程度。标准偏差越小,这些值偏离平均值就越少,...

    统计学

          在编程过程中,少不了数学的参与。以下内容主要涉及到统计学中标准差与方差的基本概念与计算方法。不喜勿喷!

          标准偏差(Std Dev,Standard Deviation) -统计学名词。一种量度数据分布的分散程度之标准,用以衡量数据值偏离算术平均值的程度。标准偏差越小,这些值偏离平均值就越少,反之亦然。标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量。

    标准差

          标准差也被称为标准偏差,或者实验标准差,标准差(Standard Deviation)描述各数据偏离平均数的距离(离均差)的平均数,它是离差平方和平均后的方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度,标准偏差越小,这些值偏离平均值就越少,反之亦然。标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量。平均数相同的两个数据集,标准差未必相同。

          例如,A、B两组各有6位学生参加同一次语文测验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67。这两组的平均数都是70,但A组的标准差应该是18.708分,B组的标准差应该是2.37分,说明A组学生之间的差距要比B组学生之间的差距大得多。

    总体标准偏差与样本标准偏差区别

    总体标准偏差:针对总体数据的偏差,所以要平均。

    样本标准偏差:针对从总体抽样,利用样本来计算总体偏差,为了使算出的值与总体水平更接近,就必须将算出的标准偏差的值适度放大,即。 

    样本标准偏差 ,代表所采用的样本X1,X2,...,Xn的均值。

    总体标准偏差 ,代表总体X的均值。

    例:有一组数字分别是200、50、100、200,求它们的样本标准偏差。

     = (200+50+100+200)/4 = 550/4 = 137.5

    =[(200-137.5)^2+(50-137.5)^2+(100-137.5)^2+(200-137.5)^2]/(4-1)

    样本标准偏差 S = Sqrt(S^2)=75 

    计算步骤

    样本标准偏差的计算步骤是:

    步骤一、(每个样本数据 减去样本全部数据的平均值)。

    步骤二、把步骤一所得的各个数值的平方相加。

    步骤三、把步骤二的结果除以 (n - 1)(“n”指样本数目)。

    步骤四、从步骤三所得的数值之平方根就是抽样的标准偏差。

    总体标准偏差的计算步骤是:

    步骤一、(每个样本数据 减去总体全部数据的平均值)。

    步骤二、把步骤一所得的各个数值的平方相加。

    步骤三、把步骤二的结果除以 n (“n”指总体数目)。

    步骤四、从步骤三所得的数值之平方根就是总体的标准偏差。

    方差 统计学意义

          当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小。因此方差越大,数据的波动越大;方差越小,数据的波动就越小。

          样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。

          方差和标准差是测算离散趋势最重要、最常用的指标。方差是各变量值与其均值离差平方的平均数,它是测算数值型数据离散程度的最重要的方法。标准差为方差的算术平方根,用S表示。方差相应的计算公式为 

          标准差与方差不同的是,标准差和变量的计算单位相同,比方差清楚,因此很多时候我们分析的时候更多的使用的是标准差。

          最近进展:方差不仅仅表达了样本偏离均值的程度,更是揭示了样本内部彼此波动的程度,也可以理解为方差代表了样本彼此波动的期望。当然,这个结论目前是在二阶统计矩下成立。

    展开全文
  • 统计学上的P值的含义通俗

    万次阅读 2016-05-19 14:30:52
    首先解释下“有统计学意义”和“显著差异” 两个概念:”有统计学意义"和"差异显著"是两个不同的概念,"差异显著"易给人一种误导,原来两概念在统计学中经常有点通用,现在明确地只能用“有...

    欢迎关注本人:

    推荐系统公众号:Tiany_RecoSystem

    知乎主页:https://www.zhihu.com/people/shen-xiao-ming-77

    首先解释下“有统计学意义”和“显著差异” 两个概念:

     

    ”有统计学意义"和"差异显著"是两个不同的概念,"差异显著"易给人一种误导,
    原来两概念在统计学中经常有点通用,现在明确地只能用“有统计学意义”。
    P<0.05是指假设H0(即两总体没区别)成立的可能性概率在5%以下,
    a就是允许犯Ⅰ类错误(拒绝了正确的无效假设H0)的概率,
    一般在做假设检验之前先定好,
    如果a=0.05,表示允许犯Ⅰ类错误的概率为0.05,所以当P<0.05时,
    说明在a=0.05允许的范围内,认为两总体是有差异的,
    即两总体差异有统计学意义(指在a=0.05的统计学参数情况下);
    如果此时P=0.04,而先设定a=0.01,则认为两总体差异无统计学意义
    (指在a=0.01的统计学参数情况下),虽然两总体没变,两总体差异也没变;
    所以 ”有统计学意义"并不等同于"差异显著" ,举个例子:两组数:
    A组:3, 3.05, 3.01, 3.04, 2.95;
    B组:3.2, 3.1, 3.15, 3.14, 3.12;
    两组数差异(均数)并不大,但P<0.001,设定a=0.01或0.05,则认为两总体差异统计学意义。这主要与两组数的标准差有关。
    如果写成两总体差异显著,易认为两组数(均数)差别大。

    第一类错误与第二类错误 通俗解释
     
    H0:一个真心爱你的男生
    H1:一个不是真心爱你的男生
    如果H0实际上成立,而你凭经验拒绝了H0,也就是说,
    你拒绝了一个你认为不爱你而实际上真心爱你的男生,那么你就犯了第Ⅰ类错误;
    如果H0实际上不成立,而你接受了H0,同样的道理,
    你接受了一个你感觉爱你而实际上并不爱你的男生,那么你就犯了第Ⅱ类错误。
    如果要同时减小犯第Ⅰ类错误和第Ⅱ类错误的概率,那就只能增加恋爱的次数n,
    比如一个经历过n=100次恋爱的女生,第101次恋爱犯第Ⅰ类错误和第Ⅱ类错误的概率就会小很多了。

     


    统计学上把保守的、传统的观点作为原假设H0, 新颖的、感兴趣的、想去论证的观点作为备择假设H1

    统计学P值与显著性水平之间的比较
     就好比一个犯罪嫌疑人 在没有确凿的证据前都只能以他无罪为原假设
    因为一个人无罪判他有罪 比 有罪判无罪 的后果严重的多 大家都不愿被冤枉
    所以推广开来 你想证明一班的成绩比二班好 原假设就设为一班二班成绩相同,
    其中出现的个别成绩有差异,是由于抽样误差所造成的,纯在偶然性;
     备择假设就设为一班比二班成绩好,其中样本中出现的一班二班成绩差异不是偶然出现的,
    具有高度统计学意义,
    因此, 一般把显著性水平设定为0.05,当P值小于0.05时, 我们认为因为偶然性而造成的成绩差异的概率比较小,
    因此拒绝原假设,就可以接受一班成绩比二班好的事实;
    若P值比0.05大就说明没有足够证据证明一班成绩比二班好,原假设中因为抽样误差而造成的成绩差异的可能性比较高,
     保守起见拒绝备择假设 接受原假设。
     

     

    展开全文
  • 漫画统计学

    2017-09-21 23:08:26
    漫画统计学 漫画统计学 漫画统计学漫画统计学漫画统计学漫画统计学漫画统计学 漫画统计学漫画统计学漫画统计学
  • 陈希孺院士经典书籍,学习数理统计学的最佳教材! 包括数理统计学简史,数理统计学教程和高等数理统计学 三本专著。 统计学在AI,机器学习等新领域的基本理论,值得好好去研究。
  • 虽然大家公认英国人威廉·配第(1623-1687)发表的《政治算数》是现代统计学的正统,但两千多年前的中国人早就已经娴熟地运用“添兵减灶”这样的“统计学计策”迷惑敌人了。 威廉·配第运用数字、重量、尺度,分析...
  • 统计学讲义

    2015-08-29 16:21:40
    关于统计学的培养计划,让统计学的初学者对学习统计学有一个初步了解3371
  • 统计学由浅入深

    2018-06-01 09:20:38
    一本讲统计学的数适合初学者从概率到统计由浅入深,如果想学习可以下载
  • 商务统计学

    2018-05-01 20:24:20
    商务统计学,因为挺难找的,所以传上来了,希望能够帮助到大家
  • 本软件是为临床医师量身定做的一款简明医学统计学处理软件,界面直观,全傻瓜化操作,即使仅初通统计学也极易上手。内置《医学统计学傻瓜教程》,能使您在数小时内即可学会进
  • 统计学基础

    2018-05-17 14:51:06
    统计的基本知识,是学习统计的基础,很有实用价值,是不错的统计学电子书。
  • 空间统计学

    2018-04-12 22:27:28
    空间统计学讲义,想做空间经济的可以选择下载学习,内容还是不错的,也很简单
  • 医学统计学

    2018-09-14 11:04:08
    《医学统计学》分21章,本次再版侧重于三个方面:第一部分主要介绍医学统计基础理论与基本方法,针对《卫生统计学》多元分析方法薄弱的情况,加强了不同类型资料的回归分析方法与软件结果解释,增加了诊断试验的分析...
  • 数理统计学简史

    2018-02-07 09:49:02
    数理统计学简史 数理统计学简史 数理统计学简史 数理统计学简史
  • <统计学>统计学开篇

    2019-09-26 19:43:25
    我们或多多少都接触学习过统计学,可统计学到底是一种什么样的学科呢? 我们将统计学定义为:对数据进行收集、整理、展示、分析和解释,以帮助人们更有效地进行决策的科学。 关于统计学的研究通常分为两类:...

     

    我们或多多少都接触学习过统计学,可统计学到底是一种什么样的学科呢?

    • 我们将统计学定义为:对数据进行收集、整理、展示、分析和解释,以帮助人们更有效地进行决策的科学。

    关于统计学的研究通常分为两类:描述统计学和推断统计学。

    1. 描述统计学:以某种便于提供信息的方式对数据进行整理、概括和展示的方法。
    2. 推断统计学:在样本的基础上对总体的某些性质进行估计的方法。

    下面给出了总体样本的定义。

    1. 总体:所研究的个人、事物或者来自个人、事物度量值的全部集合。
    2. 个体:所研究总体的一部分。

    接下来我们介绍一下统计学中经常出现的名词——变量

    变量有两个基本类型:定性变量和定量变量。当所研究的变量特征是非数值的,则称为定性变量或者属性变量;当所研究的变量可以用数值表示时,就称为定量变量。定量变量又分为离散型和连续型。离散变量只能取某些特定的值,且不同取值之间存在一定的“间隙”。连续变量的观测值可以取某一区间的任何值。

    数据还可以按照测量尺度进行分类。数据的测量尺度直接决定着对数据进行整理和描述时所用的计算方法,以及进行统计检验所采用的方法。

    实际上有四种测量尺度:名义、顺序、间隔和比率。

    • 名义尺度数据

    利用名义尺度进行测量时,定性变量之间没有特定的顺序标志,只能进行分类和计数运算。

    • 顺序尺度数据

    顺序尺度比名义尺度高一个层次,分类数据可以被分等级或者被排序。

    • 间隔尺度数据

    间隔尺度比顺序尺度又高了一个层次,数值之间的差是有意义的。

    • 比率尺度数据

    比率尺度是最高层次的测量尺度,事实上,说有的定量数据都是比率尺度数据,数值之间的比率是有意义的。

     

                                                                                                                                                                                                                                                                                            2019-09-19

     

    转载于:https://www.cnblogs.com/blogsofzxf/p/11552370.html

    展开全文
  • 白话统计学

    2019-01-31 16:49:05
    本书对统计学原理和术语进行了简洁、清晰而准确的解释,并通过大量实例讲述统计技术的操作方法。书中涵盖了社会科学研究所使用的大部分统计原理和方法,诸如集中趋势、变异程度、正态分布、z分数、标准误等基本概念...
  • 生物统计学

    2018-08-13 03:28:50
    生物统计(shengwu tongji,biostatistics,biometry,biometrics)含义 应用于中的数理统计方法。即用数理统计的原理和方法,分析...凯特莱,他试图把统计学的理论应用于解决生物学、医学和社会学中的问题。-----陆建身
  • 生物统计学算法-生物统计学.pdf 生物统计学 理论部分,算法靠它了~!
  • 统计学基本概念

    2019-01-09 17:27:28
    统计学基本概念和方法统计学基本概念和方法
  • 统计学知识

    2019-08-05 22:07:00
    统计学知识

    统计学知识

    在这里插入图片描述

    展开全文
  • 王海玲统计学讲义

    2019-02-26 15:49:09
    与视频配套的王海玲统计学讲义,讲解很清晰,统计学考研必备

空空如也

1 2 3 4 5 ... 20
收藏数 17,938
精华内容 7,175
关键字:

统计学