精华内容
下载资源
问答
  • 统计学:从数据到结论[M] 吴喜之
  • 吴喜之《统计学:从数据到结论》第四版随书光盘数据
  • 人大吴喜之老师第四版《统计学:从数据到结论》书(pdf)以及用到的数据整合在一起。希望对有需要的同行有所帮助!
  • 统计学:从数据到结论 是国内第一本没有用数学而涉及了几乎所有统计标准课程的模型的教科书。它不是为了教会读者如何流利地背诵一大堆定义、概念和抽象的术语,也不是为了让读者学习如何进行推导和证明一些复杂的...
  • 最完整的:统计学:从数据到结论(第四版)+数据文件(含官网地址),重点是含官网数据文件地址。
  • 统计学:从数据到结论(第四版)
  • 《统计学:从数据到结论》内容简介:不知读者们是否意识到,统计已经渗入到人们的社会、生活、工作等各个领域。每天新闻媒介报道的各个方面都离不开各种统计数据和各种分析与预测。人们可能对于这些统计内容觉得...
  • 本书可用来作为通过统计的数据实践来学习这三种软件的教材。
  • 本书是人大吴喜之老师吴喜之从数据到结论一书的第三版,内容清晰完整,详细介绍的数理统计基础和概念,并详细介绍到了多元统计分析了概念,内容详尽,并配有相应的练习,绝对是一本好书。
  • 统计学从数据到结论(第四版) pdf

    千次阅读 2017-12-18 16:14:46
    统计学入门必看,深入浅出,吴喜之,第四版高清完整版pdf下载电子书,想... 《统计学:从数据到结论(第4版)/全国统计教材编审委员会“十二五”规划教材》每一章的主要部分是用日常语言来引进和解释一些概念,如果可能

    统计学入门必看,深入浅出,吴喜之,第四版高清完整版pdf下载电子书,想参考学习的可以下载哦!

    下载地址:http://download.csdn.net/download/wxfx131813/9169043?utm_source=blogseo

    简介
    《统计学:从数据到结论(第4版)/全国统计教材编审委员会“十二五”规划教材》每一章的主要部分是用日常语言来引进和解释一些概念,如果可能,就通过例子来说明。如果不涉及应用,这部分就足够了。在《统计学:从数据到结论(第4版)/全国统计教材编审委员会“十二五”规划教材》例题的分析中,同时提供简洁明了的软件代码,可以使读者一边看书,一边自己计算,这会给多数想要自己动手分析数据的读者以方便。每章后面的小结中还展示了与概念及计算有关的一些数学公式以及软件的说明,使那些精力充沛的读者能更深刻地理解内容。这种安排使得本教材能够适用于各种不同水平、不同要求的读者群体。

    这里写图片描述

    展开全文
  • 《统计学——从数据到结论》电子书 PPT和数据文件(吴喜之) 第二版 本书主要包括了数据的收集,数据的描述,行变量和列变量的关系:对应分析,机会的度量:概率和分布,相关和回归分析,列联表、方差分析,两组变量...
  • 【编者注】从数据到结论,错误的路有千万条,而正确的路只有一条,引导人迈向正确结论的是数据直觉还是经验?这是一个无从回答的问题,在《超级数字天才》、《超爆魔鬼经济学》、《小趋势》等居多数据科普读物中有...

    【编者注】从数据到结论,错误的路有千万条,而正确的路只有一条,引导人迈向正确结论的是数据直觉还是经验?这是一个无从回答的问题,在《超级数字天才》、《超爆魔鬼经济学》、《小趋势》等居多数据科普读物中有许多颠覆人们直觉认知的数据观点,比如喝酒后开车回家较步行回家要更安全,飞机较汽车要更安全、酷爱葡萄酒的法国人近年来饮用葡萄酒越来越少,导致法国葡萄酒商苦不堪言……如果脱离了场景看这些现象,你会觉得是无稽之谈,而现象的背后到底如何,太多的时候不是拥有数据就能解释的。

    问:统计资料表明.大多数汽车事故出在中等速度的行驶中,极少的事故是出在大于150公里/小时的行驶速度上的。这是否就意味着高速行驶比较安全?
    答:绝不是这样。统计关系往往不能表明因果关系。由于多数人是以中等速度开车,所以多数事故是出在中等速度的行驶中。

    问:统计数字还表明,在亚利桑那州死于肺结核的人比其他州的人多。这是否就意味着亚利桑那州的气候容易生肺病?
    答:正好相反。亚利桑那的气候对害肺病的人有好处,所以肺病患者纷纷前来,自然这就使这个州死于肺结核的平均数升高了。

    问:有一个调查研究说脚大的孩子拼音比脚小的孩子好。这是否是说一个人脚的大小是他拼音能力的度量?
    答:不是的。这个研究对象是一群年龄不等的孩子。它的结果实际上是因为年龄较大的孩子脚大些,他们当然比年幼的男子拼得好些。
    这三个片段着重说明了,在你听到一种统计关系时,切勿轻率地对其因果关系作结论。下面再举几个例子;
    1)常常听说,汽车事故多数发生在离家不远的地方,这是否就意味着在离家很远的公路上行车要比在城里安全些呢?不是,统计只不过反映了人们往往是在离家不远的地方开车,而很少在远处的公路上开车。
    2)有一项研究表明其一个国家的人民,喝牛奶和死于癌症的比例都很高。这是否说明是牛奶引起癌症呢?不!这个国家老年人的比例也很高。由于癌症通常是年龄大的人易得,正是这个因素提高了这个国家癌症死亡者的比例。
    3)一项研究表明在某个城市心力衰竭而死亡的人数和啤酒的消耗量都急剧升高。这是否表示喝啤酒会引起心脏病发作?不!两种情况的增加是人口迅速增加的结果。若按同样的理由,心脏病发作还可见归咎于上百个其他因素,如咖啡消耗量增加,嚼口香糖的人增多,玩桥牌更加盛行,更多的人看电视,等等。
    4)一项研究显示出,欧洲某个城市的人口大量增加,同时鹳鸟窝也大量增加。这是否就支持了鹳鸟送来婴儿这一信念?(欧洲有一种说法,称婴儿是鹳鸟送来的,常用鹳鸟来临表示婴儿降生)。不!它反映的事实是这个城市内的房屋增多,鹳鸟就有更多地盘来筑窝了。
    5)最近一项研究显示,大多数杰出的数学家是大儿子。这是否意味着头生子比以后生的儿子数学才能高些?不!这只是简单地反映出一个事实:大多数的儿子是头生子。
     
    展开全文
  • 吴喜之老师经典的统计学入门教程,第四版扫描版的,字体清晰,重点是包含了数据资源。本版内容都采用了R语言做数据分析。值得学习
  • 统计学基础 非常好的一本基础书籍
  • 《统计学:从数据到结论》 第二章 数据的收集 2.1 数据是怎样得到的 我们用于分析的数据主要分为两大类:观测数据和试验数据。 观测数据:在自然的未被控制的条件下观测到的数据,比如犯罪率,就业率,房价,物价...

    《统计学:从数据到结论》

    第二章 数据的收集

    2.1 数据是怎样得到的

    我们用于分析的数据主要分为两大类:观测数据试验数据
    观测数据:在自然的未被控制的条件下观测到的数据,比如犯罪率,就业率,房价,物价指数等。
    试验数据:在人工干预控制下收集的数据。

    2.2 个体/总体和样本

    这里举一个例子,用来把各个概念串到一起。现在需要了解北京市民对建设北京交通设施是应该以公共交通工具为主,还是小汽车为主的观点收集。例子中单个北京市民称为调查的对象,而他们的观点称为调查的个体,所有市民对这一问题的观点为一个总体,调查时问到的那部分市民观点称谓该总体的一个样本,是总体中的一部分。当然也有可能调查所有人,那叫做普查
    在抽样过程中,如果总体中每一个体都有同等机会被选到样本里,这种抽样称为简单随机抽样,而这样得到的样本称为随机样本
    下面就要提到真伪随机数了,要想在大小为N的总体中产生样本量为n的随机样本常用办法就是利用随机数,其不走为:①先把所有总体的个体编号;②产生n个0到N的随机数;③与如此产生的随机数中编号相同的个体行程样本量为n的简单随机样本。在实际工作中为了方便快捷,我们有时候也会使用计算机生成的伪随机数
    实践当中,得到随机样本并不容易。很多调查只能使用简单的方法。还以调查北京交通问题为例,可以选择电话号码进行随机调查,但这并不是随机样本,有人没有电话,有人有多个电话,每个电话被接听的概率不一样。这一类样本称为方便样本

    真伪随机数

    下面对真伪随机数做一些比较和自我理解:
    真正的随机数是使用物理现象产生的:比如掷钱币、骰子、转轮、使用电子元件的噪音、核裂变等等,这样的随机数发生器叫做物理性随机数发生器,它们的缺点是技术要求比较高。
    而计算机中的随机函数是按照一定算法模拟产生的,其结果是确定的,是可见的。我们可以这样认为这个可预见的结果其出现的概率是100%。所以用计算机随机函数所产生的“随机数”并不随机,是伪随机数
    随机数是无规律的,不循环的,不可复现的,这三个特点是与伪随机数最大的差别。而因为现实中的编号往往符合某种规律,所以若此规律与伪随机数的规律部分重合或者相关,就会失去样本选择的随机性。这也是为什么真随机数难以产生,还依然在被部分应用的原因。

    写在最后

    这一系列相当于是《统计学:从数据到结论》的总结和读后感,有一些自己的理解和想法,想仔细研究的同学建议读原版教材。

    展开全文
  • 学习书籍:《统计学:从数据到结论》-吴喜之; 参考书目:《统计学》-贾俊平 一些统计学的基本概念 啥是统计学? 按照不列颠百科全书关于统计学的定义,统计学是"收集、分析、展示和解释数据的科学"。其研究方法是...

    学习笔记
    学习书籍:《统计学:从数据到结论》-吴喜之;
    参考书目:《统计学》-贾俊平


    一些统计学的基本概念


    啥是统计学?

    按照不列颠百科全书关于统计学的定义,统计学是"收集、分析、展示和解释数据的科学"。其研究方法是:观测世界或进行试验,得到数据,提出可以解释这些观测的假说或理论,试图尽可能地接近现实世界的规律,当出现理论或假说无法解释的现象(数据)时,就有可能需要对原有的理论进行修正或者代之以新理论。统计学的假说或理论通常称之为模型。统计学的模型仅仅是对现实的近似,没有任何模型是"正确"的,也无法证明任何模型是正确的。只能说,在某些可能有争议的准则下,某些模型比另一些要更合适。在数学逻辑中存在的准确性在统计中完全不成立。针对于不同学科问题而发展的统计学中的数学完全不成为一个完整封闭的体系,也没有必要成为一个数学体系。能否解决实际问题是评价统计方法的最终准则。

    啥是变量?

    变量是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或变化。比如说,一个班上注册的学生有50人,这是一个固定的数目,我们称之为常数常量。但如果猜测明天这个班有多少人来上课,这就具有了随机性,可能会有人逃课,可能会有人请病假,这样,要来上课的人数就是个变量。变量也分为:分类变量、顺序变量、数值型变量。

    变量间的关系

    现实世界的问题都是相互联系的,不讨论变量之间的关系,就无从谈起任何有深度的应用,没有应用,统计的基本概念就仅仅是摆设而已。这里有必要说明,日常用语中的"关系"一词是没有严格统计定义的,统计术语"相关"试图用统计语言来描述一些关系,但目前的统计相关仅仅描述了日常所说的关系的很小一部分,这就好像宇宙是无穷的,而人类的科学理论或假说只能覆盖一小部分一样。

    因果关系

    我们来观察一下,图中的x和y是否有关系:

    看起来,它们是有关系的。y随着x的增加而增加。那么是否可以说x和y存在因果关系呢?

    这个问题可能永远不能得到准确答案,实际上,y 的增加可能是多个因素的影响,而不仅仅是x的影响,比如x为广告投入,y为财政收入,财政收入的增加不仅仅是受到广告投入增加的影响,而且可能是由于成本的降低、国家经济环境改善等等原因的共同结果; 更何况可能x根本起不到多大作用,这种关系仅仅是巧合而已,比如x为我近几年的发际线高度,y为国家经济增长,我不能说是由于与我的发际线增高了,国家经济发展就增加了。所以说,变量之间有关系这个事实并不代表一定存在着因果关系。

    统计、计算机与统计软件

    统计软件的发展,也使得统计从统计学家的圈内游戏变成了大众的游戏,只要你输入数据,点几下鼠标,做几个选项,就会得到让人惊叹的结果。这时,人们可能会问,是否傻瓜式统计软件的使用可以替代统计课程了?当然不是!数据的整理与识别,方法的选用,计算机的输出结果的理解都不像使用傻瓜相机那样简单。更何况统计软件输出结果太多,即使是相同的方法,不同的软件输出的内容还不大一样,这就使使用者大伤脑筋,即使是统计学家也不一定能理解所有输出结果。

    现代应用统计离不开计算机,对于非统计工作者来说,顺手的使用统计软件十分重要,同时也要清醒的认识到,计算机是人类的助手,但代替不了人的思维

    展开全文
  • 学习书籍:《统计学:从数据到结论》-吴喜之; 参考书目:《统计学》-贾俊平; 几个基本概念 原假设:提出一个(或两个)参数是否等于(或大于等于、小于等于)某个特殊值的命题。 备择假设:与原假设逻辑相反的假设。...
  • 学习书籍:《统计学:从数据到结论》-吴喜之; 参考书目:《统计学》-贾俊平 总体 如果我们想抽样调查马鞍山市民对于建地铁的观点,那么此时,单个马鞍山市民被称为调查的对象,单个马鞍山市民的观点(对于建地铁的...
  • 学习书籍:《统计学:从数据到结论》-吴喜之; 参考书目:《统计学》-贾俊平 用估计量估计总体参数 我们都知道样本的函数称之为统计量,而用于估计的统计量则被称为估计量。由于统计量对于不同的样本取值不同,所以...
  • 收集数据,利用一些方法来整理和分析数据,最后通过分析来得到结论。 统计学的假说或理论通常称为模型。 统计学是“收集,分析,展示和解释数据的科学”。 1.2 现实中的随机性和规律性,概率和机会 一个样本的...
  •  从数据得到关于现实世界的结论的过程就叫做统计推断,估计是统计推断的重要内容之一,统计推断的另一个主要内容是假设检验。  在利用样本中的信息来对总体参数进行推断之前,人们往往对代表总体的变量假定了...
  •  假定原先数据是二维观测值,在一个二维坐标系中,这些数据点形成一个有椭圆形轮廓的点阵,这个椭圆有两条轴,一条长轴和一条短轴,互相垂直,长轴承担了数据比较多的变化,代表了数据包含的大部
  • 第十一章 聚类分析  聚类是一个把数据对象集划分成多个组或簇的...大部分划分方法是基于距离的,给定要构建的分区数k,首先创建一个初始划分,然后采用一种迭代的重定位技术,通过把对象一个组移动另一个组来
  •  列联表是观测数据按两个或更多属性分类时所列出的频数表,如图是一个三维的列联表,每一个数字代表相应的水平组合出现的频数。 卡方检验  研究列联表的一个主要目的就是看这些变量是否相关,零...
  • 我们通过总体中抽出的随机样本来计算适当的统计量来检验一个假设,如果我们得到的统计量的实现值在假设为真时是小概率事件,那我们有理由拒绝这个假设。  在假设检验中,先要设立一个原假设,利用人们掌握的反映...
  •  最小二乘法:使用来做线性回归的最常用方法,寻找一条直线使得所有点该直线的竖直距离,也就是按因变量方向的距离的平方和最小。    当选定一个模型时,不应所有的变量都显著,这时有一种逐步回归的方法...
  •  其实,总的来说,这些检验,Z检验、t检验、χ²检验、F检验,要做的事情是一样的,就是要做用样本估计总体的假设检验,不同的是(1)要满足的数据条件不同;(2)选用的统计量不同,有不同的分布。
  • 第一章 概念:统计学(statistics)是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。统计软件:SPSS:这是一个很受欢迎的统计软件;它容易操作,输出漂亮,功能齐全,价格合理。对于非统计工作者...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,236
精华内容 494
关键字:

从数据到结论