-
2021-08-02 09:58:01
《卫生统计学四种随机抽样方法》由会员分享,可在线阅读,更多相关《卫生统计学四种随机抽样方法(2页珍藏版)》请在人人文库网上搜索。
1、卫生统计学:四种基本的抽样方法1.单纯随机抽样:单纯随机抽样是在总体中以完全随机的方法抽取一部分观察单位组成样本(即每个观察单位有同等的概率被选入样本)。常用的办法是先对总体中全部观察单位编号,然后用抽签、随机数字表或计算机产生随机数字等方法从中抽取一部分观察单位组成样本。其优点是简单直观,均数(或率)及其标准误的计算简便;缺点是当总体较大时,难以对总体中的个体一一进行编号,且抽到的样本分散,不易组织调查。2.系统抽样:系统抽样又称等距抽样或机械抽样,即先将总体中的全部个体按与研究现象无关的特征排序编号;然后根据样本含量大小,规定抽样间隔k;随机选定第i(ik)号个体开始,每隔一个k,抽取一个。
2、个体,组成样本。系统抽样的优点是:易于理解,简便易行;容易得到一个在总体中分布均匀的样本,其抽样误差小于单纯随机抽样。缺点是:抽到的样本较分散,不易组织调查;当总体中观察单位按顺序有周期趋势或单调增加(减小)趋势时,容易产生偏倚。3.整群抽样:整群抽样是先将总体划分为K个“群”,每个群包含若干个观察单位,再随机抽取k个群(kK),由抽中的各群的全部观察单位组成样本。整群抽样的优点是便于组织调查,节省经费,容易控制调查质量;缺点是当样本含量一定时,抽样误差大于单纯随机抽样。4.分层抽样:分层抽样是先将总体中全部个体按对主要研究指标影响较大的某种特征分成若干“层”,再从每一层内随机抽取一定数量的观察单位组成样本。分层随机抽样的优点是样本具有较好的代表性,抽样误差较小,分层后可根据具体情况对不同的层采用不同的抽样方法。四种抽样方法的抽样误差大小一般是:整群抽样单纯随机抽样系统抽样分层抽样。
更多相关内容 -
常见概率抽样方法及其适用场景总结(简单随机抽样、分层抽样、整群抽样、系统抽样)
2022-04-06 19:54:33主要介绍简单随机抽样 、分层抽样 、整群抽样 、系统抽样 以及多级抽样这五种概率抽样方法。 1. 简单随机抽样 > 简单随机抽样(simple random sampling ,SRS)是最简单的概率抽样方 法 ,也是其他抽样方法的基础 ...常见概率抽样
抽样一般分为
概率抽样
和非概率抽样
两大类,本文主要讨论概率抽样
。所谓
概率抽样
,是指按照一定的概率
从构成总体的所有单元中随机选择一部分单元进入样本的抽样方法。主要介绍简单随机抽样 、分层抽样 、整群抽样 、系统抽样 以及多级抽样这五种概率抽样方法。
1. 简单随机抽样
简单随机抽样(simple random sampling ,SRS)是最简单的概率抽样方 法 ,也是其他抽样方法的基础 。
方法:从一个单元数为 N 的总体中逐个抽取单元并且无放回 ,每次都在所有尚未进入样本的单元中等概率地抽取 ,直到 n个单元抽完。
适用场景:
- 当总体N较小
- 总体方差S2与任意局部方差基本相当的情况;
2. 分层抽样
分层抽样(stratified sampling)是指先按照某种规则把总体划分为不同的层 ,然后在层内再进行抽样 ,各层的抽样之间是独立进行的 。
特别地 ,如果各层内是
简单随机抽样
,则称为分层随机抽样 。分层抽样的估计是
先在各层内进行的
,再由各层的估计量进行加权平均或求和
,从而得出总体的估计量 。适用场景:
- 适用于层间有较大的异质性,
- 每层内的个体具有同质性的总体;
3. 整群抽样
整群抽样(cluster sampling)是指
先把总体中的个体划分成称作群
的单个组,总体中的每一个个体属于且仅属于某一群。以群为单位抽取一个简单随机样本。当群中的个体不同质时,整群抽样得到的结果最佳。
在理想状态下,每一群是整个总体小范围内的代表。
整群抽样的值
依赖于每一群对整个总体的代表性
。如果所有的群在这个意义上是同质的,则抽取小量的群就可以得到关于总体参数的好的估计。适用场景:适用于群间差异小、群内各个体差异大、可以依据某种特征差异来划分的群体;
4.系统抽样
系统抽样(systematic sampling)是指
先将总体中的抽样单元按某种次序排列
,在规定范围内随机抽取一个初始单元 ,然后按事先规定的规则抽取其他样本单元 。特别地 ,如果在抽取初始单元后按相等的间距抽取其余样本单元 ,则称为等距抽样 。
适用场景:适用于容量很大且个体的排列是按照随机顺序排列的总体;
5. 多级抽样
多级抽样(multi-stage sampling)可以看作整群抽样的发展 ,在抽得初级抽样单元后 ,并不调查其全部次级单元 ,而是再进行抽样 , 从入选的初级单元中抽选次级单元 ,这种抽样方法称为二阶段抽样 。
二阶段的第一阶段指抽取初级单元 ,第二阶段是指抽取次级单元(在二阶段抽样中,也就是基本抽样单元)。
类似地 ,可以定义三阶段抽样 :先抽取初级单元 ,在其中继续抽取次级单元 ,在抽中的次级单元中再抽取三级单元(基本单元)。依此类推 ,可定义四阶段抽样等 。二阶及二阶以上抽样统称为多级抽样 。
适用场景:适用于分布情况复杂,不易从总体中直接抽取调查单位作为样本的情况;
————————————————
-
简单随机抽样的样本估计量
2015-03-12 21:38:34统计分析中常用的抽样方法之一,帮助你迅速学习基本的抽样理论方法。 -
数理统计学中随机抽样的应用研究
2021-07-03 07:30:32摘要:为了研究随机抽样在实际生产生活中的应用,本文分析了随机抽样在各个领域的重要性,对随机抽样的概念及操作步骤、方法进行了详细阐述,最后研究了随机抽样的步骤,举例说明了随机抽样应用的广泛性。...摘要:为了研究随机抽样在实际生产生活中的应用,本文分析了随机抽样在各个领域的重要性,对随机抽样的概念及操作步骤、方法进行了详细阐述,最后研究了随机抽样的步骤,举例说明了随机抽样应用的广泛性。
关键字:随机抽样;应用研究;概念
0 引言
在现实生活中,数理统计学无时无刻不在身边,工程机械、经济统计、社会科学、自然科学、科学实验等领域,应用及其广泛。经过数据采集、数据统计及数据计算,数理统计的目的就是对数据的深度挖掘,发现数据内部联系,然后进行科学研究,对生活、生产具有指导意义。在科学研究中,对数据的研究不可能面面俱到,只能通过随机抽样总结整体规律,因此,随机抽样在数理统计中扮演着重要角色,透过部分数据反映总体特征,透过现象看本质,对其应用研究具有重要意义。
1 数理统计学中的随机抽样
从总体中选取一部分样本进行分析,推断总体特征的方法为随机抽样方法。其对其他方法的不同之处是带有随机性,能从一定程度上反映总体情况,具有一定代表性。理论上讲,对随机现象观察足够次数,就能清楚地知道总体的统计规律。但实际上,由于样本容量的限制,仅有少量观测,并不能清楚表达统计规律。这就需要一种有效的统计方法去解决这一问题,从而得到正确结论。因此,进行随机抽样时尽量做到以下几点:第一,根据实验目的进行采集数据,并尽量采集质量较高的数据,其质量的好坏直接影响统计推断;第二,数据处理时注意对数据的标准化、最大值及最小值影响、对数化、去噪等步骤;第三,数据具有代表性,即数据具有随机性、独立性。
2 随机抽样方法
常用的随机抽样方法主要有:简单随机抽样法、系统抽样法、分层抽样法及整群抽样法。
(1)简单随机抽样法
有抽签法、随机数法,其优点是抽样误差小,缺点是抽样手续复杂,且在总体数量有限的情况下不具有代表性。这种方法适用于所有抽样调查。
①抽签法
把总体中的N个个体编号,并把号码写在形状、大小相同的号签上,将号签放在同一个容器里,搅拌均匀后,每次从中抽出1个号签连续抽取n次,得到一个样本容量为n的样本。
②随机数法
应用随机数表、随机数骰子、计算机等产生随机数进行随机抽样调查。
(2)系统抽样法
(3)分层抽样法
又叫类型抽样法,从一个分成不同于总体的层中,按规定的比例从不同层中随机抽样的方法。其优点是样本代表性好,抽样误差小,缺点是抽样手续比简单随机抽样复杂。这种方法适用于产品质量检验、验收等。
(4)整群抽样法
又叫集团抽样法,将总体分成许多群,每个群由个体按一定方式结合而成,然后随机抽群,这些群所有个体组成样本。其优点是实施方便,缺点是代表性差,误差大。这种方法适用于工序控制中。
这些方法是基于随机抽样的代表性和稳定性而建立的,依据概率统计的大数定理,个别个体的错误或噪声影响并不影响整体水平,适当增加样本容量,对样本观测值平均值是可控的,也可以缩小统计特性误差,从而正确反映总体规律。
3 随机抽样的应用研究
随机抽样在各个领域都有涉及,与科学研究息息相关,是人们认识事物的基础。对各个领域的研究主要目的是数据挖掘,挖掘出有价值的结论或规律,指导人们生产生活。对于不同领域,应用随机抽样有着同样的步骤:
第一步,明确研究对象总体数量N及研究目的;
第二步,具有针对性地确定样本容量n,并根据上述随机抽样方法权衡各方法的适用范围,选择合适的方法进行研究;
第三步,根据选定的抽样方法把总体中的个体进行编号;
第四步,在试验中记录样本中每个个体的测量值y1,y2,···,yn,计算样本总和即∑yi及平均值 ;
第五步,计算样本的方差、总体平均值、总体的估计量及总体的标准差;
第六步,确定置信区间;
第七步,最后总结得到的数据信息,做出结论。
下面在各个领域中举例说明随机抽样应用的广泛性。在农业中,需要对田间农作物产量进行统计分析,则设计相应的随机抽样,进行样本估计总体试验;在工业中,对新产品和新原材料等进行调查分析,找出新产品中不合格产品率或原材料配料的决策问题,则需要应用随机抽样、回归分析、方差分析等统计方法;在林业方面,需要调查病虫害对树木的损害程度及导致这种虫害的原因,则需要相关人员选择合适的抽样的方法,对病虫害进行准确调查分析,得出具有公信力的结果;在自然科学和技术研发中的应用更加广泛,比如地震频率统计、气象调查、水文测量、地质资源探测、医学突发疾病抽样、技术性试验抽样等等;在社会、经济领域方面,主要有人口普查和预测、市场调查、审计统计、证券研究、交通事故率研究、经济宏观调控效应调查、手机普及率等方方面面;在工程项目中,主要有产品质量调查、服务质量调查等,通过对项目管理中的数据进一步汇总、抽样、总结等一系列工作,发现存在的问题,制定相应的方法去改正;在计算机行业,通过抽样调查才能获取数据,进而对数据进行深度发掘。
现代社会是信息时代,对信息的充分利用是一笔巨大的财富,随机抽样是信息来源的基本方法,涉及生活中的方方面面,利用好这一工具是发现问题及解决问题的很好途径。
4 结论
本文对数理统计学中随机抽样的应用研究,主要从随机抽样的概念、方法、优缺点、操作步骤等进行详细论述,并在生产生活中的各个领域进行举例说明随机抽样的重要性,对推广人们对随机抽样的认识及应用具有重要意义。
参考文献
[1] 李振东. 论数理统计学中的随机抽样[J]. 经济师, 2003,(7):269.
[2] 徐传胜. 数理统计学的发展历程[J]. 高等数学研究, 2007,(10):14-16.
[3] 柏佳丹. 21世纪统计学在经济发展中的作用[J]. 佳木斯大学社会科学学报, 2004, (08): 6-8.
[4] 张虎. 统计学的发展与未来[J]. 统计研究, 2011, (02):20-22.
[5] 许碧娟. 抽样调查方法在我国的应用[J]. 现代商业, 2007, (04):62.
-
常用的抽样方法
2017-06-20 18:56:06在数据挖掘的实际工程中,多数时候需要从总体中抽取样本来进行模型预测。抽样的方法有多种,此处例举常见的几种。在数据挖掘的实际工程中,多数时候需要从总体中抽取样本来进行模型预测。抽样的方法有多种,此处例举常见的几种。
1、简单抽样。
简单抽样分为有放回抽样和无放回抽样。无放回抽样:从N个个体中随机抽取n个个体,每次抽取一个个体,且抽取后不再放回。有放回抽样:跟无放回类似,但是每次抽取个体之后,要放回。
2、簇抽样
先将总体分为多个不想交的簇,然后再抽取一个或多个簇作为样本。例如:把某中学二年级的学生按班级分为多个簇(假设一个班就是一个簇),每次抽取一个或多个班(簇)作为样本,这种抽样方法就是簇抽样。簇抽样要求簇内的差异较大,簇之间的差异较小,从而使得簇抽取的样本具有代表性。
3、分层抽样
将总体分为多个不想交的部分,叫做层,然后按照一个定的比例在每个层中进行抽样。例如:将某中学的所有学生作为总体,每个年级的学生作为一个层,再从每个层中随机抽样一定数量的学生,这种方法就是分层抽样。分层抽样要求层内的差异较大,而层之间的差异较小。
4、系统抽样(针对样本容量很大的情况)
从N个个体中抽取n个个体,做法是先确定k=N/n(对k向上取整),把N个个体分为n段,每段有k个个体,设定一个整数m,1 <= m <= k,在每段中抽取第m个个体,抽取完n段得到n个个体,这n个个体就是抽样的结果。这种抽样方法就是整体抽样。
5、自助抽样
假设总体的个体(实例)个数为N,自助抽样的思想是:每次从总体里面抽取一个个体,抽取N次,这样有一部分个体一次都没被抽中,而另一部分个体至少被抽中一次。一次都没抽中的个体数量大概是
,当N很大时,其值为
≈ 0.368,而至少被抽中一次的个体数占总体的0.682。
6、蓄水池抽样
当总体的数量足够大,不能读进计算机内存的时候,前面几种方法就不适用了,这个可以采用蓄水池抽样法。其具体实现的伪代码如下(假设从N个个体中抽取k个个体):
-
python分层随机抽样
2021-01-29 20:02:23Spark Core常用接口 Spark主要使用到如下这几个类: pyspark.SparkContext:是Spark的对外接口。负责向调用该类的python应用提供SPython 由于Spark开源版本升级,为避免出现API兼容性或可靠性问题,建议用户使用... -
基于 Python 的 8 种常用抽样方法
2021-06-26 22:45:18上面所说的都是以概率为基础的,实际上还有一类非概率的抽样方法,因此总体上归纳为两大种类: 概率抽样:根据概率理论选择样本,每个样本有相同的概率被选中。 非概率抽样:根据非随机的标准选择样本,并不是每... -
R语言中实现简单随机抽样
2021-05-25 06:18:24原标题:R语言中实现简单随机抽样抽样的基本概念从总体中抽取样本的方法有很多种,比较常用的就是简单随机抽样。从容量为N的总体中随机抽取出容量为n的样本,每个样本被抽取到的可能性相等,则抽到的样本是一个容量... -
统计学中抽样调查和一些常用的方法
2019-05-18 16:08:00抽样调查的领域涉及如何用有效的方式得到样本。这些调查都利用了问卷,而问卷的设计则很有学问。它设计如何用词、问题的次序和问题的选择与组合等等。涉及包括心理学、社会学等知识。问题的语言应该和被调查者的... -
随机抽样、分层抽样、整群抽样、系统抽样的区别
2018-05-02 13:48:40抽样方法主要包括:随机抽样、分层抽样、整体抽样、系统抽样。(1) 随机抽样就是按等概率原则直接从含有N个元素的总体中抽取n个元素组成样本(N>n)。这种方法简便易学,常用的办法就是抽签了。不过,这适合... -
Python 珍藏函数超详解:随机抽样,分层抽样,系统抽样方法汇总
2020-02-11 11:22:31抽样调查在 统计学 与 Python数据分析/数据挖掘/数据科学 中非常常用,在实际业务中也是高频刚需,而 Python 并没有专有的抽样方法库,所以将自己以前的笔记汇总到自写库中,用到时直接调用函数即可,快速且... -
随机抽样的类型及实际应用案例
2021-01-20 17:22:26-专业提供SPC软件解决方案随机抽样的类型及实际应用案例-专业提供SPC软件解决方案摘要:随机抽样即按照随机的原则即保证总体中每个单位都有同等机会被抽中的原则抽取样本的方法本文主要针对常用的四种抽样法 -
完整版 常用的数据分析方法大全 共85页 PPT.pdf
2021-08-07 12:03:28培训主要内容: 1、了解数据、总体、样本的含义及随机抽样的一般方法; 2、掌握排列图、因果分析图的作图方法和应用; 3、掌握分层法、统计图表法的应用; 4、了解直方图的原理、作用、作图方法及应用; -
sql写随机抽样总结
2019-07-26 15:23:521、Oracle访问数据的基本方法: 1)、全表扫描(Full table Scan):执行全表扫描,Oracle读表中的所有记录,考查每一行是否满足WHERE条件。Oracle顺序的读分配给该表的每一个数据块,且每个数据块Oracle只读一次.这样... -
如何进行随机抽样?
2017-07-25 08:44:15从不同的角度分析了从N个数据集中抽取k个数据的方法。详细说明了大数据抽样中常用的蓄水池抽样算法。 -
抽样的四种基本方法
2021-06-27 05:36:091.单纯随机抽样单纯随机抽样是在总体中以完全随机的方法抽取一部分观察单位组成样本(即每个观察单位有同等的概率被选入样本)。常用的办法是先对总体中全部观察单位编号,然后用抽签、随机数字表或计算机产生随机数字... -
Hive--数据抽样的常用三种方法(随机/数据块/分桶)
2020-11-26 11:23:031、随机抽样(rand()函数) 方法一:order by与rand函数结合 limit关键字限制抽样返回的数据 案例:order by 全局排序耗时长 select * from app.table_name order by rand() limit 100; 方法二:distribute和sort与... -
常见概率抽样方法及其适用场景总结
2019-01-22 15:59:01下面主要介绍简单随机抽样 、分层抽样 、整群抽样 、系统抽样 以及多级抽样这五种概率抽样方法。 简单随机抽样 简单随机抽样(simple random sampling ,SRS)是最简单的概率抽样方 法 ,也是其他抽样方法的... -
常见的数据抽样方法
2018-07-29 15:29:041、随机抽样 采用随机抽样方式时,数据集中的每一组观测值都有相同的被抽样的概率。比如按10%的比例随机抽样,则每一个观测值都有10%的机会被取到。 2、等距抽样 比如按5%的比例对一个有100个观测值的数据集进行... -
大数据抽样- 概率抽样,随机采样
2018-02-26 11:29:58在统计学中,抽样(Sampling)是一种推论统计方法,是指从目标总体(Population,或称为母体)中抽取一部分...简单随机抽样(simple random sampling),也叫纯随机抽样。从总体N个单位中随机地抽取n个单位作为样... -
python:抽样和抽样方法
2020-12-06 07:05:33学习目标目标知道总体、样本、样本大小、样本数量知道样本统计量和总体统计量知道总体分布、样本分布和抽样分布知道常用的抽样方法某糖果公司研发了一种超长效口香糖,为了得到口味持续时间的数据,公司聘请了试吃者... -
R语言中常用的抽样函数
2020-04-28 19:08:00简单随机抽样 简单随机抽样分为有放回抽样和无放回抽样,这两种形式都可以通过base包中的sample()函数实现。 sample(x, size, replace = FALSE, prob =NULL) x: 带抽取对象,若为整数则表示从1-n的整数中抽取,... -
抽样概念及常见方法
2021-08-01 17:53:30抽样的概念 抽样调查与普查 非抽样误差 抽样形式 指在不能进行全数调查时,为了推测总体的倾向,抽取真实地代表调查总体的调查对象。 抽样调查特点: 抽样调查花费较少 迅速地获取信息 争取时效是非常... -
机器学习实战:各种测试集的划分方法(随机划分,分层抽样,hash划分)
2021-01-20 22:37:15理论上,创建测试集非常简单:只需要随机选择一些实例,通常是数据集的20%。 def split_train_test(data, test_ratio): # 对0-len(data)之间的序列进行随机排序 shuffled_indices = np.random.permutation(len...