-
2021-06-27 05:36:09
1.单纯随机抽样
单纯随机抽样是在总体中以完全随机的方法抽取一部分观察单位组成样本(即每个观察单位有同等的概率被选入样本)。常用的办法是先对总体中全部观察单位编号,然后用抽签、随机数字表或计算机产生随机数字等方法从中抽取一部分观察单位组成样本医`学教育网搜集整理。
其优点是简单直观,均数(或率)及其标准误的计算简便;缺点是当总体较大时,难以对总体中的个体一一进行编号,且抽到的样本分散,不易组织调查。
2.系统抽样
系统抽样又称等距抽样或机械抽样,即先将总体中的全部个体按与研究现象无关的特征排序编号;然后根据样本含量大小,规定抽样间隔k;随机选定第i(i<k)号个体开始,每隔一个k,抽取一个个体,组成样本。
系统抽样的优点是:易于理解,简便易行;容易得到一个在总体中分布均匀的样本,其抽样误差小于单纯随机抽样。缺点是:抽到的样本较分散,不易组织调查;当总体中观察单位按顺序有周期趋势或单调增加(减小)趋势时,容易产生偏倚。
3.整群抽样
整群抽样是先将总体划分为K个“群”,每个群包含若干个观察单位,再随机抽取k个群(k<K),由抽中的各群的全部观察单位组成样本。
整群抽样的优点是便于组织调查,节省经费,容易控制调查质量;缺点是当样本含量一定时,抽样误差大于单纯随机抽样医`学教育网搜集整理。
4.分层抽样
分层抽样是先将总体中全部个体按对主要研究指标影响较大的某种特征分成若干“层”,再从每一层内随机抽取一定数量的观察单位组成样本。
分层随机抽样的优点是样本具有较好的代表性,抽样误差较小,分层后可根据具体情况对不同的层采用不同的抽样方法。
四种抽样方法的抽样误差大小一般是:整群抽样≥单纯随机抽样≥系统抽样≥分层抽样。
在实际调查研究中,常常将两种或几种抽样方法结合使用,进行多阶段抽样。
更多相关内容 -
空间抽样与统计推断电子书--王劲峰
2018-07-24 12:34:47抽样方法广泛运用于资源环境和社会经济...结合具体案例,介绍了各主要抽样模型的实际运用步骤。阅读本书只需概率统计的基本知识即可。可以供地学和社会科学领域的学者在抽样调查、统计推断和监测网优化设计中使用参考。 -
Cluster sampling整群抽样例子
2021-04-12 19:41:37整群(聚类)抽样的例子例题与方法步骤 转述一下例子 一个年级有3k名学生,要调查他们的数学成绩吧 一共有60个班(群),每个班50人。 大概只需要调查其中1000人,也就是20个班(群)。 因此只需要在60个群里面随机...整群(聚类)抽样的例子例题与方法步骤
转述一下例子
一个年级有3k名学生,要调查他们的数学成绩吧
一共有60个班(群),每个班50人。
大概只需要调查其中1000人,也就是20个班(群)。
因此只需要在60个群里面随机抽取20个群即可。在R语言如何实现呢?
library(sampling) set.seed(1996) # 定义班级id以及模拟每个学生的成绩 class.id <- rep(c(1:60),50) student.score <- round(runif(3000,60,100)) # 将以上数据合并 data <- data.frame( id= class.id, score = student.score ) # 采用整群抽样,根据id来进行抽样,抽取20个 c1 <- cluster(data, c("id"), size = 20, method="srswor", description=TRUE) # c1.sample <- getdata(data,c1) table(c1.sample$id) score_mean <- aggregate(c1.sample$score, by = list(class_id = c1.sample$id),mean) score_mean
最终结果如下
> score_mean class_id x 1 1 80.28 2 2 80.14 3 3 79.32 4 4 82.52 5 5 79.56 6 8 79.54 7 9 78.78 8 12 77.78 9 18 79.58 10 23 78.46 11 25 80.34 12 26 82.44 13 27 79.46 14 28 81.10 15 32 80.94 16 33 76.30 17 39 81.14 18 49 81.68 19 51 82.12 20 54 80.84
-
研究抽样的八种方法
2021-06-03 11:14:14概率抽样 非概率抽样抽样步骤
- 定义目标群体:明确调查的全部对象及其范围。
- 定义抽样框:抽样框又称“抽样框架”、“抽样结构”,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。
- 选择抽样方法:确定抽样测算所使用的抽样方法。
- 确定样本数量:确定抽样测算需要的样本数量,样本数越大精确度越高。
- 收集数据:从抽取的样本中收取测算数据。
- 已美国大选民意调查为例
- 仅考虑18岁以上且有资格投票的人。
- 抽样框是每一个选区的所有投票人列表。
- 选择使用概率抽样方法,因为每一张选票都是等价的,还可以将不同背景的人进行分层,使用分层抽样。
- 样本数为选区人口1%
- 通过电话访问样本人员,通过提问获取投票意向。
概率抽样
概率抽样是指在调查总体样本中的每个单位都具有同等可能性被抽中的机会。又称随机抽样,概率抽样以概率理论和随机原则为依据来抽取样本的抽样,是使总体中的每一个单位都有一个事先已知的非零概率被抽中的抽样。总体单位被抽中的概率可以通过样本设计来规定,通过某种随机化操作来实现,虽然随机样本一般不会与总体完全一致。
简单随机抽样/单纯随机抽样/纯随机抽样/SRS抽样
概念:简单随机抽样也称为单纯随机抽样、纯随机抽样、SRS抽样 ,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
例子:从投票人列表中根据随机数抽取样本。
优点:简单,直接。
缺点:结果不确定性太强,每次结果可能不一样。
蒙特卡罗方法采用重复随机抽样的方法对未知参数进行估计。
分层抽样/类型抽样
概念:分层抽样法也叫类型抽样法。它是从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样品(个体)的方法。
例子:
优点:样本的代表性比较好,抽样误差比较小。
缺点:抽样手续较简单随机抽样还要繁杂些
定量调查中的分层抽样是一种卓越的概率抽样方式,在调查中经常被使用。
聚类抽样/整群抽样
聚类取样(Cluster Sampling)又称整群抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。
在上面的例子中,我们将人口分为5个群。每个群由4个个体组成,我们在样本中选取了第4个群。我们可以根据样本大小包含更多的群。
当我们集中在一个特定领域或区域时,就会使用这种类型的抽样。
系统抽样/等距抽样/机械抽样
先将总体的全部单元按照一定顺序排列,采用简单随机抽样抽取第一个样本单元(或称为随机起点),再顺序抽取其余的样本单元,这类抽样方法被称为等距抽样(Systematic Sampling)。等距抽样又称为机械抽样、系统抽样。等距抽样往往不能给出估计量的估计方差。
在这种类型的抽样中,第一个个体是随机选择的,其他个体是使用固定的“抽样间隔”选择的。让我们举一个简单的例子来理解这一点。
系统抽样比简单随机抽样更方便。然而,如果我们在人群中选择项目时存在一种潜在的模式,这也可能导致偏差(尽管这种情况发生的几率非常低)。
非概率抽样
非概率抽样是指调查者根据自己的方便或主观判断抽取样本的方法。它不是严格按随机抽样原则来抽取样本,所以失去了大数定律的存在基础,也就无法确定抽样误差,无法正确地说明样本的统计值在多大程度上适合于总体。虽然根据样本调查的结果也可在一定程度上说明总体的性质,特征,但不能从数量上推断总体。非概率抽样主要有偶遇抽样,主观抽样,定额抽样,滚雪球抽样等
1.随意抽样/便利抽样
方便抽样又称随意抽样、偶遇抽样,是一种为配合研究主题而由调查者于特定的时间和特定社区的某一位置上,随意选择回答者的非概率抽样方法。这种抽样方法适合于对一些特殊情况的调查,像一些时过境迁的突发性事件或现象(违章驾车、骚乱、聚众闹事等等)。通过在当场抽取样本询问当事者、目击者、旁观者以及过往的行人,可以了解事件发生的经过、原因以及对事件的看法和态度。
这里,假设编号为4、7、12、15和20的个体想要成为样本的一部分,因此,我们将把它们包含在样本中。
便利抽样容易产生显著的偏见,因为抽样可能不能代表诸如宗教或人口的性别等具体特征。
2.判断抽样/立意抽样
立意抽样是指当调查人员对自己的研究领域十分熟悉,对调查总体比较了解时采用这种抽样方法,可获代表性较高的样本。这种抽样方法多应用于总体小而内部差异大的情况,以及在总体边界无法确定或因研究者的时间与人力、物力有限时采用。例如,要对福建省旅游市场状况进行调查,有关部门选择厦门、武夷山、泰宁金湖等旅游风景区做为样本调查,这就是立意抽样。
假设,我们的专家认为,应该将编号为1、7、10、15和19的人作为我们的样本,因为它们可以帮助我们更好地推断人口。你可以想象,配额抽样同样也容易受到专家的偏见,不一定具有代表性。
3.配额抽样/定额抽样
配额抽样也称“定额抽样”,是指调查人员将调查总体样本按一定标志分类或分层,确定各类(层)单位的样本数额,在配额内任意抽选样本的抽样方式。
配额抽样和分层随机抽样既有相似之处,也有很大区别。配额抽样和分层随机抽样有相似的地方,都是事先对总体中所有单位按其属性、特征分类,这些属性、特征我们称之为“控制特性。”例如市场调查中消费者的性别、年龄、收入、职业、文化程度等等。然后,按各个控制特性,分配样本数额。但它与分层抽样又有区别,分层抽样是按随机原则在层内抽选样本,而配额抽样则是由调查人员在配额内主观判断选定样本。在这种抽样中,我们根据预先确定的总体特征来选择样本。考虑到我们必须为我们的样本我们选择一个倍数为4的个体:
因此,编号为4、8、12、16和20的个人已经为我们的样本保留。
在配额抽样中,选择的样本可能不是未考虑的人口特征的最佳代表。
4.滚雪球抽样
滚雪球抽样是指先随机选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查对象。滚雪球抽样往往用于对稀少群体的调查。在滚雪球抽样中,首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。
在这里,我们随机选择了1个人作为样本,然后他推荐了6个人,6个人推荐了11个人,依此类推。
雪球抽样有很大的选择偏见风险,因为被引用的个体将与推荐他们的个体具有共同的特征。
参考:
-
八种样本抽样方法介绍
2019-10-16 09:24:15抽样步骤 不同类型的抽样技术 概率抽样的类型 非概率抽样的类型 什么是抽样? 让我们从正式定义什么是抽样开始。 抽样是一种方法,它使我们能够基于子集(样本)的统计信息来获取总体信息,而无需调查...介绍
你肯定很熟悉以下情况:你下载了一个比较大的数据集,并开始分析并建立你的机器学习模型。当加载数据集时,你的计算机会爆出"内存不足"错误。
即使是最优秀的人也会遇到这种事。这是我们在数据科学中面临的最大障碍之一,在受计算限制的计算机上处理大量数据(并非所有人都拥有Google的资源实力!)。
那么我们如何克服这个问题呢?是否有一种方法可以选择数据的子集并进行分析,并且该子集可以很好地表示整个数据集?
这种方法称为抽样。我相信你在学校期间,甚至在你的职业生涯中,都会遇到这个名词很多次。抽样是合成数据子集并进行分析的好方法。但是,那我们只是随机取一个子集呢?
我们将在本文中进行讨论。我们将讨论八种不同类型的抽样技术,以及每种方法的使用场景。这是一篇适合初学者的文章,会介绍一些统计的知识
目录
- 什么是抽样?
- 为什么我们需要抽样?
- 抽样步骤
- 不同类型的抽样技术
- 概率抽样的类型
- 非概率抽样的类型
什么是抽样?
让我们从正式定义什么是抽样开始。
抽样是一种方法,它使我们能够基于子集(样本)的统计信息来获取总体信息,而无需调查所有样本。
上图完美地说明了什么是抽样。让我们通过一个例子更直观的进行理解。
我们想要找到Delhi这个城市所有成年男性的平均身高。Delhi的人口大约为3千万,男性大约为1500万(这些都是假想数据,不要当成实际情况了)。你可以想象,要找到Delhi所有男性的身高来计算平均身高几乎是不可能的。
我们不可能接触到所有男性,因此我们无法真正分析整个人口。那么,什么可以我们做的呢?我们可以提取多个样本,并计算所选样本中个体的平均身高。
但是,接下来我们又提出了一个问题,我们如何取样?我们应该随机抽样吗?还是我们必须问专家?
假设我们去篮球场,以所有职业篮球运动员的平均身高作为样本。这将不是一个很好的样本,因为一般来说,篮球运动员的身高比普通男性高,这将使我们对普通男性的身高没有正确的估计。
这里有一个解决方案,我们在随机的情况下随机找一些人,这样我们的样本就不会因为身高的不同而产生偏差。
为什么我们需要抽样?
我确定你在这一点上已经有了直觉的答案。
抽样是为了从样本中得出关于群体的结论,它使我们能够通过直接观察群体的一部分(样本)来确定群体的特征。
- 选择一个样本比选择一个总体中的所有个体所需的时间更少
- 样本选择是一种经济有效的方法
- 对样本的分析比对整个群体的分析更方便、更实用
抽样步骤
将概念形象化是在记忆的好方法。因此,这是一个以流程图形式逐步进行抽样的流程图!
让我们以一个有趣的案例研究为例,将这些步骤应用于执行抽样。几个月前,我们在印度举行了大选。你一定看过当时每个新闻频道的民意调查:
这些结果是根据全国9亿选民的意见得出的还是根据这些选民的一小部分得出的?让我们看看是怎么做的。
第一步
抽样过程的第一步是明确定义目标群体。
因此,为了进行民意调查,投票机构仅考虑18岁以上且有资格在人口中投票的人。
第二步
抽样框架(Sampling Frame) –这是构成样本总体的个体列表。
因此,这个例子的抽样框架将是是名字出现在一个选区的所有投票人列表。
第三步
一般来说,使用概率抽样方法是因为每一张选票都有相等的价值。不考虑种姓、社区或宗教,任何人都可以被包括在样本中。不同的样品取自全国各地不同的地区。
第四步
样本量(Sample Size)-是指样本中所包含的个体的数量,这些个体的数量需要足量以对期望的准确度和精度进行推断。
样本量越大,我们对总体的推断就越准确。
在民意调查中,各机构试图让尽可能多的不同背景的人参与抽样调查,因为这有助于预测一个政党可能赢得的席位数量。
第五步
一旦确定了目标人群,抽样框架,抽样技术和样本数量,下一步就是从样本中收集数据。
在民意测验中,机构通常会向人民提出问题,例如他们要投票给哪个政党或前政党做了什么工作,等等。
根据答案,各机构试图解释选民投票给谁,以及一个政党要赢得多少席位。
不同类型的抽样技术
这里是另一个图解!这一个是关于我们可以使用的不同类型的采样技术:
- 概率抽样: 在概率抽样中,总体中的每个个体都有相等的被选中的机会。概率抽样给了我们最好的机会去创造一个真正代表总体的样本
- 非概率抽样:在非概率抽样中,所有元素被选中的机会都不相等。因此,有一个显著的风险,即最终得到一个不具代表性的样本,它不会产生可推广的结果
例如,假设我们的人口由20个人组成。每个个体的编号从1到20,并由特定的颜色(红色、蓝色、绿色或黄色)表示。在概率抽样中,每个人被选中的概率是1/20。
对于非概率抽样,这些概率是不相等的。一个人被选中的机会可能比别人大。现在我们对这两种抽样类型有了一定的了解,让我们分别深入了解每种抽样类型,并理解每种抽样的不同类型。
概率抽样的类型
简单随机抽样
这是你一定要遇到的一种抽样技术。在这里,每个人都是完全由随机选择的,人口中的每个成员都有被选择的机会。
简单的随机抽样可减少选择偏差。
这种技术的一大优点是它是最直接的概率抽样方法。但它有一个缺点,它可能不会选择特别多我们真正感兴趣的个体元素。蒙特卡罗方法采用重复随机抽样的方法对未知参数进行估计。
系统抽样
在这种类型的抽样中,第一个个体是随机选择的,其他个体是使用固定的“抽样间隔”选择的。让我们举一个简单的例子来理解这一点。
假设我们的总体大小是x,我们必须选择一个样本大小为n的样本,然后,我们要选择的下一个个体将是距离第一个个体的x/n个间隔。我们可以用同样的方法选择其余的。
假设,我们从第3个人开始,样本容量是5。因此,我们要选择的下一个个体将是(20/5)= 4,从第3个人开始,即7(3 4),依此类推。
3、3 4=7、7 4=11、11 4=15、15 4=19 . 3、7、11、15、19
系统抽样比简单随机抽样更方便。然而,如果我们在人群中选择项目时存在一种潜在的模式,这也可能导致偏差(尽管这种情况发生的几率非常低)。
分层抽样
在这种类型的抽样中,我们根据不同的特征,如性别、类别等,把人口分成子组(称为层)。然后我们从这些子组中选择样本:
在这里,我们首先根据红、黄、绿、蓝等不同的颜色将我们的种群分成不同的子组。然后,从每一种颜色中,我们根据它们在人口中的比例选择一个个体。
当我们想要从总体的所有子组中得到表示时,我们使用这种类型的抽样。然而,分层抽样需要适当的人口特征的知识。
整群抽样
在整群抽样中,我们使用总体的子组作为抽样单位,而不是个体。全体样本被分为子组,称为群,并随机选择一个完整的群作为抽样样本。
在上面的例子中,我们将人口分为5个群。每个群由4个个体组成,我们在样本中选取了第4个群。我们可以根据样本大小包含更多的群。
当我们集中在一个特定领域或区域时,就会使用这种类型的抽样。
非概率抽样的类型
便利抽样
这可能是最简单的抽样方法,因为个人的选择是基于他们的可用性和参与意愿。
这里,假设编号为4、7、12、15和20的个体想要成为样本的一部分,因此,我们将把它们包含在样本中。
便利抽样容易产生显著的偏见,因为抽样可能不能代表诸如宗教或人口的性别等具体特征。
配额抽样
在这种抽样中,我们根据预先确定的总体特征来选择样本。考虑到我们必须为我们的样本我们选择一个倍数为4的个体:
因此,编号为4、8、12、16和20的个人已经为我们的样本保留。
在配额抽样中,选择的样本可能不是未考虑的人口特征的最佳代表。
判断抽样
这也称为选择性抽样。在选择要求参加者时,取决于专家判断。
假设,我们的专家认为,应该将编号为1、7、10、15和19的人作为我们的样本,因为它们可以帮助我们更好地推断人口。你可以想象,配额抽样同样也容易受到专家的偏见,不一定具有代表性。
雪球抽样
我很喜欢这种抽样方法。现有的人被要求推荐更多他们认识的人,这样样本的大小就会像滚雪球一样增加。当抽样框架难以识别时,这种采样方法是有效的。
在这里,我们随机选择了1个人作为样本,然后他推荐了6个人,6个人推荐了11个人,依此类推。
1-> 6-> 11-> 14-> 19
雪球抽样有很大的选择偏见风险,因为被引用的个体将与推荐他们的个体具有共同的特征。
结尾
在本文中,我们了解了抽样的概念,抽样所涉及的步骤以及不同类型的抽样方法。抽样在统计世界和现实世界中都有广泛的应用。
欢迎关注磐创博客资源汇总站:http://docs.panchuang.net/
欢迎关注PyTorch官方中文教程站:http://pytorch.panchuang.net/
-
舍选抽样法.PPT
2021-04-21 14:32:47舍选抽样法§2.0 概率与统计 §2.1 Monte Carlo方法 §2.2 伪随机数 §2.3 任意分布的伪随机变量的抽样 则,xy 联合分布密度函数为 其中, 代入Jacobi行列式,有 改进的Maraglia方法: (1) 产生[0,1]区间上的独立均匀... -
并联系统可靠性分析的马尔可夫链线抽样方法 (2008年)
2021-05-13 07:39:26依据并联系统重要方向的定义和单模式线抽样方法的基本原理,建立了适用于并联系统可靠性分析的马尔可夫链线抽样方法,给出了并联系统马尔可夫链线抽样方法失效概率估算的具体实现步骤。所提方法采用马尔可夫链模拟... -
抽样方法
2016-04-01 20:06:10一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取使总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。 随机抽样 编辑 简介 ... -
Sfit 特征提取和匹配的具体步骤
2020-10-12 11:18:20Sift算法 Sfit算法的实质是在不同的尺度空间上查找关键点(特征点),...Sfit特征提取和匹配具体步骤 生成高斯差分金字塔(DOG金字塔),尺度空间构建 空间极值点检测(关键点的初步查探) 稳定关键点的精确定位 -
SPSS如何进行随机抽样
2021-05-20 16:59:16在统计学中,随机抽样是非常重要的一种统计分析手段,它使得研究对象有相同的机会被分在某一处理组当中,排除人为因素的影响和干扰。随机抽样是提高研究样本代表性和组间均衡性的重要方法,它的正确使用将直接影响到... -
概念学习之1——重点抽样法
2020-10-15 18:48:52文章目录说明1、什么是重点抽样法1.1 随机抽样法1.2 重点抽样法 说明 在学习过程中参考了以下文章: 1、什么是重点抽样法 要理解重点抽样法得首先了解随机抽样法,因为重点抽样法就是在随机抽样法的基础上优化得到的... -
随机抽样类型汇总
2021-03-03 19:13:32随机抽样包含5种:简单随机抽样、等距随机抽样、分类随机抽样、整群随机抽样和多段随机抽样,下面一一讲解相关定义、例子和适应范围。 1. 简单随机抽样 1.1 定义: 1.2 例子: 直抽样法; 抽签法或抓阄法,抽样单位... -
通信原理抽样定理及其应用实验报告
2021-04-21 19:04:40实验1 抽样定理及其应用实验一、实验目的1.通过对模拟信号抽样的实验,加深对抽样定理的理解;2.通过PAM调制实验,使学生能加深理解脉冲幅度调制的特点;3.学习PAM调制硬件实现电路,掌握调整测试方法。二、实验... -
三、抽样与参数估计
2021-01-29 22:04:29抽样与抽样分布 一、简单随机抽样 随机抽样:从含有N个元素的总体中,抽取n个元素作为样本,使得每一个客量为n的样本都有相同的机会被抽中。 重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二... -
分层抽样的公式怎么计?
2020-12-24 13:17:42展开全部分层抽样一般有三个步骤:首先32313133353236313431303231363533e58685e5aeb931333431363534,辩明突出的(重要的)人口统计特征和分类特征,这些特征与所研究的行为相关。例如,研究某种产品的消费率时,按... -
蒙特卡罗法三种一般抽样方法(直接抽样法、接受-拒绝抽样法、重要性抽样法)
2021-03-06 21:38:54具体步骤如下: 输入:抽样的目标概率分布的概率密度函数 p(x)p(x)p(x); 输出:概率分布的随机样本 x1.x2,...,x3x_1.x_2,...,x_3x1.x2,...,x3 参数:样本数n (1)选择概率密度函数为 q(x)q(x)q(x)的概率分布... -
统计学习(四):重抽样方法
2021-04-23 11:27:38用 Z ∗ 1 Z^{*1} Z∗1 产生一个新的对 α \alpha α 的自助法估计,记为 α ^ ∗ 1 \hat\alpha^{*1} α^∗1,重复这个步骤 B B B 次, B B B 是个很大的值,可以产生 B B B 个不同的自助法数据集, Z ∗ 1 , Z ∗ 2... -
八种抽样技术的科学指南
2019-10-11 13:45:03抽样步骤 不同类型的抽样技术 概率抽样的类型 非概率抽样的类型 文章目录 介绍 什么是采样 为什么我们需要抽样? 抽样所涉及的步骤 第一步 第二步 第三步 第四步 第五步 不同类型的采样技术 概率抽样的... -
常用的抽样方法
2015-12-09 08:39:25转载自:... 1.非概率抽样(Non-probability sampling) 又称非随机抽样,指根据一定主观标准抽取样本,令总体中每个个体的被抽取不是依据其本身的机会,而是完全决定于调研者的意愿。 其特点 -
加权随机抽样算法
2019-02-18 16:17:24对应到不同的应用场景,可以对应解决搜索query抽样、商品抽样、网页抽样等任务。对于不加权的普通随机抽样,其实并不难解决,在样本集合非常大的情况下,还可以使用经典的蓄水池算法 ( Reservoir Sampling ) 来高效... -
分层抽样法
2019-05-24 23:13:53分层抽样的具体程序是:把总体各单位分成两个或两个以上的相互独立的完全的组(如男性和女性),从两个或两个以上的组中进行简单随机抽样,样本相互独立。总体各单位按主要标志加以分组,分组的标志与关心的总体特征... -
抽样(蒙特卡洛法)到底是在干啥?
2022-05-05 08:01:23最近在学马尔可夫蒙特卡洛法,期间学习了各种各样的抽样方法,也在《概率图模型基于R》这本书中看到了一些代码实现,但是说实话我都还没搞清楚抽样到底是在干什么。昨天在B站关注到一位UP主感觉讲的很不错,这里按照... -
科学网—[转载]python抽样方法详解及实现 - 张书会的博文
2021-02-03 08:25:06抽样方法概览随机抽样—总体个数较少每个抽样单元被抽中的概率相同,并且可以重现。随机抽样常常用于总体个数较少时,它的主要特征是从总体中逐个抽取。1、抽签法2、随机数法:随机数表、随机数骰子或计算机产生的... -
吉布斯抽样
2017-11-15 15:11:44吉布斯采样的具体做法:假设有一个k维的随机向量,现想要构造一条有n个样本的k维向量(n样本马尔科夫序列),那么(随机)初始化一个k维向量,然后固定这个向量其中的k-1个元素,抽取剩下的那个元素(生成给定后验的... -
基于等分散抽样法的配电网可靠性评估方法及应用与流程
2021-04-23 20:56:05本发明涉及电力电网领域,尤其是涉及一种基于等分散抽样法的配电网可靠 性评估方法及应用。背景技术:电力系统可靠性是对电力系统按可接受的质量标准和所需数量不间断地向电 力用户供应电力和电能能力的度量,据不... -
统计学中抽样调查和一些常用的方法
2019-05-18 16:08:00抽样调查的领域涉及如何用有效的方式得到样本。这些调查都利用了问卷,而问卷的设计则很有学问。它设计如何用词、问题的次序和问题的选择与组合等等。涉及包括心理学、社会学等知识。问题的语言应该和被调查者的... -
python抽样方法详解及实现
2019-09-03 23:21:02随机抽样—总体个数较少 每个抽样单元被抽中的概率相同,并且可以重现。随机抽样常常用于总体个数较少时,它的主要特征是从总体中逐个抽取。 1、抽签法 2、随机数法:随机数表、随机数骰子或计算机产生的随机数。 ... -
R-概率统计与模拟(四)拒绝抽样
2019-10-26 15:35:18本文介绍了如何进行拒绝抽样(Reject Sampling)。 -
EXCEL中的数据分析—抽样分析
2019-09-11 10:09:06今天给大家分享的是如何用EXCEL来做抽样分析。 有的时候我们的在使用数据的时候不需要直接使用全量的样本来进行分析,而是没有针对性的取出样本量中部分数据进行分析,如果针对性的取数又会对分析结果产生影响。...