精华内容
下载资源
问答
  • 基于均匀抽样的二阶差分聚类数确定方法.pdf
  • 编程模拟了OD调查抽样随机试验,证明随着小区数量的增加调查样本...建立了OD调查样本量与影响因素关系模型,提出OD调查样本量(或抽样率)确定方法,该方法克服了常规方法中无法考虑交通小区个和区间出行不均匀弊端。
  • 【数理统计】抽样方法

    千次阅读 2018-01-02 14:43:36
    1 在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是渐进抽样
    1 在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是渐进抽样
    展开全文
  • 抽样调查中最重要的就是先要确定调查样本的数量。怎样合理的确定样本量,非常重要。此文献详细说明了怎样科学合理地确定样本量。
  • FIR数字滤波器设计——频率抽样

    万次阅读 2016-11-27 21:07:26
    1.频率抽样法设计线性相位FIR滤波器的思想 频率抽样法是从频域出发,在频域直接设计,把给定的理想频率响应加以等间隔抽样,并以此作为实际FIR...由设计的要求给定,h[k]通过设计来确定。如果M+1个方程是线性无关

    1.频率抽样法设计线性相位FIR滤波器的思想

    频率抽样法是从频域出发,在频域直接设计,把给定的理想频率响应加以等间隔抽样,并以此作为实际FIR滤波器的频率响应。设所需滤波器的频率响应为

    现要求设计一个M阶的FIR滤波器h[k],使得在M+1个抽样点上,FIR滤波器的频率响应与所需的频率响应相等,即


    由设计的要求给定,h[k]通过设计来确定。如果M+1个方程是线性无关的,则可以通过求解M+1阶的线性方程来得出FIR滤波器的h[k]。对的一些特殊抽样方法,上述方程的解可以直接由IDFT得到。由于要求设计出的滤波器是实系数的线性相位FIR滤波器,所以抽样值还需要满足线性相位滤波器的约束条件

     I型和II型线性相位滤波器的,III型和IV型线性相位滤波器的。为了使设计出的滤波器具有线性相位, 在M+1个抽样点上的值应为:



    下面分别讨论四种线性相位滤波器在抽样点上的值。

    2.Ⅰ型线性相位FIR滤波器

    I型(M为偶数,h[k]偶对称)线性相位FIR滤波器在M+1个抽样点值为:


    上式表明I型线性相位FIR滤波器的值可由的值确定。在的值确定后,对做M+1点的IDFT即可得到I型线性相位滤波器的h[k]。

    3.Ⅱ型线性相位FIR滤波器

    II型(M为奇数,h[k]偶对称)线性相位FIR滤波器在M+1个抽样点值为:

    上式表明II型线性相位FIR滤波器的值可由的值确定。

    4.Ⅲ型线性相位FIR滤波器

    III型(M为偶数,h[k]奇对称)线性相位FIR滤波器在M+1个抽样点值为:

    上式表明III型滤波器线性相位FIR滤波器的值可由的值确定。

    5.Ⅳ型线性相位FIR滤波器

    IV型(M为奇数,h[k]奇对称)线性相位FIR滤波器在M+1个抽样点值为:

    上式表明IV型线性相位FIR滤波器的值可由的值确定。

    6.小结

    进行频率抽样,就是在z平面单位圆上的N个等间隔点上抽样出频率响应值。在单位圆上可以有两种抽样方式,第一种是第一个抽样点在w=0处,第二种是第一个抽样点在w=pi/M处,每种方式可分为M为偶数与M为奇数两种。

    为了提高逼近质量,使逼近误差更小,也就是减小在通带边缘由于抽样点的徒然变化而引起的起伏变化(这种起伏振荡使阻带内最小衰减变小,例如从衰减30dB变小为衰减20dB)。和窗口法的平滑截断一样,这里是使理想频率响应的不连续点的边缘加上一些过渡的抽样点(在这些点上抽样的最佳值由计算机算出),从而增加过渡带,减小频带边缘的突变,也就是减小了起伏振荡,增大了阻带最小衰减。这些抽样点上的取值不同,效果也就不同。如果精心设计过渡带的抽样值,就有可能使它的游泳频带的博文减小,从而设计出较好的滤波器。一般过渡带取一、二、三点抽样值即可得到满意结果。

    在理想低通滤波器的设计中,若不增加过渡点,阻带和通带之间的衰减约为-21dB,如果在通带和阻带之间增加一个采样点,阻带的最小衰减可以提高到-65dB,如果增加两个采样点,阻带的最小衰减可以提高到-75dB,如果增加3个采样点,阻带的最小衰减可以提高到-85dB至-95dB。
    频率抽样法的优点是可以在频域直接设计,并且适合于最优化设计;缺点是抽样频率只能等于2pi/M的整数倍或等于2pi/M的整数倍上加上pi/M,因而不能确保截止频率Wc的自由取值。要想实现自由选择频率,则必须增加抽样点数M,但这种计算量加大。

    展开全文
  • 抽样

    千次阅读 2013-05-09 17:30:28
    导语:抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况...
    导语:抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。 
    
    抽样调查是建立在随机原则基础上,从总体中抽取部分单位进行调查,并概率估计原理,应用所的资料对总体的数量特征进行推断的一种调查方法。例如,从某地区全部职工当中随机抽取部分职工,以家庭为单位按月调查取得有关收入、支出等方面的资料,并依据这些资料推断出全区职工的收支情况,这就是一种抽样调查。从调查方法上来看,它是属于一种非全面调查。但又与一般调查不同,它不只停留于搜集资料和整理资料,而且还要对资料进行分析,并据以推断总体的数量特征,从而提高统计的认识能力。因此,抽样调查的理论和方法在统计中占有很重要的地位。
    下面介绍一下常用的抽样方法: 一. 简单随机抽样
      一般,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的个体被抽到的机会相等,就把这种抽样方法叫做简单随机抽样。
    简单随机抽样的具体作法有:直接抽选法,抽签法,随机数法。
    直接抽选法例如某项调查采用抽样调查的方法对某市职工收入状况进行研究,该市有职工56,000名,抽取5,000名职工进行调查,他们的年平均收入为10,000元,据此推断全市职工年收入为8,000--12,000元之间。
    抽签法又称“抓阄法”。它是先将调查总体的每个单位编号,然后采用随机的方法任意抽取号码,直到抽足样本。在这里选取一个案例说明,如要在10个人中选取3个人作为代表,先把总体中的10个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取3次,就得到一个容量为3的样本。这就是抽签法,与直接抽样法类似。
    另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样。下面是随机数字表
     (1) (2) (3) (4) (5) (6) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 044 456 786 310 856 001 457 247 987 675 369 654 876 085 654 942 244 946 245 729 996 158 084 378 716 628 392 362 597 097 354 578 672 103 570 008 923 749 406 436 231 402 178 934 373 764 642 677 089 414 523 378 433 322 220 361 199 456 142 819 934 719 157 523 378 442 785 118 359 940 549 707 950 436 289 250 833 556 753 760 713 566 987 037 853 205 639 807 566 620






     
     
     
    当然,随机抽样也有不足之处,它只适用于总体单位数量有限的情况,否则编号工作繁重;对于复杂的总体,样本的代表性难以保证;不能利用总体的已知信息等。在市场调研范围有限,或调查对象情况不明,难以分类,或总体单位之间特性差异程度小时采用此法效果较好。
    抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便。如果标号的签搅拌得不均匀,会导致抽样不公平。而随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二. 分层抽样
    分层抽样又称分类抽样或类型抽样,是先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本。一般地,在抽样时,将总体分成互不交叉的层,然后按一定的比例,从各层次独立地抽取一定数量的个体,将各层次取出的个体合在一起作为样本。
    分层抽样尽量利用事先掌握的信息,并充分考虑了保持样本结构和总体结构的一致性,这对提高样本的代表性是很重要的。当总体是由差异明显的几部分组成时,往往选择分层抽样的方法。其特点是将科学分组法与抽样法结合在一起,每个个体被抽到的概率都相等N/M。分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。
    下面是一个实例应用
    某公司要估计某地家用电器的潜在用户。这种商品的消费同居民收入水平相关,因而以家庭年收入为分层基础。假定某地居民为1,000,000户,已确定样本数为1,000户,家庭年收入分10,000元以下,10,000——30,000元;30,000——60,000元,60,000元以上四层,其中收入在10,000元以下家庭户为180,000户,收入在10,000——30,000元家庭户为350,000户,收入在30,000——60,000元家庭户为3000,000户,收入在60,000元以下家庭户为170,000户,应进行如下抽样: 
     
    分层比例抽样示意图
     
    总体   层  
    子样本   样本
    N  1000000
    N1  180000
    N2  350000
    N3  300000
    N4  170000
    n1   180
    n2  350
    n3  300
    n4   170
    n   1000
     
    分层抽样与简单随机抽样相比,往往选择分层抽样,因为它有显著的潜在统计效果。也就是说,如果从相同的总体中抽取两个样本,一个是分层样本,另一个是简单随机抽样样本,那么相对来说,分层样本的误差更小些。另一方面,如






     
     
    果目标是获得一个确定的抽样误差水平,那么更小的分层样本将达到这一目标。
    总体中赖以进行分层的变量为分层变量,理想的分层变量是调查中要加以测量的变量或与其高度相关的变量。分层的原则是增加层内的同质性和层间的异质性。常见的分层变量有性别、年龄、教育、职业等。分层随机抽样在实际抽样调查中广泛使用,在同样样本容量的情况下,它比纯随机抽样的精度高,此外管理方便,费用少,效度高。 三. 系统抽样
    系统抽样也称为等距抽样、机械抽样、SYS抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种。在系统抽样中,先将总体从1~N相继编号,并计算抽样距离K=N/n。式中N为总体单位总数,n为样本容量。然后在1~K中抽一随机数k1,作为样本的第一个单位,接着取k1+K,k1+2K……,直至抽够n个单位为止。
    根据总体单位排列方法,系统抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。按照具体实施等距抽样的作法,系统抽样可分为:直线系统抽样、对称系统抽样和循环系统抽样三种。
    在定量抽样调查中,系统抽样常常代替简单随机抽样。由于该抽样方法简单实用,所以应用普遍。系统抽样得到的样本几乎与简单随机抽样得到的样本是相同的。 
      下面看一个例子,某产品的口味测试,需要运用等距抽样的方法从某校营销专业90名学生中抽选9名进行测试。

       
    1 2 3 4 5 6 7 8 9 10 11 12 13 14                16 17 18 19 20 21 22 23 24 25 26 27 28 29                31 32 33 34 35 36 37 38 39 40 41 42 43 44                46 47 48 49 50 51 52 53 54 55 56 57 58 59                61 62 63 64 65 66 67 68 69 70 71 72 73 74                76 77 78 79 80 81 82 83 84 85 86 87 88 89                                                               
    系统抽样方式也不是完美的,它相对于简单随机抽样方式最主要的优势就是经济性。系统抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少。使用系统抽样方式最大的缺陷在于总体单位的排列上。一些
    6  16  26  36  46  56  66  76  86 





     
     
    总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能疏忽,把它们抽选为样本。由此可见,只要抽样者对总体结构有一定了解时,充分利用已有信息对总体单位进行排队后再抽样,则可提高抽样效率。 四.整群抽样
      整群抽样又称聚类抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。 
       应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。 
    整群抽样优点是实施方便、节省经费; 整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。  整群抽样示意图
    总体  
    分群                                                 „„
    R=130 
    抽样                                              
    R=5  样本
    N    5000
    R1 53 R3 58 R4 48 R130
    45
    R1 53 R33
     52 n   250
    R2
     50 R4 48 R98 50 R11 47
     
      例如,调查中学生患近视眼的情况,抽某一个班做统计;进行产品检验;每隔8h抽1h生产的全部产品进行检验等。 
      整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。 分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大;分层抽样的样本时从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。
    以上抽样方法的抽样误差一般是:整群抽样 ≥简单随机抽样 ≥系统抽样 ≥分层抽样。
    五.配额抽样:
    配额抽样也称“定额抽样”,是指调查人员将调查总体样本按一定标志分类或分层,确定各类(层)单位的样本数额,在配额内任意抽选样本的抽样方式。 
    例如一在一项关于某品牌洗发水的消费者座谈会的研究抽样中,研究对象为18—40岁的女性。已确定样本量为24人。研究者选择“经济收入”和“发型”为控制特征;并要求高低收入者各占50%,烫、直发型各占50%。根据上述要求一个配额抽样的控制表便可设计出来。如下表:
     经济收入
    高 低
    发型
    直发 6 6
    烫发 6 6
    例如二假设某高校有2000名学生,其中男生占60%,女生占40%;文科学生和理科学生各占50%;一年级学生占40%,二年级、三年级、四年级学生分






     
     
    别占30%、20%和10%。现要用定额抽样方法依上述三个变量抽取一个规模为100人的样本。依据总体的构成和样本规模,我们可得到下列定额表: 
         男生(60)                       女生(40)  
      文科(30)      理科(30)    文科(20)    理科(20)   年级 一 二 三 四  一 二 三 四   一 二 三 四  一 二 三 四   人数 12  9  6  3  12  9  6  3   8  6  4  2   8  6  4  2
    配额抽样和分层随机抽样相比较,既有相似之处,也有很大区别。配额抽样和分层随机抽样有相似的地方,都是事先对总体中所有单位按其属性、特征分类,这些属性、特征我们称之为“控制特性。”例如市场调查中消费者的性别、年龄、收入、职业、文化程度等等。然后,按各个控制特性,分配样本数额。但它与分层抽样又有区别,分层抽样是按随机原则在层内抽选样本,而配额抽样则是由调查人员在配额内主观判断选定样本。实际上,配额抽样属于先“分层”(事先确定每层的样本量)再“判断”(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。
    数学抽样在生活中发挥着重要的作用,在我国,抽样法已被广泛应用于生产技术及社会生活各个领域。目前,国家统计调查制度中所包括的统计指标,依靠抽样方法取得的资料已达到三分之一左右。在城乡住户调查、农产品调查、价格统计、市场调查等领域,应用抽样调查已取得很好的成果,在人口统计、社会统计、交通统计、商业统计等领域,抽样调查也正在发挥越来越重要的作用。随着我国社会主义市场经济的发展,抽样调查的应用范围将逐渐扩大,所发挥的作用也将越来越大。
    展开全文
  • 目录 ... 抽样分布 ...在参数统计推断问题中,经常需要利用总体的样本构造出合适的统计量,并使其服从或渐近地服从已知的确定分布,统计学中泛称统计量的分布为抽样分布。 正态分布性质 设随机变量XXX服

    目录

    https://blog.csdn.net/weixin_45792450/article/details/109314584


    抽样分布

    总体的分布往往是未知的,或是部分地未知的.根据实际问题的需要,有时需对总体未知的重要数字特征(如总体数学期望、总体方差)或总体分布中所含的未知参数进行统计推断.这类问题称为参数统计推断

    在参数统计推断问题中,经常需要利用总体的样本构造出合适的统计量,并使其服从或渐近地服从已知的确定分布,统计学中泛称统计量的分布为抽样分布


    正态分布性质

    1. 设随机变量 X X X服从正态分布 N ( μ , σ 2 ) N(\mu ,{\sigma ^2}) N(μ,σ2),则 X − μ σ ∼ N ( 0 , 1 ) {{X - \mu } \over \sigma } \sim N(0,1) σXμN(0,1),即正态分布可以标准化。

    2. 设随机变量 X X X服从正态分布 N ( μ , σ 2 ) N(\mu ,{\sigma ^2}) N(μ,σ2),则 E ( X ) = μ , D ( X ) = σ 2 E(X) = \mu ,D(X) = {\sigma ^2} E(X)=μ,D(X)=σ2


    单正态总体的抽样分布

    定理:设总体 X X X服从正态分布 N ( μ , σ 2 ) N(\mu ,{\sigma ^2}) N(μ,σ2) ( X 1 , X 2 , . . . , X n ) ({X_1},{X_2},...,{X_n}) (X1,X2,...,Xn)是其容量为 n n n的一个样本, X ˉ \bar X Xˉ S 2 {S^2} S2分别为此样本的样本均值与方差,则有:

    1. X ˉ ∼ N ( μ , σ 2 n ) \bar X \sim N(\mu ,{{{\sigma ^2}} \over n}) XˉN(μ,nσ2)

    2. n − 1 σ 2 S 2 ∼ χ 2 ( n − 1 ) {{n - 1} \over {{\sigma ^2}}}{S^2} \sim {\chi ^2}(n - 1) σ2n1S2χ2(n1)

    3. X ˉ \bar X Xˉ S 2 {S^2} S2相互独立

    证明:1性质根据正态分布的线性组合还是正态分布即可得出,2和3性质由于证明较复杂,从略。

    定理:设 ( X 1 , X 2 , . . . , X n ) ({X_1},{X_2},...,{X_n}) (X1,X2,...,Xn)为正态总体 X ∼ N ( μ , σ 2 ) X \sim N(\mu ,{\sigma ^2}) XN(μ,σ2)的样本, X ˉ \bar X Xˉ S 2 {S^2} S2分别为该样本的均值和方差,则有:

    1. U = X ˉ − μ σ / n ∼ N ( 0 , 1 ) U = {{\bar X - \mu } \over {\sigma /\sqrt n }} \sim N(0,1) U=σ/n XˉμN(0,1)
    2. n − 1 σ 2 S 2 ∼ χ 2 ( n − 1 ) {{n - 1} \over {{\sigma ^2}}}{S^2} \sim {\chi ^2}(n - 1) σ2n1S2χ2(n1)
    3. T = X ˉ − μ S / n ∼ t ( n − 1 ) T = {{\bar X - \mu } \over {S/\sqrt n }} \sim t(n - 1) T=S/n Xˉμt(n1)

    证明:1性质即为正态分布的标准化,3性质由1和2联立代入即可得出 t t t分布形式


    双正态总体的抽样分布

    定理:设总体 X ∼ N ( μ , σ 2 ) X \sim N(\mu ,{\sigma ^2}) XN(μ,σ2) Y ∼ N ( μ , σ 2 ) Y \sim N(\mu ,{\sigma ^2}) YN(μ,σ2) ( X 1 , X 2 , . . . , X n 1 ) ({X_1},{X_2},...,{X_{{n_1}}}) (X1,X2,...,Xn1) ( Y 1 , Y 2 , . . . , Y n 2 ) ({Y_1},{Y_2},...,{Y_{{n_2}}}) (Y1,Y2,...,Yn2)分别是来自 X X X Y Y Y的样本,样本均值分别为 X ˉ \bar X Xˉ Y ˉ \bar Y Yˉ,样本方差分别为 S 1 2 S_1^2 S12 S 2 2 S_2^2 S22,则有:

    1. X ˉ − Y ˉ ∼ N ( μ 1 − μ 2 , σ 1 2 n 1 + σ 2 2 n 2 ) \bar X - \bar Y \sim N({\mu _1} - {\mu _2},{{\sigma _1^2} \over {{n_1}}} + {{\sigma _2^2} \over {{n_2}}}) XˉYˉN(μ1μ2,n1σ12+n2σ22) U = ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) U = {{(\bar X - \bar Y) - ({\mu _1} - {\mu _2})} \over {\sqrt {{{\sigma _1^2} \over {{n_1}}} + {{\sigma _2^2} \over {{n_2}}}} }} \sim N(0,1) U=n1σ12+n2σ22 (XˉYˉ)(μ1μ2)N(0,1)
    2. F = S 1 2 / σ 1 2 S 2 2 / σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F = {{S_1^2/\sigma _1^2} \over {S_2^2/\sigma _2^2}} \sim F({n_1} - 1,{n_2} - 1) F=S22/σ22S12/σ12F(n11,n21)
    展开全文
  • 如何确定抽样的样本数量

    万次阅读 多人点赞 2019-03-20 21:28:12
    带入值得:n=(1.96*1.96*0.09)/0.05*0.05)=138.3,即最小样本量为139. 同理,当取20%时,最小样本量为246,明显139 上文中使用的抽样数量计算公式如下。 ,但是在实际使用中西格玛的平方往往是未知的,因此上文...
  • 对于含有类似经验参数C的地形校正模型而言, 确定经验参数的抽样方法是影响地形校正模型校正效果的一个关键因素。为此, 比较分析了简单随机抽样、坡向分层抽样、坡度分层抽样和cos i分层抽样四种抽样方法分别计算的...
  • 抽样方法

    2019-12-10 13:48:22
    抽样的概念 抽样调查与普查 非抽样误差 抽样形式 统计过程 从总体中抽取样本,通过样本计算统计量基于样本的统计量来推断总体 抽样的概念 指在不能进行全数调查时,为了推断总体的倾向,抽取真实地代表调查总体的...
  • 最后都会说明一下,此次电话调查的数量2300,置信度为95%﹐最大容许误差为±2.5%,这就是抽样调查的典型情景:一个大的集合(比如:千万选民)做一次调查的成本较高,抽样调查可以低成本的用近似的(可接受的)...
  • 目录 1. 抽样的基本概念 1.1 全及总体与样本总体 1.2 全及指标与抽样指标 1.3 样本容量与样本个 1.4 重复抽样和不重复抽样 2. 抽样误差 2.1 抽样误差 2.2 影响抽样误差的因素 ...
  • 并引入模糊集值统计方法确定指标权重,将灰靶决策模型权重由实数序列拓展到区间序列,减小了专家判定过程中的模糊误差.以潘口水库汛期运行水位抬升方案决策为研究案例,将改进模型与传统模型进行比较,结果表明,...
  • 抽样技术

    多人点赞 2020-05-06 18:39:11
    主要关于《抽样技术》一书的知识点总结。
  • 最后都会说明一下,此次电话调查的数量2300,置信度为95%﹐最大容许误差为±2.5%,这就是抽样调查的典型情景:一个大的集合(比如:千万选民)做一次调查的成本较高,抽样调查可以低成本的用近似的(可接受的)...
  • 有很多统计推断是基于正态分布的假设,以标准正态分布变量为基石而构造的三个著名统计量在实际中有广泛的应用,这是因为这三个统计量不仅有明确背景,而且其抽样分布的密度函数有显式表达式,它们被称为统计中的“三...
  • 大数据抽样- 概率抽样,随机采样

    万次阅读 2018-02-26 11:29:58
    在统计学中,抽样(Sampling)是一种推论统计方法,是指从目标总体(Population,或称为母体)中抽取一部分个体作为样本(Sample),通过观察样本的某一或某些属性,依据所获得的数据对总体的数量特征得出具有一定...
  • 时域抽样定理给出了连续信号抽样过程中信号不失真的约束条件:对于基带信号,信号抽样频率大于等于2倍的信号最高频率,即。 时域抽样是把连续信号x(t)变成适于数字系统处理的离散信号x[k] ;信号重建是将离散信号x[k...
  • hadoop 抽样

    千次阅读 2013-09-07 20:15:35
    蓄水库抽样(reservoid sampling) 怎样随机从N个元素中选择一个元素,你依次遍历每个元素,但不知道N多大。 将N个元素用[1、2、...、N]编号。如果在知道N的大小,我们可以从[1、N]中随机选择一个作为选择对象。 ...
  • 当开始一个新的数据科学项目时,首要任务之一将是获取数据,以便能够评估项目的范围...虽然我们知道使用小数据集会导致模型在训练期间快速过拟合,但还有一个经常很少讨论的问题,即模型性能的不确定性问题。在这篇文章
  • 数据预处理——抽样

    千次阅读 2018-02-08 11:16:45
    @ 2018-02-08 有效抽样 抽样方法 1 简单随机抽样 ...然而在统计学和数据挖掘中,抽样的动机并不相同:统计学使用抽样是因为得到感兴趣的整个数据集的费用太高、太费时间;而数据挖掘使用抽样是因...
  • 水库抽样问题

    千次阅读 2013-09-02 14:52:34
    这种应用的场景一般是数据流的情况下,由于数据只能被读取一次,而且数据量很大,并不能全部保存,因此数据量N是无法在抽样开始时确定的;但又要保持随机性,于是有了这个问题。所以搜索网站有时候会问这样的问题。 ...
  • 数据抽样包括: 1.数据类不平衡问题解决 2.随机抽样 3.数据等比例抽样(用于多分类) 4.用于交叉验证的样本抽取 5.1.2类失衡处理方法 在R中,DMwR包中的SMOTE()函数可以实现SMOTE方法。 perc.over=500表示...
  • 蓄水池抽样 均匀抽样

    千次阅读 2011-10-18 11:04:49
    前段时间在BBS上看见一个问题:  如何等概率的从N个元素中选取出K个元素?...这个问题就是一个蓄水池抽样(Reservoir Sampling),算法可以如下描述:  Init : a reservoir with the size: k

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 23,466
精华内容 9,386
关键字:

抽样数如何确定