精华内容
下载资源
问答
  • 针对明渠垂线流速分布测量样本容量对对数公式拟合的影响问题,通过水槽试验,应用激光多普勒测速仪,在0.2倍水深内布设110个点进行垂线流速测量;按相对等距原则,从110个测量数据中共生成11组不同样本容量的流速系列进行...
  • 一、样本容量 研究不同个体的表达量,样本容量(Sample size):N=3 研究不同个体的表达量,样本容量(Sample size):N=3 技术重复只能告诉我们该测量基因表达的方法准确性,并不会反应个体间的区别。 研究一个...

    一、样本容量

    mark

    研究不同个体的表达量,样本容量(Sample size):N=3

    mark

    研究不同个体的表达量,样本容量(Sample size):N=3

    技术重复只能告诉我们该测量基因表达的方法准确性,并不会反应个体间的区别。

    mark

    研究一个方法的准确性,样本容量(Sample size):N=4

    二、有效样本容量

    mark

    假设,蓝色小人是一对双胞胎,他们有着高度相似的基因组,但很明显又是两个不同的个体。那么现在不能简单的用样本容量,需要用到有效样本容量来评价。

    假设,双胞胎的相关性为0.7,有效样本容量公式:

    mark

    代入数值,发现相关性高,有效样本容量就会很小,也就是说,两个高相似度的样本更能看做是一个样本:

    mark

    计算上面的样本容量:N=3.18

    假设一个很低的相关性 0.1,代入计算,会发现更接近2,更像两个样本:

    mark

    这种情况下,样本容量:N=3.82

    致谢:

    https://www.youtube.com/channel/UCtYLUTtgS3k1Fg4y5tAhLbw

    展开全文
  • 统计基础九:抽样及样本容量.pptx
  • 怎样确定样本容量的理论解释

    千次阅读 2018-07-18 21:02:03
    设随机变量的均值为 μμ\mu,方差为 σ2σ2\sigma^2,则 nnn 个样本的均值为 μμ\mu,方差为 σ2nσ2n\frac{\sigma^2}{n}。 在给定的置信水平 1−α1−α1-\alpha 下, 设样本的均值为 X¯¯¯¯X¯\overline{X}...

    研究随机问题时,基本都要用到抽样仿真,比较仿真结果与实验结果的偏差。

    设随机变量的均值为 μ μ ,方差为 σ2 σ 2 ,则 n n 个样本的均值为 μ,方差为 σ2n σ 2 n

    在给定的置信水平 1α 1 − α 下, 设样本的均值为 X¯¯¯¯ X ¯ ,其误差 ε ε 由下列计算公式得出:

    ε=|X¯¯¯¯μ| ε = | X ¯ − μ |

    1. 若 σ σ 已知

    由于中心极限定理,大量样本服从正态分布,样本的标准差为 σ/n σ / n ,根据正态分布概率的计算公式,

    Φ(|X¯¯¯¯μ|σ/n)=α/2 Φ ( | X ¯ − μ | σ / n ) = α / 2

    因此,
    ε=|X¯¯¯¯μ|=Zα/2σn ε = | X ¯ − μ | = Z α / 2 σ n

    可以推出样本容量 n n 的计算公式为:

    n=Zα/22σ2ε2

    2. 若 σ σ 未知

    大部分情况下 σ σ 是未知的,为了消除 σ σ 的影响,有学者引入了 t t 分布,

    t=X¯μS/n

    上面这个表达式为 自由度为 n1 n − 1 t t 分布,其中 S 为样本方差,则

    ε=|X¯¯¯¯μ|=tα(n1)Sn ε = | X ¯ − μ | = t α ( n − 1 ) S n

    得到 n n 的计算公式为:

    n=tα2(n1)S2ε2

    在样本容量 n>30 n > 30 时,置信水平 α<0.05 α < 0.05 时,一般可以近似采用下面的计算公式:

    n=4S2ε2 n = 4 S 2 ε 2

    若样本容量实在很小,则采用 “试差法” 确定 n n <script type="math/tex" id="MathJax-Element-30">n</script>.

    参考资料:
    1. https://en.wikipedia.org/wiki/Student%27s_t-distribution
    2. https://wenku.baidu.com/view/45a2dab5f605cc1755270722192e453610665bef.htmlrec_flag=default&sxts=1531916030126

    展开全文
  • 题目要求 作业内容:在30000个人中抽取100000次,抽样数量依次为20,40,…500,并最后以抽取...做一个双重循环,针对每个样本容量,都进行100000次实验,变量sum用来统计符合条件的次数。使用sample函数,指定replace=

    题目要求

    作业内容:在30000个人中抽取100000次,抽样数量依次为20,40,…500,并最后以抽取数量为自变量,概率为因变量作图。

    文件下载地址点击这里

    考察知识点

    • 规则向量的生成
    • 如何在向量中添加数据
    • mean、sample的使用
    • 绘图函数plot的使用

    思路

    首先读取数据,因为得到的数据是data.frame格式,我们先将其转化为矩阵形式,然后转化为一维向量格式,便于抽取样本。

    做一个双重循环,针对每个样本容量,都进行100000次实验,变量sum用来统计符合条件的次数。使用sample函数,指定replace=FALSE表示取出不放回,对取出的数据计算平均值,判断平均值是否在169~170之间,如果满足这个条件sum就加1,最后通过sum与实验次数(100000)的比值计算概率。使用append函数,将计算得到的概率添加在列表good_sample_p中。

    使用plot绘图函数,指定xlab和ylab标签,再指定图像类型为点划线,最后使用title函数添加标题

    代码

    a <- read.csv('heigh_30000.csv')
    a <- as.matrix(a)
    data <- as.vector(a)
    
    good_sample_p <- c()
    
    for (i in seq(20,500,by=20)){
      sum <- 0  # 记录满足条件的个数
      for (j in 1:100000){
        x <- sample(data,i,replace=FALSE)  # 抽取不放回
        y <- mean(x,trim=0,na.rm=TRUE)  # trim=0不修剪掉排在首尾的部分 ,na.rm=TRUE移除缺省值
        if( 169<y && y<170){
          sum <- sum+1
        }
      }
      p <- sum/100000  # 计算概率
      good_sample_p <- append(good_sample_p,p)
    }
    
    # 添加x,y数据,设置x轴,y轴标签,也可以在title函数中放置
    plot(seq(20,500,by=20), good_sample_p,type = 'b',xlab = 'Sample size',ylab = 'Good sample probability')
    # 添加标题
    title('Relationship between Sample size and Good sample probability', col.lab = 2, cex.lab = 2)
    

    截图

    在这里插入图片描述

    展开全文
  • 样本容量的确定

    万次阅读 2018-03-15 08:46:29
    样本容量:样本中个体的数目或组成抽样总体的单位数。•必要样本容量:亦称必要样本单位数,是指满足调查目的要求的情况下,至少需要选择的样本单位数。一、估计总体均值时样本容量的确定1.重复抽样一旦确定了置信...
    样本容量:

    样本中个体的数目或组成抽样总体的单位数。

    必要样本容量

    亦称必要样本单位数,是指满足调查目的要求的情况下,至少需要选择的样本单位数。

    一、估计总体均值时样本容量的确定

    1.重复抽样

    一旦确定了置信水平(1-α),Zα/2的值就确定了,对于给定的的值和总体标准差σ,就可以确定任一希望的允许误差所需要的样本容量。令E代表所希望达到的允许误差,即:


    由此可以推到出确定样本容量的公式如下:


    2.重复抽样


    样本容量 n 与总体方差成正比
    绝对误差成 反比,
    概率度成正比。

    例:拥有MBA学位的研究生年薪的标准差大约为4000 元,假定想要估计年薪95%的置信区间,希望允许误差为10000 元,应抽取多大的样本容量?


    二、估计总体比例时样本容量的确定

    1.重复抽样

    一旦确定了置信水平(1-α),Zα/2的值就确定了。由于总体比例的值是固定的,所以允许误差由样本容量来确定,样本容量越大允许误差就越小。估计的精度就越好。因此,对于给定的π,就可以确定任一希望的允许误差所需要的样本容量。令E代表所希望达到的允许误差,即:

    由此可以推导出重复抽样和无限总体抽样条件确定样本容量的公式如下:

    2.重复抽样

    d 的取值一般小于 0.1
    π 未知,以样本比例 p 替代
    π p 都未知时,可取 0.5 ,这是一种谨慎估计

    某社区想通过抽样调查了解居民参加体育活动的比率,如果把误差范围设定在5%,问如果以95%的置信水平进行参数估计,需要多大的样本?


    影响样本容量n的因素

    a) 总体个单位之间的差异
    b) 概率保证程度
    c) 允许误差的大小
    d) 抽样方式
    e) 抽样的组织形式


    确定样本容量的注意事项

    一、在实际中采用不重复抽样,但常用重复抽样下的公式代替;

    二、若和p未知,其处理方式是:

            1.用过去近期的数据代替,

            2.用样本数据代替,

            3.p=0.5或最接近0.5的值;

    三、对同一总体,若求出的NxNp不等,这时取较大的作为必要样本容量,

            以同时满足做两种调查的需要;

    四、在实际工作中,常使用重复抽样下的简单随机抽样公式。

    展开全文
  • 最经典的神经网络就是BP神经网络,对神经网络的训练至关重要,本文讨论如何合理选取样本容量
  • 安川大容量Σ-II系列伺服产品样本pdf,安川大容量Σ-II系列伺服产品全新出击,为大型设备的革新提供有力支持。 小型、低惯量伺服电机:新机型SGMVH追求小型、低惯量,额定输出功率22~75kW,额定转速1500/800min-1 与...
  • 区间估计 --- 样本容量的求解

    千次阅读 2018-09-05 17:31:53
    应用场景:对于美国汽车租赁已有的市场发现,租赁一辆中型汽车的租赁费用大约每天约55美元,假定...求:所需的样本容量的大小 数据符合正态分布特征 技术场景:E值是使用者能接受的边际误差,z 值可以直接由区间...
  • Power Analysis 估算样本容量前言一、使用G*power计算统计检验力 前言 为什么要进行功效分析? 统计功效指的是某检验能够正确的拒绝一个错误的虚无假设的能力,1-β。 为了确定研究的效应是否稳定。在假设检验中,...
  • 在对系统输出进行辨识分类建模时,当实际试验样本量不足时,工程上通常考虑利用各种信息源合理增加补充试验样本,而合理确定补充样本容量,避免过多的样本“淹没”实际系统信息,是补充样本需要考虑的关键因素之一。...
  • 扩充样本数量

    2017-07-15 17:44:09
    随机扩充图片,增加样本数量
  • 介绍了关于安川大容量Σ-II系列产品样本的详细说明,提供伺服系统的技术资料的下载。
  • 7个高血压患者服用新药3个月后,血压分别上升了1.5,2.9,0.9,3.9,3.2,2.1,1.9.要求计算所有病人血压上升值的期望在95%的置信...若总体为未知的非正态分布时,只要样本容量 n足够大(通常要求n ≥30),样本均值仍会接
  • 通过生丝纤度变异系数电子检验的计算机模拟实验,对检验样本容量问题进行了探讨,确认了对于各种不同纤度波动特 性的生丝,进行生丝电子检验的最佳样本容量;并讨论了生丝纤度检验时的连续检测结果与50 m检测结果之间的...
  • 若总体的分布是正态分布,且方差已知,则无论样本容量是大是小,样本均值的抽样分布都服从正态分布; 而如果总台的分布是正态分布,抽出的样本为小样本,且方差未知,则样本均值的抽样分布服从t分布。...
  • 脑电识别中EEG样本容量浮动的几点考察,王海,,在建立脑电识别模型的过程中脑电样本常被调整,本文研究了脑电样本容量的相关浮动变化对脑电识别产生的影响,以及对这一变化应采
  • 在数据处理过程中,首先要抽取足够数量的样本,本Excel为作者根据统计学教科书中的公式自行编写的样本量估算小工具,希望能够为大家提供一定的帮助。
  • 统计学——小样本容量置信区间

    千次阅读 2018-01-05 12:01:29
    一般来讲,n T分布和正态分布相似,具有fatter tail,因为...有些记法在上面加了个帽子记为,表示这是由样本标准差估算出来的sample mean的standard devication。 例题:7名学生在使用了新研制的钙片3个
  • 信用评分建模中样本容量不足怎么办 在建立个人信用评分模型时,不仅需要有足够多的表征信贷申请人信用行为的特征变量,而且建模样本的容量也必须达到一定的数量。 一般来说,样本容量越大,所建立的模型的精度或...
  • 安川_大容量Σ-V系列产品样本pdf,安川_大容量Σ-V系列产品样本
  • 《数理统计》第8章5样本容量的选取.ppt
  • 用R软件随机模拟产生6组均值为5,方差为100的随机数,其样本个数分别设为100,1000,10000,100000,1000000,10000000,100000000。观察各组数据的样本方差和样本均值的差异。下面给出模拟程序: n <- c(100,1000,...
  • 为了提高EWMA标准差控制图的检测速度,提出变化抽样区间和样本容量EWMA标准差控制图,并同传统的EWMA和变化抽样区间的EWMA标准差控制图进行的比较.最后模拟结果显示对于较小的方差漂移,VSSI EWMA标准差控制图检测速度...
  • 放回取样(样本容量

    千次阅读 2016-01-04 23:06:50
    对于每个样本而言,第一行是一个整数n,指的是取样的次数,之后是n行,每行是取出小球的标签,测试样例以0结束。 Output 对于每一次的放回取样,用一行输出不同小球的个数 Sample Input Copy sample ...
  • 安川大容量伺服样本pdf,安川大容量伺服样本
  • 未配对或配对样本的学生 t 检验。 该文件适用于相等或不相等的样本量; 配对或未配对的样本。 当检验未配对时,Fisher-Snedecor F 检验为用于评估方差的相等性。 如果方差不相等, 执行 Satterthwaite 的近似 t 检验...
  • 在之前对yolov3的学习中,有时候发现小样本数据集容易出现过拟合或者泛化能力不强的问题,在对这一问题提出的不同解决方法进行了摸索和尝试,发现提高数据集样本容量是一个比较直接和简单粗暴的方法,以下纪录这一...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 26,181
精华内容 10,472
关键字:

影响样本容量的是