精华内容
下载资源
问答
  • R语言与正态总体均值区间估计

    千次阅读 2020-04-16 17:05:16
    学习笔记 参考书籍:《统计学》-贾俊平;...一个正态总体均值区间估计 产品重量数据: 74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.5 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.0 75.0 73....

    学习笔记
    参考书籍:《统计学》-贾俊平;《统计学:从数据到结论》-吴喜之;
    原理部分移步:参数估计


    一个正态总体均值的区间估计

    产品重量数据:

    74.3  78.8  68.8  78.0  70.4  80.5  80.5  69.7  71.2  73.5
    79.5  75.6  75.0  78.8  72.0  72.0  72.0  74.3  71.2  72.0
    75.0  73.5  78.8  74.3  75.8  65.0  74.3  71.2  69.7  68.0
    73.5  75.0  72.0  64.3  75.8  80.3  69.7  74.3  73.5  73.5
    

    假定,产品重量数据所代表的总体服从正态分布,且我们不知道总体方差,利用R我们可以计算出总体均值的置信度为95%的置信区间.

    读取数据:

    Tdata <- read.table("data5.txt", header = F)
    new_data <- as.vector(as.matrix(Tdata))
    

    计算置信区间:

    > t.test(new_data, con = 0.95)$conf
    [1] 72.38747 74.89253
    attr(,"conf.level")
    [1] 0.95
    

    输出的总体均值的置信度为95%的置信区间为:(72.38747, 74.89253)



    两个正态总体均值之差的区间估计

    两个城市的AQI数据:

    AQI1	55	52	42	32	37	36	57	66	66	62	45	77	78	60	65	66	91	98	99	90	76
    AQI2	117	52	92	108	142	160	148	167	181	89	79	96	115	56	50	70	69	144	73	85	104
    

    假定俩个城市的AQI数据所代表的总体服从正态分布,我们可以利用R语言计算出置信度为95%的两个总体均值之差的置信区间。

    按照步骤,在进行区间估计之前,我们应该先判断两个总体的方差是否相等,如何判断方差是否相等呢?, 可以用var.test(x, y)函数去检验。如果检验得到的p值很小,小于我们设定的显著性水平,则认为方差不相等;若得到的p值很大,也不能判断方差相等,只能说证明不了方差不等。有些时候,我们可以直接用方差不等的方法去进行区间估计,也不会存在任何问题,因为即使方差相等,结果差别也不大。

    这里我们依然给出方差相等和方差不等的区间估计的两种计算结果

    读取数据:

    aqi <- read.csv("Tdata.csv", header = T)
    

    • 方差不等
    > (mean(aqi$AQI1) - mean(aqi$AQI2))
    [1] -40.33333
    > t.test(aqi$AQI1, aqi$AQI2)$conf
    [1] -60.01738 -20.64928
    attr(,"conf.level")
    [1] 0.95
    

    • 方差相等
    > t.test(aqi$AQI1, aqi$AQI2, var = T)$conf
    [1] -59.80372 -20.86295
    attr(,"conf.level")
    [1] 0.95
    
    展开全文
  • 例子1:糖果公司用一个100粒糖球的样本得出口味持续时间均值的点估计量为62.7分钟,同时总体方差的点估计量为25分钟,这里的均值估计量是根据样本得出的,而方差是总体方差一般来说给出一个区间比给出一个精确的值更...

    例子1:糖果公司用一个100粒糖球的样本得出口味持续时间均值的点估计量为62.7分钟,同时总体方差的点估计量为25分钟,这里的均值估计量是根据样本得出的,而方差是总体方差

    一般来说给出一个区间比给出一个精确的值更保险一些,此例正是为了获取这个区间,
    P(a<μ小于b) = 95%

    这样的话大部分样本的均值都落在这个范围内了

    选择总体统计量 口味持续时间的均值
    求其抽样的分布 100粒糖球为一个抽样,求抽样均值的分布
    根据之前样本均值的分布,我们知道当n足够大时,其服从正态分布

    X¯¯¯ ~ N(μ, σ² /n)
    =>
    X¯¯¯ ~ N(μ,25/100)
    =>
    X¯¯¯ ~ N(μ,0.25)

    要注意的是这里其实是在用抽样均值的分布计算总体均值的置信区间

    决定置信水平
    95%

    求出置信上下限
    ①确定概率的上下限
    P( X¯¯¯ < a) = 0.025
    p( X¯¯¯ > b) = 0.025
    p( b < X¯¯¯ < a) = (1 - 0.025) - 0.025 = 0.95

    ②对 X¯¯¯ 标准化
    Z = ( X¯¯¯ - μ) / 0.25
    Z ~ N(0,1)

    ③根据P(Z < Za) = 0.025, P(Z > Zb) = 0.025
    分别算出Za和Zb分别为-1.96和1.96

    P(-1.96 < ( X¯¯¯ - μ) /0.5 < 1.96 )= 0.95
    P( X¯¯¯ -0.98 < μ < X¯¯¯ + 0.98) = 0.95

    ④由于样本均值是有的,所以 X¯¯¯ = 62.7
    所以 X¯¯¯ 的上下限就是(62.7-0.98,62.7+0.98)

    展开全文
  • T = (X¯¯¯\overline{X} - μ)/(s/n√\sqrt{n})与上篇文章的置信区间相似,只不过c换成了t置信区间取值范围为(X¯¯¯\overline{X} - t(v)*s/n√\sqrt{n}, X¯¯¯\overline{X} + t(v)*s/n√\sqrt{

    当样本很小时
    X¯¯¯ 服从T分布

    T ~ t(v)

    样本的数量为n时,v = n-1
    T = ( X¯¯¯ - μ)/(s/ n )

    与上篇文章的置信区间相似,只不过c换成了t

    置信区间取值范围为( X¯¯¯ - t(v)*s/ n , X¯¯¯ + t(v)*s/ n
    其中μ是整体均值,s是样本标准差

    展开全文
  • 就是用样本统计量作为总体参数的估计,比如用样本均值/方差作为总体均值/方差的估计 区间估计(Interval Estimate) 在点估计的基础上,在一定的置信水平下,给样本统计量加上一个区间范围作为总体参数的取值范围,...

    点估计(Point Estimate)

    就是用样本统计量作为总体参数的估计,比如用样本均值/方差作为总体均值/方差的估计:想要估计学生平均成绩,从中抽取一个样本,样本平均值为85分,把85直接作为学生总体平均分的估计,85就是点估计。

    区间估计(Interval Estimate)和置信水平(Confidence Level)

    在点估计的基础上,在一定的置信水平下,给样本统计量加上一个区间范围作为总体参数的取值范围,这个区间叫置信区间(Confidence Interval)

    置信水平是构造多次置信区间,其中包含了总体参数的置信区间占了多少比例?比如想要估计学生平均成绩,抽取了100个学生样本,这些样本构造了100个置信区间,有95个包含了总体平均分真实值,这时候置信水平就是95%, 显著性水平(Significance Level) α \alpha α则是0.05。 常用的置信水平包括90%,95%,99%。这里要注意,对“在95%的置信水平下总体平均分落在70到90分之间 ” 的一个常见的错误理解是:总体平均分的真实值有95%的概率落在70到90之间。这个“概率”的概念用在这里是不合适的:总体平均分是一个确定的数字而不是一个随机变量,一个确定的数字只有在和不在70到90之间两种情况,不存在“95%的概率”。这里的含义是多次抽样得到的置信区间中,有95%是包含总体平均分真实值。或者:总体均值落在70到90之间的可信程度是95%。

    置信区间的特点:

    1)当置信水平不变,样本量越大,置信区间越窄
    2)当样本量不变,置信水平越高,置信区间越宽

    直觉上理解:

    1)较大的样本能提供更多信息,在同等可能性(置信水平)下,置信区间的宽度减小,也就是总体参数真实值可能的取值范围缩小。
    2)当置信区间比较宽时,这个区间会有更大的可能性(置信水平)包含总体参数真实值。

    单个参数的区间估计

    总体均值的区间估计

    上一篇总结文章中说过,对于均值为 μ \mu μ,方差为 σ 2 \sigma^2 σ2,样本量为 n n n的总体:如果是正态分布,或者非正态总体但样本量足够大,样本均值 x ˉ \bar{x} xˉ的抽样分布服从均值 μ \mu μ,方差为 σ 2 \sigma^2 σ2,或 x ˉ − μ σ / n \frac{\bar{x}-\mu}{\sigma/\sqrt{n}} σ/n xˉμ服从标准正态分布。

    1 − α 1-\alpha 1α的置信水平下:

    z 1 − α / 2 ≤ x ˉ − μ σ / n ≤ z α / 2 z_{1-\alpha/2}\leq\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}\leq z_{\alpha/2} z1α/2σ/n xˉμzα/2

    z α / 2 z_{\alpha/2} zα/2是标准正态分布时density曲线右侧面积为 α / 2 \alpha/2 α/2 z z z的值, 同理可得 z 1 − α / 2 z_{1-\alpha/2} z1α/2就是density曲线右侧面积 1 − α / 2 1-\alpha/2 1α/2 z z z的值(也是左侧面积 α / 2 \alpha/2 α/2时的 z z z值)。但因为是关于y轴的对称分布,有 z 1 − α / 2 = − z α / 2 z_{1-\alpha/2}=-z_{\alpha/2} z1α/2=zα/2。所以可以得到:

    − z α / 2 σ n ≤ x ˉ − μ ≤ z α / 2 σ n -z_{\alpha/2}\frac{ \sigma}{\sqrt{n}}\leq \bar{x}-\mu\leq z_{\alpha/2}\frac{ \sigma}{\sqrt{n}} zα/2n σxˉμzα/2n σ

    总体均值 μ \mu μ的置信区间为:

    x ˉ ± z α / 2 σ n \bar{x}\pm z_{\alpha/2}\frac{ \sigma}{\sqrt{n}} xˉ±zα/2n σ

    常用的 α \alpha α值有0.1,0.05和0.01(分别对应置信水平90%,95%和99%), 对应的 z α / 2 z_{\alpha/2} zα/2值分别为 z 0.05 = 1.645 , z 0.025 = 1.96 , z 0.025 = 2.58 z_{0.05}=1.645,z_{0.025}=1.96,z_{0.025}=2.58 z0.05=1.645,z0.025=1.96,z0.025=2.58 。以最常用的 α = 0.05 \alpha=0.05 α=0.05为例,有 z 0.025 = 1.96 , z 0.975 = − z 0.025 = − 1.96 z_{0.025}=1.96,z_{0.975}=-z_{0.025}=-1.96 z0.025=1.96,z0.975=z0.025=1.96。见下图:
    partly shaded normal density plot 图中两块阴影部分的面积都是0.025, 中间面积为0.95,对应经验法则中的“约有95%的数据落在平均数±2个标准差的范围内”,这里平均数为0,标准差为1。同时, P ( Z ≤ − 1.96 ) = P ( Z ≥ 1.96 ) = 1 − P ( Z ≤ 1.96 ) = 0.025 P(Z\leq-1.96)=P(Z\geq 1.96)=1-P(Z\leq1.96)=0.025 P(Z1.96)=P(Z1.96)=1P(Z1.96)=0.025

    上面的是对于方差已知的正态总体(不管是大样本还是小样本),或非正态大样本总体来说的(也就是说对于方差已知的大样本总体,不管是不是正态分布,或者方差已知的小样本正态总体)。如果大样本总体但方差未知,上面式子中的 σ \sigma σ就用样本方差 s s s来代替,变成 x ˉ ± ∣ z α / 2 ∣ s n \bar{x}\pm |z_{\alpha/2}|\frac{ s}{\sqrt{n}} xˉ±zα/2n s

    但如果是方差未知的小样本正态总体就不是用正态分布,而是用t分布来构造总体均值的置信区间: t = x ˉ − μ s / n ∼ t ( n − 1 ) t=\frac{\bar{x}-\mu}{s/\sqrt{n}}\sim t(n-1) t=s/n xˉμt(n1)。则总体均值在 1 − α 1-\alpha 1α置信水平下的置信区间为 x ˉ ± t α / 2 s n \bar{x}\pm t_{\alpha/2}\frac{ s}{\sqrt{n}} xˉ±tα/2n s, 其中 t α / 2 t_{\alpha/2} tα/2是t分布density曲线下右侧面积为 α / 2 \alpha/2 α/2时的t值,而且因为也是关于y轴的对称分布, t 1 − α / 2 = − t α / 2 t_{1-\alpha/2}=-t_{\alpha/2} t1α/2=tα/2,道理和上面的正态分布差不多。

    总结一下总体均值的置信区间,有以下几种情况:
    方差已知,大样本:正态分布, σ \sigma σ
    方差未知,大样本:正态分布,s
    方差已知,小样本正态:正态分布, σ \sigma σ
    方差未知,小样本正态:t分布,s

    总体比例的区间估计

    总体比例指的是:想要估计一个学校中女生占的比例,随机抽取了100个学生,其中女生有50个,那么全校学生中女生的比例是多少?这个要求的比例就是总体比例。

    大样本的情况下,样本比例 p p p的抽样分布也近似符合正态分布,设总体比例为 π \pi π, 那么 p ∼ N ( π , π ( 1 − π ) n ) p\sim N(\pi, \frac{\pi(1-\pi)}{n}) pN(π,nπ(1π))。与总体均值类似,可以得到 p − π π ( 1 − π ) / n ∼ N ( 0 , 1 ) \frac{p-\pi}{\sqrt{\pi(1-\pi)/n}}\sim N(0,1) π(1π)/n pπN(0,1), 所以有:

    − z α / 2 π ( 1 − π ) n ≤ p − π ≤ z α / 2 π ( 1 − π ) n -z_{\alpha/2}\sqrt{\frac{\pi(1-\pi) }{n}}\leq p-\pi\leq z_{\alpha/2}\sqrt{\frac{\pi(1-\pi) }{n}} zα/2nπ(1π) pπzα/2nπ(1π)

    因为总体比例 π \pi π未知,在实际计算的时候就用 p p p来代替:

    − z α / 2 p ( 1 − p ) n ≤ p − π ≤ z α / 2 p ( 1 − p ) n -z_{\alpha/2}\sqrt{\frac{p(1-p) }{n}}\leq p-\pi\leq z_{\alpha/2}\sqrt{\frac{p(1-p) }{n}} zα/2np(1p) pπzα/2np(1p)

    所以总体比例 π \pi π 1 − α 1-\alpha 1α的置信水平下的置信区间为

    p ± z α / 2 p ( 1 − p ) n p\pm z_{\alpha/2}\sqrt{\frac{p(1-p) }{n}} p±zα/2np(1p)

    总体方差的区间估计

    对于满足分布为 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的正态总体和样本 X 1 , X 2 , . . . X n X_1,X_2,...X_n X1,X2,...Xn, 样本方差 s 2 s^2 s2的抽样分布服从自由度为 n − 1 n-1 n1卡方分布
    ( n − 1 ) s 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{(n-1)s^2}{\sigma^2}\sim \chi^2(n-1) σ2(n1)s2χ2(n1), 因此使用卡方分布来构造总体方差的置信区间。

    1 − α 1-\alpha 1α置信水平下:

    χ 1 − α / 2 2 ≤ ( n − 1 ) s 2 σ 2 ≤ χ α / 2 2 \chi^2_{1-\alpha/2} \leq \frac{(n-1)s^2}{\sigma^2} \leq \chi^2_{\alpha/2} χ1α/22σ2(n1)s2χα/22

    所以总体方差 σ 2 \sigma^2 σ2在在 1 − α 1-\alpha 1α置信水平下的置信区间为:

    ( n − 1 ) s 2 χ 1 − α / 2 2 ≤ σ 2 ≤ ( n − 1 ) s 2 χ α / 2 2 \frac{(n-1)s^2}{\chi^2_{1-\alpha/2}}\leq \sigma^2 \leq \frac{(n-1)s^2}{\chi^2_{\alpha/2}} χ1α/22(n1)s2σ2χα/22(n1)s2

    同理, χ α / 2 2 \chi^2_{\alpha/2} χα/22是卡方分布density曲线下右侧的面积为 α / 2 \alpha/2 α/2 χ 2 \chi^2 χ2的值。当然,因为不是对称分布所以 χ 1 − α / 2 2 \chi^2_{1-\alpha/2} χ1α/22不会等于 − χ α / 2 2 -\chi^2_{\alpha/2} χα/22

    上面说的都是单个总体参数的区间估计,除此之外还有两个总体参数的区间估计。

    两个参数的区间估计

    两个总体均值之差的区间估计

    又分为独立样本(Independent Sample)和匹配样本(Paired Sample)。

    • 独立样本是从两个总体中分别抽取的两个样本,两个样本互相独立。比如分别独立抽取学校A和学校B的学生样本,想要估计同一场考试里的数学成绩平均分之差。

      设总体A和总体B都是正态分布,或不是正态分布但都是大样本,总体均值分别为 μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2,总体方差分别为 σ 1 2 , σ 2 2 \sigma_1^2,\sigma_2^2 σ12,σ22,样本量分别为 n 1 , n 2 n_1,n_2 n1,n2, 那么两个样本均值之差满足:

      x 1 ˉ − x 2 ˉ ∼ N ( μ 1 − μ 2 , σ 1 2 n 1 + σ 2 2 n 2 ) \bar{x_1}-\bar{x_2}\sim N(\mu_1-\mu_2, \frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}) x1ˉx2ˉN(μ1μ2,n1σ12+n2σ22)

      1 − α 1-\alpha 1α置信水平下,总体均值之差的置信区间为

      ( x 1 ˉ − x 2 ˉ ) ± z α / 2 σ 1 2 n 1 + σ 2 2 n 2 (\bar{x_1}-\bar{x_2})\pm z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}} (x1ˉx2ˉ)±zα/2n1σ12+n2σ22

      而在小样本,正态分布,但方差未知的情况下,需要用到样本方差 s 1 2 , s 2 2 s_1^2,s_2^2 s12,s22, 又有两种情况:

    1. 总体方差未知但相等: σ 1 2 = σ 2 2 \sigma_1^2=\sigma_2^2 σ12=σ22

      1 − α 1-\alpha 1α置信水平下,总体均值之差的置信区间为

      ( x 1 ˉ − x 2 ˉ ) ± t α / 2 ( n 1 + n 2 − 2 ) s p 2 ( 1 n 1 + 1 n 2 ) (\bar{x_1}-\bar{x_2})\pm t_{\alpha/2}(n_1+n_2-2)\sqrt{s_p^2(\frac{1}{n_1}+\frac{1}{n_2})} (x1ˉx2ˉ)±tα/2(n1+n22)sp2(n11+n21) , s p 2 = ( n 1 − 1 ) s 1 2 + ( n 2 − 1 ) s 2 2 n 1 + n 2 − 2 s_p^2=\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2} sp2=n1+n22(n11)s12+(n21)s22

    2. 总体方差未知且不相等: σ 1 2 ≠ σ 2 2 \sigma_1^2\neq\sigma_2^2 σ12=σ22

      1 − α 1-\alpha 1α置信水平下,总体均值之差的置信区间为

      ( x 1 ˉ − x 2 ˉ ) ± t α / 2 ( v ) s 1 2 n 1 + s 2 2 n 2 (\bar{x_1}-\bar{x_2})\pm t_{\alpha/2}(v)\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}} (x1ˉx2ˉ)±tα/2(v)n1s12+n2s22 , v = ( s 1 2 n 1 + s 2 2 n 2 ) 2 ( s 1 2 / n 1 ) 2 n 1 − 1 + ( s 2 2 / n 2 ) 2 n 2 − 1 v=\frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}} v=n11(s12/n1)2+n21(s22/n2)2(n1s12+n2s22)2

    • 匹配样本中,两个样本的对象相同。比如抽取一个学生样本,想要估计上了一门课程前后考试平均分数之差。

      计算方法是先算出各差值 d i d_i di,然后算出各差值的均值 d ˉ \bar{d} dˉ和标准差 σ d \sigma_d σd,那么在 1 − α 1-\alpha 1α置信水平下匹配样本总体均值之差的置信区间为

      d ˉ ± z α / 2 σ d n \bar{d}\pm z_{\alpha/2}\frac{\sigma_d}{\sqrt{n}} dˉ±zα/2n σd

    两个总体比例之差的区间估计

    设两个独立样本的样本比例分别为 p 1 p_1 p1 p 2 p_2 p2, 总体比例分别为 π 1 \pi_1 π1 π 2 \pi_2 π2,那么在 1 − α 1-\alpha 1α置信水平下两个独立样本总体比例之差的置信区间为

    ( p 1 − p 2 ) ± z α / 2 p 1 ( 1 − p 1 ) n 1 + p 2 ( 1 − p 2 ) n 2 (p_1-p_2)\pm z_{\alpha/2}\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}} (p1p2)±zα/2n1p1(1p1)+n2p2(1p2)

    两个总体方差之比的区间估计

    注意样本方差满足卡方分布,两个卡方分布之比是F分布,那么样本方差之比就是F分布了。

    设两个独立样本的样本方差分别为 s 1 2 s_1^2 s12 s 2 2 s_2^2 s22, 总体方差分别为 σ 1 2 \sigma_1^2 σ12 σ 2 2 \sigma_2^2 σ22样本方差之比 s 1 2 / s 2 2 s_1^2/s_2^2 s12/s22的抽样分布服从自由度为 n 1 − 1 , n 2 − 1 n_1-1,n_2-1 n11,n21F分布 s 1 2 s 2 2 × σ 1 2 σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \frac{s_1^2}{s_2^2}\times \frac{\sigma_1^2}{\sigma_2^2}\sim F(n_1-1,n_2-1) s22s12×σ22σ12F(n11,n21), 因此使用F分布来构造总体方差之比的置信区间。

    1 − α 1-\alpha 1α置信水平下

    F 1 − α / 2 ≤ s 1 2 s 2 2 × σ 1 2 σ 2 2 ≤ F α / 2 F_{1-\alpha/2} \leq \frac{s_1^2}{s_2^2}\times \frac{\sigma_1^2}{\sigma_2^2} \leq F_{\alpha/2} F1α/2s22s12×σ22σ12Fα/2

    所以在 1 − α 1-\alpha 1α置信水平下,总体方差之比的置信区间为

    s 1 2 / s 2 2 F 1 − α / 2 ≤ s 1 2 s 2 2 ≤ s 1 2 / s 2 2 F α / 2 \frac{s_1^2/s_2^2 }{F_{1-\alpha/2}}\leq \frac{s_1^2}{s_2^2} \leq \frac{s_1^2/s_2^2 }{F_{\alpha/2}} F1α/2s12/s22s22s12Fα/2s12/s22

    展开全文
  • R语言与总体比例的置信区间

    千次阅读 2020-04-27 10:22:52
    成功概率或总体比例的置信区间总体和大样本情况 假设有一个总体很大,我们共调查了nnn个人,其中持有某种观点的为xxx人,则样本比例为p^=x/n\hat {p}=x/np^​=x/n,那么比例ppp的100(1−α)%100(1-\alpha) \%100...
  • 两个正态总体均值差的置信区间均值差????1 − ????2的置信区间当????1 ????2已知当????1 ????2未已知例1例2 均值差????1 − ????2的置信区间 当????1 ????2已知 当????1 ????2未已知 例1 例2
  • 理论基础 对于单个正态总体X, (注:实际业务中,“总体分布为正态分布”这一论断有待检验,检验的方法也有很多种,最简单的方法就是画QQ图或者经验分布...当方差已知时,若想对均值进行区间估计,那么可以构造枢轴
  • 我们可以使用点估计量来估计总体均值、方差或一定比例的精确值,但我们无法确定我们使用的样本一定是无偏样本,此时可以考虑使用置信区间的方法来估计总体统计量,它是考虑了不确定性的方法。 本篇目录参考资料:...
  • 两个总体均值差μ1−μ2\mu_1-\mu_2μ1​−μ2​的置信区间 (1)σ12、σ22\sigma_1^2、\sigma_2^2σ12​、σ22​均为已知 因为X‾、Y‾\overline X、\overline YX、Y分别为μ1、μ2\mu_1、\mu_2μ1​、μ2​的无偏...
  • 双正态总体均值置信区间估计及MATLAB实现.pdf
  • 正态总体均值与方差的置信区间
  • 置信区间 假设现在测量了12个小鼠体重的值,注意这里只测量了12只小鼠(样本),而不是地球上的每一只小鼠(总体) 取12个测量值,计算平均值,注意这里是样本均值,而不是总体均值(地球上所有小鼠的均值) 理解...
  • 单个正态总体均值区间估计 单个正态总体的均值的区间估计可以分为两类:方差已知和方差未知。 方差已知 枢轴量为x‾−μσ/n∼N(0,1)\frac{\overline x - \mu}{\sigma / \sqrt{n}} \sim N(0, 1)σ/n​x−μ​∼N...
  • 针对几种常见分布的总体在均值未知情况下,讨论了总体均值方差的联合经验似然估计,又利用均值的无偏估计量X
  • 均值之差的置信区间

    千次阅读 2019-03-13 17:15:10
    我们想检验一种低脂节食能否帮助...4个月后,第一组的体重减轻均值是9.31磅,标准差是4.67磅。对照组体重减轻均值是7.40磅,标准差是4.04磅。 第一组:均值=9.31,标准差=4.67 第二组:均值=7.40,标准差=4.04 均值...
  • 关于两个正态总体均值差μ1-μ2的置信区间 六、(本题 13 分)为了提高某一化学生产过程的得率,试图采用一种新的催化剂,为慎重起见,首先在 试验工厂进行试验。分别采用原来的催化剂和新的催化剂各进行 8 次...
  • 区间估计简介Python求解单个正态总体参数的置信区间参考区间估计简介假定参数是射击靶上 10 环的位置,作一次射击,打在靶心 10 环的位置上的可能性很小,但打在靶子上的可能性就很大,...
  • 计算单个总体XXX~N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的参数μ\muμ对给定置信水平1−α1-\alpha1−α的单侧置信区间,方法与计算双侧置信区间大同小异。 计算枢轴量分布(已知σ2\sigma^2σ2为N(0,1)N(0,1)N(0,1),...
  • print("\n 进行100次,随机抽取1000个样本,置信度95%,计算置信区间:") for i in range(100): sample=np.random.choice(all_people, size=1000) zms=sm.stats.DescrStatsW(sample).zconfint_mean(alpha=0.05) ...
  • 为计算两个正态总体均值差μ1−μ2\mu_1-\mu_2μ1​−μ2​在指定置信度下的双侧置信区间,涉及样本均值x‾\overline{x}x,y‾\overline{y}y​,总体方差σ12\sigma_1^2σ12​,σ22\sigma_2^2σ22​(或样本方差s22...
  • 置信区间会用到标准误差,而标准误差会用到标准差,它们的计算如下: 总体标准差: σ=∑i=in(xi−xˉ)2n \sigma=\sqrt{\frac{\sum_{i=i}^{n}(x_i-\bar{x})^2}{n}} σ=n∑i=in​(xi​−xˉ)2​ ​ 样本标准差: S=...
  • 单个正态总体区间的均值,方差的置信区间 两个正态总体区间的均值差,方差比的置信区间 在网找了找,没找到有人做的现成的,我特地总结了一下,已给大家提供方便!
  • 置信区间

    千次阅读 2019-07-12 21:34:03
    相关名词解释 区间估计:给定置信水平,根据估计值确定真实值可能出现的区间范围,该区间通常以...置信区间:用中括号[a,b]表示样本估计总体平均值误差范围的区间。a、b的具体数值取决于你对于”该区间包含总体均...
  • 现实生活中,人们往往很难知道样本总体的均值,比如我知道该网络上网的10000个人平均年龄是20岁,但不能了解该网络人群上网年龄总体均值究竟为多少,...置信区间:是当样本总体均值μ未知时,我通过统计量去估计未...
  • 与计算双正态总体均值差的双侧区间估计相仿,我们可以调用单正态总体均值的单侧置信区间的计算函数muBound(详见博文《单个正态总体均值的单侧区间估计》)计算双正态总体均值差的单侧区间估计:只需对参数mean传递...
  • 正态总体,σ\sigmaσ已知 公式: xˉ±za/2σn\bar{x}\pm z_{a/2}\frac{\sigma}{\sqrt{n}}xˉ±za/2​n​σ​ 例: 一家食品生产企业以生产袋装食品为主,每天的唱片大约为8000袋。按规定每袋的重量应为100克。为对...
  • 均值μ\muμ的置信区间 (1) σ2\sigma^2σ2已知 设X1,...,XnX_1,...,X_nX1​,...,Xn​是取自N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的样本,σ2\sigma^2σ2已知,求参数μ\muμ的置信度为1−α1-\alpha1−α的置信区间...
  • 如何利用R语言画出含有置信区间的累积概率分布图 数据导入 1.data<c(0.327,0.048,0.436,0.501,0.289,0.050,0.099,0.010,0.135,0.000) 或data<-scan(‘data.text’) 2.install.packages(“sROC”) 3.library...
  • R语言——自定义函数求置信区间

    万次阅读 2017-12-10 18:51:01
    自定义函数求单正态样本均值、方差置信区间,两个正态样本均值差、方差比的置信区间
  • 样本均值的抽样分布/置信区间

    千次阅读 2019-08-23 11:24:51
    随着样本容量n趋近于无穷,样本均值的抽样分布趋于正态分布(标准差越小,图形越瘦,越凑近均值)(此时近似于正态分布的抽样分布,它的均值等于总体均值)(频率分布) 样本均值抽样分布的标准差通常称为均值标准...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,210
精华内容 1,284
关键字:

总体均值置信区间