精华内容
下载资源
问答
  • 随机变分不等式问题的一种样本均值近似方法,张攀,贺素香,基于D-价值函数, 本文建立了与随机变分不等式问题EV模型等价的无约束优化模型, 并采用样本均值近似方法得到了该模型的样本均值近似�
  • 样本均值的抽样分布One of the most important concepts discussed in the context of inferential data analysis is the idea of sampling distributions. Understanding sampling distributions helps us better ...

    样本均值的抽样分布

    One of the most important concepts discussed in the context of inferential data analysis is the idea of sampling distributions. Understanding sampling distributions helps us better comprehend and interpret results from our descriptive as well as predictive data analysis investigations. Sampling distributions are also frequently used in decision making under uncertainty and hypothesis testing.

    在推论性数据分析的背景下讨论的最重要的概念之一是采样分布的想法。 了解采样分布有助于我们更好地理解和解释描述性和预测性数据分析调查的结果。 抽样分布也经常用于不确定性和假设检验的决策中。

    什么是抽样分布? (What are sampling distributions?)

    You may already be familiar with the idea of probability distributions. A probability distribution gives us an understanding of the probability and likelihood associated with values (or range of values) that a random variable may assume. A random variable is a quantity whose value (outcome) is determined randomly. Some examples of a random variable include, the monthly revenue of a retail store, the number of customers arriving at a car wash location on any given day, the number of accidents on a certain highway on any given day, weekly sales volume at a retail store, etc. Although the outcome of a random variable is random, the probability distribution allows us to gain and understanding about the likelihood and probabilities of different values occurring in the outcome. Sampling distributions are probability distributions that we attach to sample statistics of a sample.

    您可能已经熟悉概率分布的概念。 概率分布使我们对与随机变量可能采用的值(或值的范围)相关的概率和似然性有所了解。 随机变量是其值(结果)是随机确定的数量。 随机变量的一些示例包括:零售商店的月收入,在任何给定的一天到达洗车地点的顾客数量,在任何给定的一天在特定高速公路上发生的事故数量,在零售店的每周销量尽管随机变量的结果是随机的,但概率分布使我们获得并了解结果中出现的不同值的可能性和概率。 抽样分布是我们附加到样本的样本统计量的概率分布。

    样本均值作为样本统计量 (Sample mean as a sample statistic)

    A sample statistic (also known simply as a statistic) is a value learned from a sample. Here is an example, suppose you collect the results of a survey filled out by 250 randomly selected individuals who live in a certain neighborhood. Based on the survey results you realize that the average annual income of the individuals in this sample is $82,512. This is a sample statistic and is denoted by x̅ = $82,512. The sample mean is also a random variable (denoted by X̅) with a probability distribution. The probability distribution for X̅ is called the sampling distribution for the sample mean. Sampling distribution could be defined for other types of sample statistics including sample proportion, sample regression coefficients, sample correlation coefficient, etc.

    样本统计量(也简称为统计量)是从样本中学到的值。 这是一个示例,假设您收集由居住在某个社区中的250个随机选择的个人填写的调查结果。 根据调查结果,您会发现此样本中的个人平均年收入为$ 82,512。 这是一个样本统计量,用x̅= $ 82,512表示。 样本均值也是具有概率分布的随机变量(用X表示)。 X̅的概率分布称为样本均值的采样分布。 可以为其他类型的样本统计定义样本分布,包括样本比例,样本回归系数,样本相关系数等。

    You might be wondering why X̅ is a random variable while the sample mean is just a single number! The key to understanding this lies in the idea of sample to sample variability. This idea refers to the fact that samples drawn from the same population are not identical. Here’s an example, suppose in the example above, instead of conducting only one survey of 250 individuals living in a particular neighborhood, we conducted 35 samples of the same size in that neighborhood. If we calculated the sample mean for each of the 35 samples, you would be getting 35 different values. Now suppose, hypothetically, we conducted many many surveys of the same size in that neighborhood. We would be getting many many (different) values for sample means. The distribution resulting from those sample means is what we call the sampling distribution for sample mean. Thinking about the sample mean from this perspective, we can imagine how X̅ (note the big letter) is the random variable representing sample means and (note the small letter) is just one realization of that random variable.

    您可能想知道为什么X̅是一个随机变量,而样本均值只是一个数字! 理解这一点的关键在于样本之间的差异性 。 这个想法指的是从相同总体中抽取的样本不完全相同的事实。 这是一个示例,假设在上面的示例中,我们没有对居住在特定社区中的250个人进行一次调查,而是在该社区中进行了35个相同大小的样本。 如果我们为35个样本中的每个样本计算样本均值 ,您将获得35个不同的值。 现在假设,我们在该邻里进行了许多相同规模的调查。 我们将获得许多(不同)样本均值值。 由这些样本均值得出的分布就是所谓的样本均值的采样分布。 从这个角度考虑样本均值,我们可以想象X̅(注意大字母)是代表样本均值和 (注意小字母)的随机变量的方式。 只是该随机变量的一种实现。

    样本均值的抽样分布 (Sampling distribution of the sample mean)

    Assuming that X represents the data (population), if X has a distribution with average μ and standard deviation σ, and if X is approximately normally distributed or if the sample size n is large,

    假设X代表数据(种群),如果X具有平均μ和标准差σ的分布,并且X近似呈正态分布,或者样本量n大,

    Image for post

    The above distribution is only valid if,

    以上分配仅在以下情况下有效:

    • X is approximately normal or sample size n is large, and,

      X近似正常样本大小n大,并且,

    • the data (population) standard deviation σ is known.

      数据(种群)标准偏差σ是已知的。

    If X is normal, then X̅ is also normally distributed regardless of the sample size n. Central Limit Theorem tells us that even if X is not normal, if the sample size is large enough (usually greater than 30), then X̅’s distribution is approximately normal (Sharpe, De Veaux, Velleman and Wright, 2020, pp. 318–320). If X̅ is normal, we can easily standardize and convert it to the standard normal distribution Z.

    如果X是正态的,则X′也将呈正态分布,而与样本大小n无关。 中心极限定理告诉我们,即使X不是正态的,如果样本量足够大(通常大于30),则X的分布近似正态(Sharpe,De Veaux,Velleman和Wright,2020年,第318-320页) )。 如果X̅是正态的,我们可以轻松地将其标准化并将其转换为标准正态分布Z。

    If the population standard deviation σ is not known, we cannot assume that the sample mean X̅ is normally distributed. If certain conditions are satisfied (explained below), then we can transform X̅ to another random variable t such that,

    如果总体标准差σ是知道,我们不能假设样本均值的正态分布。 如果满足某些条件(如下所述),那么我们可以将X transform转换为另一个随机变量t,这样,

    Image for post

    The random variable t is said to follow the t-distribution with n-1 degrees of freedom, where n is the sample size. The t-distribution is bell-shaped and symmetric (just like the normal distribution) but has fatter tails compared to the normal distribution. This means values further away from the mean have a higher likelihood of occurring compared to that in the normal distribution.

    据说随机变量t跟随t分布具有n-1个自由度,其中n是样本大小。 t分布呈钟形且对称(就像正态分布一样),但与正态分布相比,其尾部更胖。 这意味着与正态分布相比,远离平均值的值出现的可能性更高。

    The conditions to use the t-distribution for the random variable t are as follows (Sharpe et al., 2020, pp. 415–420):

    将t分布用于随机变量t的条件如下(Sharpe等人,2020年,第415-420页):

    • If X is normally distributed, even for small sample sizes (n<15), the t-distribution can be used.

      如果X是正态分布的,即使对于小样本量( n < 15),也可以使用t分布。

    • If the sample size is between 15 and 40, the t-distribution can be used as long as X is unimodal and reasonably symmetric.

      如果样本大小在15到40之间,则只要X是单峰且合理对称,就可以使用t分布。
    • For sample sizes greater than 40, the t-distribution can be used unless X’s distribution is heavily skewed.

      对于大于40的样本,除非X的分布严重偏斜,否则可以使用t分布。

    用Python模拟 (Simulation with Python)

    Let’s draw a sample of size n=250 from the normal distribution. Here we are assuming that our data is normally distributed and has parameters μ = 20 and σ = 3. Collecting one sample from this population

    让我们从正态分布中绘制一个大小为n = 250的样本。 这里我们假设我们的数据是正态分布的,并且参数μ= 20和σ=3。从该总体中收集一个样本

    Running this code once gives me one instance (or realization) of the random variable X̅. Below are 10 values for after I ran this code 10 times.

    运行此代码一次,便为我提供了随机变量X̅的一个实例(或实现)。 在我运行此代码10次后,下面是x̅的 10个值。

    Image for post

    But if I ran this code 10,000 times and recorded the values of and plotted the frequency (or density) of the values, I would get the following result.

    但是,如果我运行此代码10,000次并记录了x values的值并绘制了这些值的频率(或密度),我将得到以下结果。

    Image for post
    The distribution of the sample mean (image by author).
    样本均值的分布(作者提供的图像)。

    As you can see, the distribution is approximately symmetric and bell-shaped (just like the normal distribution) with an average of approximately 20 and a standard error that is approximately equal to 3/sqrt(250) = 0.19.

    如您所见,分布近似对称且呈钟形(就像正态分布一样),平均分布约20,标准误差约等于3 / sqrt(250)= 0.19。

    Sampling from the same population with different sample sizes will result in different measures of spread in the outcome distribution. As we expect, increasing the sample size will reduce the standard error and therefore, the distribution will be narrower around its average. Note that the distribution of X̅ is normal even for extremely small sample sizes. This is because X is normally distributed.

    从具有不同样本量的同一总体中进行采样将导致结果分布中差异的度量不同。 正如我们所期望的,增加样本量将减少标准误差,因此,分布将在其平均值附近变窄。 请注意,即使样本量非常小,X̅的分布也是正常的。 这是因为X是正态分布的。

    Image for post
    The effect of sample size on the standard error of the distribution for the sample mean (image by author).
    样本量对样本均值分布的标准误差的影响(作者提供的图像)。

    如果总体(数据)不正常怎么办? (What if the population (data) is not normal?)

    No worries! Even if your data is not normally distributed, if the sample size is large enough, the distribution of X̅ can still be approximated using the normal distribution (according to Central Limit Theorem). The following figure shows the distribution of X̅ when X is heavily skewed to the left. As you can see, X̅’s distribution tends to mimic the distribution of X for small sample sizes. However, as sample size grows the distribution of X̅ becomes more symmetric and bell-shaped. As mentioned above, if sample size is large (usually larger than 30), X̅’s distribution is approximately normal regardless of what the distribution of X is.

    别担心! 即使您的数据不是正态分布的,如果样本量足够大,仍可以使用正态分布(根据中心极限定理)来近似估计X̅的分布。 下图显示了X严重偏向左侧时X̅的分布。 如您所见,对于小样本量,X̅的分布趋向于模仿X的分布。 但是,随着样本量的增加,X 1的分布变得更加对称和呈钟形。 如上所述,如果样本量较大(通常大于30),则X的分布近似为正态,而与X的分布无关。

    Image for post
    X̅’s distribution is normal for large sample sizes, even when X has a skewed distribution (image by author).
    X的分布对于大样本量而言是正常的,即使X的分布​​偏斜(作者提供的图像)。

    示例和应用 (Example and applications)

    Knowing the distribution of X̅ can help us solve problems, where we need to use inferential data analysis to make decisions under uncertainty. Many business problems require decision making tools that are able to address the stochastic and probabilistic nature of random event. Hypothesis testing is one of those tools frequently used in many different business domains including retail operations, marketing, quality assurance, etc.

    知道X̅的分布可以帮助我们解决问题,在这种情况下,我们需要使用推断数据分析来在不确定的情况下做出决策。 许多业务问题都需要决策工具,这些工具必须能够解决随机事件的随机性和概率性。 假设检验是许多不同业务领域(包括零售运营,市场营销,质量保证等)中经常使用的工具之一。

    For example, suppose a retail store has run a major marketing campaign and is interested to investigate the effects of the campaign on average sales of the store. Suppose that the management would like to investigate if average daily sales is now greater than $8,000. The following hypotheses demonstrate this research question:

    例如,假设一家零售商店进行了一次大规模的营销活动,并且有兴趣调查该活动对商店平均销售额的影响。 假设管理层想调查现在的平均每日销售额是否大于8,000美元。 以下假设证明了该研究问题:

    Image for post

    Note that we are conducting a test on the population average sales, hence the μ. To address the test, suppose we record sales volumes over 40 days (sample with n=40) and calculate the required statistics. Suppose the average and standard deviation of daily sales volumes are calculated as x̅=$8,100 and s=$580, respectively. Since the value of σ is not known, and given that the above hypothesis test is being addressed, we can convert X̅ to the random variable t with n-1=39 degrees of freedom where,

    请注意,我们正在对人口平均销售额(即μ)进行测试。 为了进行测试,假设我们记录了40天的销售量( n = 40的样本)并计算所需的统计数据。 假设每日销售量的平均偏差和标准偏差分别计算为x̅= $ 8,100s = $ 580 。 由于σ的值未知,并且鉴于上述假设检验正在解决,我们可以将X̅转换为n-1 = 39自由度的随机变量t ,其中,

    Image for post

    To address the test, we need to find the p-value associated with the test. This property is calculated as,

    要处理该测试,我们需要找到与该测试关联的p值。 此属性的计算公式为

    Image for post

    The probability density function for the random variable t along with the p-value of the test are depicted below.

    下面描述了随机变量t的概率密度函数以及检验的p值。

    Image for post
    The p-value for the test is highlighted in the picture (image by author).
    图片的高亮显示了测试的p值(作者提供的图像)。

    The following will find the p-value for the test.

    以下将找到测试的p值。

    The calculations give a p-value equal to approximately 0.14. By most standards (significance levels), this is a large p-value indicating that we fail to reject the null hypothesis. In other words, based on the distribution of X̅ and the sample collected, we cannot conclude that the average daily sales volume at the retail store, μ, is greater than $8000. This calculation was possible only because we knew what the distribution of X̅ was.

    计算得出的p值大约等于0.14。 按照大多数标准(显着性水平),这是一个很大的p值,表明我们无法拒绝原假设。 换句话说,根据X的分布和收集的样本,我们不能得出结论,零售商店的平均日销售量μ大于$ 8000。 仅因为我们知道X̅的分布是什么,才可能进行此计算。

    Sampling distributions could be defined for other sample statistics (e.g., sample proportions, regression predictor coefficients, etc.) and are also used in other contexts like confidence and prediction intervals or inferential analysis on regression results.

    可以为其他样本统计数据(例如,样本比例,回归预测系数等)定义采样分布,也可以在其他情况下使用采样分布,例如置信度和预测区间或对回归结果进行推论分析。

    [1]: Sharpe N. R., De Veaux R. D., Velleman P. F., Wright D. (2020) Business Statistics, Fourth Canadian Edition. Pearson Canada Inc.

    [1]:Sharpe NR,De Veaux RD,Velleman PF,Wright D.(2020) 商业统计,加拿大第四版 。 培生加拿大公司

    翻译自: https://towardsdatascience.com/sampling-distribution-sample-mean-fcf69484535e

    样本均值的抽样分布

    展开全文
  • 正态总体的样本均值与样本方差的分布相关定理

    引理

    1. 设总体 X X X(不管服从什么分布,只要均值和方差存在)的均值为 μ \mu μ,方差为 σ 2 \sigma^2 σ2 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn是来自 X X X的一个样本, X ‾ , S 2 \overline{X},S^2 X,S2 分别是样本均值和样本方差,则有 E ( X ‾ ) = μ , D ( X ‾ ) = σ 2 / n , E ( S 2 ) = σ 2 E(\overline{X})=\mu,\quad D(\overline{X})=\sigma^2/n, \quad E(S^2)=\sigma^2 E(X)=μ,D(X)=σ2/n,E(S2)=σ2

    2. 正态分布线性可加性: 若 X i ∼ N ( μ i , σ i 2 ) , i = 1 , 2 , ⋯   , n X_i\sim N(\mu_i,\sigma_i^2),i=1,2,\cdots,n XiN(μi,σi2),i=1,2,,n,且他们相互独立,则他们的线性组合: C 1 X 1 + C 2 X 2 + ⋯ + C n X n C_1X_1+C_2X_2+\cdots+C_nX_n C1X1+C2X2++CnXn,( C 1 , C 2 , ⋯   , C n C_1,C_2,\cdots,C_n C1,C2,,Cn是不全为 0 0 0的常数)仍然服从正态分布,且有 C 1 X 1 + C 2 X 2 + ⋯ + C n X n ∼ N ( ∑ i = 1 n C i μ i , ∑ i = 1 n C i 2 σ i 2 ) C_1X_1+C_2X_2+\cdots+C_nX_n\sim N(\sum\limits_{i=1}^nC_i\mu_i,\sum\limits_{i=1}^nC_i^2\sigma_i^2) C1X1+C2X2++CnXnN(i=1nCiμi,i=1nCi2σi2)

    3. n n n维正态随机变量重要性质

      1 0 1^0\quad 10 n n n维正态随机变量 ( X 1 , X 2 , ⋯   , X n ) (X_1,X_2,\cdots,X_n) (X1,X2,,Xn)的每一个分量 X i , i = 1 , 2 , ⋯   , n X_i,i=1,2,\cdots,n Xi,i=1,2,,n都是正态随机变量,反之,若 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn都是正态随机变量,且相互独立,则 ( X 1 , X 2 , ⋯   , X n ) (X_1,X_2,\cdots,X_n) (X1,X2,,Xn) n n n维正态随机变量

      2 0 2^0\quad 20 n n n维随机变量 ( X 1 , X 2 , ⋯   , X n ) (X_1,X_2,\cdots,X_n) (X1,X2,,Xn)服从 n n n维正态分布的充要条件是 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn的任意线性组合 l 1 X 1 + l 2 X 2 + ⋯ + l n X n l_1X_1+l_2X_2+\cdots+l_nX_n l1X1+l2X2++lnXn 服从一维正态分布(其中 l 1 , l 2 , ⋯   , l n l_1,l_2,\cdots,l_n l1,l2,,ln不全为零)

      3 0 3^0\quad 30 ( X 1 , X 2 , ⋯   , X n ) (X_1,X_2,\cdots,X_n) (X1,X2,,Xn)服从 n n n维正态分布,设 Y 1 , Y 2 , ⋯   , Y k Y_1,Y_2,\cdots,Y_k Y1,Y2,,Yk X j ( j = 1 , 2 , ⋯   , n ) X_j(j=1,2,\cdots,n) Xj(j=1,2,,n)的线性函数,则 ( Y 1 , Y 2 , ⋯   , Y k ) (Y_1,Y_2,\cdots,Y_k) (Y1,Y2,,Yk)也服从多维正态分布,这一性质称为正态变量的线性变换不变性

      4 0 4^0\quad 40 ( X 1 , X 2 , ⋯   , X n ) (X_1,X_2,\cdots,X_n) (X1,X2,,Xn)服从 n n n维正态分布,则” X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn相互独立”与” X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn两两不相关“是等价的。

    定理一

    • X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn是来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的样本, X ‾ \overline{X} X是样本均值,则有 X ‾ ∼ N ( μ , σ 2 / n ) . \overline{X}\sim N(\mu,\sigma^2/n). XN(μ,σ2/n).

      证明很简单,由引言1可知, E ( X ‾ ) = μ , D ( X ‾ ) = σ 2 / n E(\overline{X})=\mu,\quad D(\overline{X})=\sigma^2/n E(X)=μ,D(X)=σ2/n

      X ‾ = 1 n ∑ i = 1 n X i \overline{X}=\frac{1}{n}\sum\limits_{i=1}^nX_i X=n1i=1nXi X i X_i Xi 服从正态分布,则根据引理2可知, X ‾ ∼ N ( μ , σ 2 / n ) . \overline{X}\sim N(\mu,\sigma^2/n). XN(μ,σ2/n).

    定理二

    • X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn是来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的样本, X ‾ , S 2 \overline{X},S^2 X,S2 分别是样本均值和样本方差,则有

      1 0 ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) 1^0\quad \frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1) 10σ2(n1)S2χ2(n1)

      2 0 X ‾ 2^0\quad \overline{X} 20X S 2 S^2 S2相互独立

      证明:

      ( n − 1 ) S 2 σ 2 = ( n − 1 ) σ 2 × 1 ( n − 1 ) ∑ i = 1 n ( X i − X ‾ ) 2 = ∑ i = 1 n ( X i − X ‾ ) 2 σ 2 = ∑ i = 1 n [ ( X i − μ ) − ( X ‾ − μ ) ] 2 σ 2 = ∑ i = 1 n ( X i − μ σ − X ‾ − μ σ ) 2 \begin{aligned} \frac{(n-1)S^2}{\sigma^2} &= \frac{(n-1)}{\sigma^2}\times \frac{1}{(n-1)}\sum\limits_{i=1}^n(X_i-\overline{X})^2 \\&= \frac{\sum\limits_{i=1}^n(X_i-\overline{X})^2}{\sigma^2}\\&=\frac{\sum\limits_{i=1}^n[(X_i-\mu)-(\overline{X}-\mu)]^2}{\sigma^2}\\&= \sum\limits_{i=1}^n\bigg(\frac{X_i-\mu}{\sigma}-\frac{\overline{X}-\mu}{\sigma}\bigg)^2\end{aligned} σ2(n1)S2=σ2(n1)×(n1)1i=1n(XiX)2=σ2i=1n(XiX)2=σ2i=1n[(Xiμ)(Xμ)]2=i=1n(σXiμσXμ)2

      为了方便,我们令 Z i = X i − μ σ Z_i=\frac{X_i-\mu}{\sigma} Zi=σXiμ ,由于 X i ∼ N ( μ , σ 2 ) X_i\sim N(\mu,\sigma^2) XiN(μ,σ2) ,因此 Z i ∼ N ( 0 , 1 ) Z_i\sim N(0,1) ZiN(0,1)

      Z ‾ = X ‾ − μ σ \overline{Z} = \frac{\overline{X}-\mu}{\sigma} Z=σXμ ,则

      ( n − 1 ) S 2 σ 2 = ∑ i = 1 n ( Z i − Z ‾ ) 2 = ∑ i = 1 n ( Z i 2 − 2 Z i Z ‾ + Z ‾ 2 ) = ∑ i = 1 n Z i 2 − 2 Z ‾ ∑ i = 1 n Z i + ∑ i = 1 n Z ‾ 2 = ∑ i = 1 n Z i 2 − 2 n Z ‾ 2 + n Z ‾ 2 = ∑ i = 1 n Z i 2 − n Z ‾ 2 \begin{aligned} \frac{(n-1)S^2}{\sigma^2} &= \sum\limits_{i=1}^n(Z_i-\overline{Z})^2 \\&= \sum\limits_{i=1}^n(Z_i^2-2Z_i\overline{Z}+\overline{Z}^2) \\&= \sum\limits_{i=1}^nZ_i^2-2\overline{Z}\sum\limits_{i=1}^nZ_i+\sum\limits_{i=1}^n\overline{Z}^2 \\&= \sum\limits_{i=1}^nZ_i^2-2n\overline{Z}^2+n\overline{Z}^2\\&=\sum\limits_{i=1}^nZ_i^2-n\overline{Z}^2 \end{aligned} σ2(n1)S2=i=1n(ZiZ)2=i=1n(Zi22ZiZ+Z2)=i=1nZi22Zi=1nZi+i=1nZ2=i=1nZi22nZ2+nZ2=i=1nZi2nZ2

      取一个 n n n阶正交矩阵 A = ( a i j ) A=(a_{ij}) A=(aij),其第一行元素均为 1 / n 1/\sqrt{n} 1/n

      A = [ 1 / n 1 / n ⋯ 1 / n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ ⋮ a n 1 a n 2 ⋯ a n n ] A = \begin{bmatrix}1/\sqrt{n} & 1/\sqrt{n} & \cdots & 1/\sqrt{n} \\ a_{21} & a_{22} & \cdots &a_{2n}\\ \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}\end{bmatrix} A=1/n a21an11/n a22an21/n a2nann

      A A A做正交变换 Y = A Z Y=AZ Y=AZ ,有

      Y = [ Y 1 Y 2 ⋮ Y n ] , Z = [ Z 1 Z 2 ⋮ Z n ] Y = \begin{bmatrix}Y_1 \\Y_2\\ \vdots \\Y_n \end{bmatrix},Z = \begin{bmatrix}Z_1 \\Z_2\\ \vdots \\Z_n \end{bmatrix} Y=Y1Y2Yn,Z=Z1Z2Zn

      由于 Y i = ∑ j = 1 n a i j Z j , i = 1 , 2 , ⋯   , n Y_i=\sum\limits_{j=1}^na_{ij}Z_j,\quad i=1,2,\cdots ,n Yi=j=1naijZj,i=1,2,,n ,因此 Y i Y_i Yi仍服从正态分布,由 Z i ∼ N ( 0 , 1 ) Z_i \sim N(0,1) ZiN(0,1) 可知

      E ( Y i ) = E ( ∑ j = 1 n a i j Z j ) = ∑ j = 1 n a i j E ( Z j ) = 0 E(Y_i) = E(\sum\limits_{j=1}^na_{ij}Z_j) = \sum\limits_{j=1}^na_{ij}E(Z_j) = 0 E(Yi)=E(j=1naijZj)=j=1naijE(Zj)=0

      D ( Y i ) = D ( ∑ j = 1 n a i j Z j ) = ∑ j = 1 n a i j 2 D ( Z j ) = ∑ j = 1 n a i j 2 = 1 D(Y_i) = D(\sum\limits_{j=1}^na_{ij}Z_j) = \sum\limits_{j=1}^na_{ij}^2D(Z_j) = \sum\limits_{j=1}^na_{ij}^2=1 D(Yi)=D(j=1naijZj)=j=1naij2D(Zj)=j=1naij2=1

      又由 C o v ( Z i , Z j ) = δ i j = { 0 , i ≠ j 1 , i = j , i , j = 1 , 2 , ⋯   , n Cov(Z_i,Z_j) = \delta_{ij}=\begin{cases}0,\quad i\neq j \\1,\quad i=j\end{cases} \quad ,i,j=1,2,\cdots,n Cov(Zi,Zj)=δij={0,i=j1,i=j,i,j=1,2,,n

      C o v ( Y i , Y k ) = C o v ( ∑ j = 1 n a i j Z j , ∑ l = 1 n a k l Z l ) = ∑ j = 1 n ∑ l = 1 n a i j a k l C o v ( Z j , Z l ) = ∑ j = 1 n a i j a k j = { 0 , i ≠ j 1 , i = j ( 正 交 矩 阵 性 质 , 各 行 均 是 单 位 向 量 且 两 两 正 交 ) \begin{aligned}Cov(Y_i,Y_k) &= Cov(\sum\limits_{j=1}^na_{ij}Z_j,\sum\limits_{l=1}^na_{kl}Z_l)\\&=\sum\limits_{j=1}^n\sum\limits_{l=1}^n a_{ij}a_{kl}Cov(Z_j,Z_l) \\&=\sum\limits_{j=1}^na_{ij}a_{kj} \\&=\begin{cases}0,\quad i\neq j \\1,\quad i=j\end{cases}(正交矩阵性质,各行均是单位向量且两两正交)\end{aligned} Cov(Yi,Yk)=Cov(j=1naijZj,l=1naklZl)=j=1nl=1naijaklCov(Zj,Zl)=j=1naijakj={0,i=j1,i=j()

      由此可知 Y 1 , Y 2 , ⋯   , Y n Y_1,Y_2,\cdots,Y_n Y1,Y2,,Yn 两两互不相关。又由于 n n n维随机变量 ( Y 1 , Y 2 , ⋯   , Y n ) (Y_1,Y_2,\cdots,Y_n) (Y1,Y2,,Yn)是由 n n n维随机变量 ( X 1 , X 2 , ⋯   , X n ) (X_1,X_2,\cdots,X_n) (X1,X2,Xn)经线性变换得到,因此 ( Y 1 , Y 2 , ⋯   , Y n ) (Y_1,Y_2,\cdots,Y_n) (Y1,Y2,,Yn)也是 n n n维正态随机变量,由引理3性质4可知, Y 1 , Y 2 , ⋯   , Y n Y_1,Y_2,\cdots,Y_n Y1,Y2,,Yn两两互不相关也即是 Y 1 , Y 2 , ⋯   , Y n Y_1,Y_2,\cdots,Y_n Y1,Y2,,Yn互相独立。前面已经计算出 E ( Y i ) = 0 , D ( Y i ) = 1 E(Y_i)=0,D(Y_i)=1 E(Yi)=0,D(Yi)=1 因此 Y i ∼ N ( 0 , 1 ) , i = 1 , 2 , ⋯   , n . Y_i\sim N(0,1),i=1,2,\cdots,n. YiN(0,1),i=1,2,,n.

      Y 1 = ∑ j = 1 n a 1 j Z j = ∑ j = 1 n 1 n Z j = 1 n ∗ n Z ‾ = n Z ‾ \begin{aligned}Y_1&=\sum\limits_{j=1}^na_{1j}Z_j \\&= \sum\limits_{j=1}^n\frac{1}{\sqrt{n}}Z_j\\&=\frac{1}{\sqrt{n}}*n\overline{Z}\\&=\sqrt{n}\overline{Z}\end{aligned} Y1=j=1na1jZj=j=1nn 1Zj=n 1nZ=n Z

      ∑ i = 1 n Y i 2 = Y T Y = ( A Z ) T ( A Z ) = Z T A T A Z = Z T Z = ∑ i = 1 n Z i 2 \begin{aligned}\sum\limits_{i=1}^nY_i^2&=Y^TY=(AZ)^T(AZ)\\&=Z^TA^TAZ = Z^TZ = \sum\limits_{i=1}^nZ_i^2\end{aligned} i=1nYi2=YTY=(AZ)T(AZ)=ZTATAZ=ZTZ=i=1nZi2

      此时有

      ( n − 1 ) S 2 σ 2 = ∑ i = 1 n Z i 2 − n Z ‾ 2 = ∑ i = 1 n Y i 2 − Y 1 2 = ∑ i = 2 n Y i 2 \begin{aligned} \frac{(n-1)S^2}{\sigma^2} &=\sum\limits_{i=1}^nZ_i^2-n\overline{Z}^2 \\&=\sum\limits_{i=1}^nY_i^2-Y_1^2\\&=\sum\limits_{i=2}^nY_i^2\end{aligned} σ2(n1)S2=i=1nZi2nZ2=i=1nYi2Y12=i=2nYi2

      由于 Y 2 , Y 3 , ⋯   , Y n Y_2,Y_3,\cdots,Y_n Y2,Y3,,Yn相互独立,且 Y i ∼ N ( 0 , 1 ) Y_i\sim N(0,1) YiN(0,1) ,因此 ( n − 1 ) S 2 σ 2 = ∑ i = 2 n Y i 2 ∼ χ 2 ( n − 1 ) . \frac{(n-1)S^2}{\sigma^2}=\sum\limits_{i=2}^nY_i^2\sim\chi^2(n-1). σ2(n1)S2=i=2nYi2χ2(n1).

      其次, X ‾ = σ Z ‾ + μ = σ Y 1 n + μ \overline{X} = \sigma\overline{Z}+\mu = \frac{\sigma Y_1}{\sqrt{n}}+\mu X=σZ+μ=n σY1+μ 仅跟 Y 1 Y_1 Y1有关,而 S 2 = σ 2 n − 1 ∑ i = 2 n Y i 2 S^2=\frac{\sigma^2}{n-1}\sum\limits_{i=2}^nY_i^2 S2=n1σ2i=2nYi2 仅依赖于 Y 2 , Y 3 , ⋯   , Y n Y_2,Y_3,\cdots,Y_n Y2,Y3,,Yn ,又因为 Y 1 , Y 2 , ⋯   , Y n Y_1,Y_2,\cdots,Y_n Y1,Y2,,Yn相互独立,因此有 X ‾ \overline{X} X S 2 S^2 S2相互独立

    定理三

    • X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn是来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的样本, X ‾ , S 2 \overline{X},S^2 X,S2 分别是样本均值和样本方差,则有 X ‾ − μ S / n ∼ t ( n − 1 ) \frac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1) S/n Xμt(n1)

      证明:

      由定理一可知, X ‾ ∼ N ( μ , σ 2 / n ) . \overline{X}\sim N(\mu,\sigma^2/n). XN(μ,σ2/n).

      进行标准化之后有 X ‾ − μ σ / n ∼ N ( 0 , 1 ) . \frac{\overline{X}-\mu}{\sigma /\sqrt{n}}\sim N(0,1). σ/n XμN(0,1).

      由定理二可知, ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1) σ2(n1)S2χ2(n1)

      根据 t t t分布定义有 X ‾ − μ σ / n ( n − 1 ) S 2 σ 2 ( n − 1 ) = X ‾ − μ S / n ∼ t ( n − 1 ) \begin{aligned} \frac{\frac{\overline{X}-\mu}{\sigma/ \sqrt{n}}}{\sqrt{\frac{(n-1)S^2}{\sigma^2(n-1)}}} = \frac{\overline{X}-\mu}{S/\sqrt{n}} \sim t(n-1)\end{aligned} σ2(n1)(n1)S2 σ/n Xμ=S/n Xμt(n1)

      证明完毕

    定理四

    • X 1 , X 2 , ⋯   , X n 1 X_1,X_2,\cdots,X_{n_1} X1,X2,,Xn1 Y 1 , Y 2 , ⋯   , Y n 1 Y_1,Y_2,\cdots,Y_{n_1} Y1,Y2,,Yn1是来自正态总体 N ( μ 1 , σ 1 2 ) N(\mu_1,\sigma_1^2) N(μ1,σ12) N ( μ 2 , σ 2 2 ) N(\mu_2,\sigma_2^2) N(μ2,σ22)的样本,且这两个样本 相互独立. 设 X ‾ = 1 n 1 ∑ i = 1 n 1 X i , Y ‾ = 1 n 2 ∑ i = 1 n 2 Y i \overline{X}=\frac{1}{n_1}\sum\limits_{i=1}^{n_1}X_i,\overline{Y}=\frac{1}{n_2}\sum\limits_{i=1}^{n_2}Y_i X=n11i=1n1Xi,Y=n21i=1n2Yi 分别是这两个样本的样本均值; S 1 2 = 1 n 1 − 1 ∑ i = 1 n 1 ( X i − X ‾ ) 2 , S 2 2 = 1 n 2 − 1 ∑ i = 1 n 2 ( Y i − Y ‾ ) 2 S_1^2=\frac{1}{n_1-1}\sum\limits_{i=1}^{n_1}(X_i-\overline{X})^2,S_2^2=\frac{1}{n_2-1}\sum\limits_{i=1}^{n_2}(Y_i-\overline{Y})^2 S12=n111i=1n1(XiX)2,S22=n211i=1n2(YiY)2分别是两个样本的样本方差,则有

      1 0 S 1 2 / S 2 2 σ 1 2 / σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) 1^0\quad \frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2}\sim F(n_1-1,n_2-1) 10σ12/σ22S12/S22F(n11,n21)

      2 0 2^0\quad 20 σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2时, ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) \frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2) Swn11+n21 (XY)(μ1μ2)t(n1+n22)

      其中 S w 2 = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 , S w = S w 2 S_w^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}, S_w=\sqrt{S_w^2} Sw2=n1+n22(n11)S12+(n21)S22,Sw=Sw2

      证明:

      1 0 1^0 \quad 10 由定理二可知 ( n 1 − 1 ) S 1 2 σ 1 2 ∼ χ 2 ( n 1 − 1 ) ( 1 ) ( n 2 − 1 ) S 2 2 σ 2 2 ∼ χ 2 ( n 2 − 1 ) ( 2 ) \frac{(n_1-1)S_1^2}{\sigma_1^2}\sim \chi^2(n_1-1) \quad(1) \\\frac{(n_2-1)S_2^2}{\sigma_2^2}\sim \chi^2(n_2-1)\quad(2) σ12(n11)S12χ2(n11)(1)σ22(n21)S22χ2(n21)(2)

      此时有 ( n 1 − 1 ) S 1 2 ( n 1 − 1 ) σ 1 2 / ( n 2 − 1 ) S 2 2 ( n 2 − 1 ) σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \frac{(n_1-1)S_1^2}{(n_1-1)\sigma_1^2}\bigg/\frac{(n_2-1)S_2^2}{(n_2-1)\sigma_2^2} \sim F(n_1-1,n_2-1) (n11)σ12(n11)S12/(n21)σ22(n21)S22F(n11,n21)

      S 1 2 / S 2 2 σ 1 2 / σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2}\sim F(n_1-1,n_2-1) σ12/σ22S12/S22F(n11,n21)

      2 0 2^0\quad 20 由式 ( 1 ) (1) (1) ( 2 ) (2) (2),以及 χ 2 \chi^2 χ2分布的可加性可知 ( n 1 − 1 ) S 1 2 σ 1 2 + ( n 2 − 1 ) S 2 2 σ 2 2 服 从 χ 2 ( n 1 + n 2 − 2 ) \frac{(n_1-1)S_1^2}{\sigma_1^2}+\frac{(n_2-1)S_2^2}{\sigma_2^2} 服从\chi^2(n_1+n_2-2) σ12(n11)S12+σ22(n21)S22χ2(n1+n22)

      σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2可知, ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 σ 2 ∼ χ 2 ( n 1 + n 2 − 2 ) ( 3 ) \frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{\sigma^2} \sim \chi^2(n_1+n_2-2)\quad (3) σ2(n11)S12+(n21)S22χ2(n1+n22)(3)

      由定理一可知 X ‾ ∼ N ( μ 1 , σ 2 / n ) , Y ‾ ∼ N ( μ 2 , σ 2 / n ) . \overline{X}\sim N(\mu_1,\sigma^2/n),\overline{Y}\sim N(\mu_2,\sigma^2/n). XN(μ1,σ2/n),YN(μ2,σ2/n).

      因此 X ‾ − Y ‾ ∼ N ( μ 1 − μ 2 , σ 2 / n 1 + σ 2 / n 2 ) \overline{X}-\overline{Y}\sim N(\mu_1-\mu_2,\sigma^2/n_1+\sigma^2/n_2) XYN(μ1μ2,σ2/n1+σ2/n2) ,对其进行标准化有

      ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) σ 2 / n 1 + σ 2 / n 2 ∼ N ( 0 , 1 ) ( 4 ) \frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\sigma^2/n_1+\sigma^2/n_2}} \sim N(0,1)\quad (4) σ2/n1+σ2/n2 (XY)(μ1μ2)N(0,1)(4)

      由式 ( 3 ) 、 ( 4 ) (3)、(4) (3)(4)可知 ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) σ 2 / n 1 + σ 2 / n 2 / ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 σ 2 ( n 1 + n 2 − 2 ) ∼ t ( n 1 + n 2 − 2 ) \frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\sigma^2/n_1+\sigma^2/n_2}}\bigg/\sqrt{\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{\sigma^2(n_1+n_2-2)}} \sim t(n_1+n_2-2) σ2/n1+σ2/n2 (XY)(μ1μ2)/σ2(n1+n22)(n11)S12+(n21)S22 t(n1+n22)

      ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) \frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2) Swn11+n21 (XY)(μ1μ2)t(n1+n22)

      证明完毕

    展开全文
  • 第7章概率和样本:样本均值的分布

    千次阅读 2021-06-29 18:51:16
    建立样本均值的分布步骤:1,从总体中选择一个样本量为n的随机样本,计算样本均值,2,再从总体中选择另一个样本量为n的随机样本,计算样本均值,3,重复以上过程,得到一系列可能的随机样本及样本均值,形成样本均值的...

    第1章统计学入门      

    第2章频数分布略   

    第3章集中趋势的测量

    第4章变异性

    第5章分数的位置及标准化分布

    第6章概率和正态分布

    第7章概率和样本:样本均值的分布

    第8章假设检验介绍

    第9章t检验介绍

    第10章两个独立样本的t检验

    第11章两个相关样本的t检验

    第12章方差分析介绍

    第13章重复测量和双因素方差分析

    第14章相关和回归

    第15章卡方检验:拟合优度和独立性检验


    抽样分布:通过从总体红选择一定大小的随机样本得到的统计量的分布。(分布中的值不是分数,而是统计量)

    样本均值的分布:所有来自总体的样本量为n的随机样本的样本均值的分布。样本均值的分布是抽样分布的一个特例,也叫M的抽样分布

    建立样本均值的分布步骤:1,从总体中选择一个样本量为n的随机样本,计算样本均值,2,再从总体中选择另一个样本量为n的随机样本,计算样本均值,3,重复以上过程,得到一系列可能的随机样本及样本均值,形成样本均值的分布。

    样本均值分布的特征:1,样本均值围绕总体均值分布,2,样本均值的分布大致是正态的,3,一般样本量越大,样本均值越接近总体均值μ。

    中心极限定理:对于任何均值μ,标准差为σ的总体,样本大小为n的样本均值分布的均值为μ,标准差为\frac{\sigma}{\sqrt{n}},并且当n趋近于无穷大时,接近正态分布。

    样本均值分布的形状:满足2个条件中的任意一个,分布是标准正态分布:1,样本来自的总体是正态分布。2,样本大小n相对较大,大于或等于30。

    样本均值分布的均值:M的期望值:样本均值分布的均值总是等同于总体均值,这个均值被叫做M的期望值。样本均值分布的标准差也叫标准误\sigma _{M}=\frac{\sigma}{\sqrt{n}}。标准误说明了一个样本均值在多大程度上准确估计了总体均值。

    大数法则:样本量n越大,样本均值越可能接近总体均值。1,当n=1时,标准误=\sigma _{M}=σ=标准差。2,随着样本量增大,标准误减小。

    三个分布的区别:分数的原始分布,从总体中抽取的样本分布,样本均值的分布。某个样本的分数,是从总体分布中得到的,这一样本的均值是样本均值分布中的一个值。详见书中图7-4。

            

    展开全文
  • 简单抽样技术——样本均值是总体均值的无偏估计

    万次阅读 多人点赞 2019-07-13 21:26:34
    来一点废话,帮助大家理解概率的精髓: 1) 只要谈估计,那就是告诉我们一种方法,利用这个...首先,要严格区分均值和期望两个概念! 期望公式: 均值公式: 显然,它们是不一样的,一个是和元素出现的概率...

    来一点废话,帮助大家理解概率的精髓:

    1) 只要谈估计,那就是告诉我们一种方法,利用这个方法可以管中规豹似的获取某个统计量(这个统计量很可能限于人力物力无法真正获取,而我们又很想知道)。

    2) 只要是谈估计,那就告诉我们这个估计量本身也是个随机变量,它自身也存在统计特性;

    首先,要严格区分均值和期望两个概念!

    期望公式:

    E(X)=\sum_{i=1}^{n}x_{i}p(i)

    均值公式:

    \bar{X}=\frac{1}{n}\sum_{i=1}^{n}x_{i}

    显然,它们是不一样的,一个是和元素出现的概率相关,另一个是小学级别的简单粗暴的求平均。

    接下来,脑海中,我们可以假设有这么一个集合{y_{1},y_{2},...,y_{N}},大括号里就是这个集合的所有元素。

    总体均值就是求的整个集合的均值(假设集合大小是N):

    \bar{Y}=\frac{1}{N}\sum_{i=1}^{N}y_{i}

    显然\bar{Y}值在集合(也就是我们要研究的对象)和集合大小固定的情况下是一个固定的、并天然就存在的定数(它不是随机变量,好比是一个常数),尽管我们可能并不知道确切的值是多少!因为过我们可能由于费用问题无法将所有个体都进行统计然后求平均。因此,引入抽样的概念。样本均值\bar{y}就是从整个集合中抽取出n个,然后对其就平均:

    \bar{y}=\frac{1}{n}\sum_{i=1}^{N}y_{i} \delta {i}

    其中\delta {i}为抽样函数:

    \delta {i}= \begin{cases} 1 & \text{ if } y_{i}\ is\ selected\\ 0 & \text{ if } y_{i}\ is\ not\ selected \end{cases},并且

    \sum_{i=1}^{N}\delta _{i}=n

    这里额外进行解释:

    1)显然,根据组合原理,从N个元素中抽取n个元素的种类一共是C_{N}^{n}中,也就是\bar{y}的值有C_{N}^{n}种可能。

    2)显然\bar{y}值会随着我们实际抽取到的n个样本的不同而不同,因此\bar{y}本身可以被视为随机变量,既然\bar{y}是随机变量,那么它就存在统计量,也就是说讨论\bar{y}的期望和方差是有意义的。

    3)这里给出的公式,可能和有些书上的写的不太一样,有些书直接写为\bar{y}=\frac{1}{n}\sum_{i=1}^{n}y_{i},严格意义说写的不够确切,符号y_{i}在总体均值和样本均值中都用到了,容易混乱,致使公式不清、概念不清。本文的样本均值公式体现了抽样概念,更加严格。

    在讨论样本均值的期望之前,我们先讨论样本和\sum_{i=1}^{N}y_{i} \delta {i}(其中,\sum_{i=1}^{N}\delta _{i}=n)的期望,我们令H=\sum_{i=1}^{N}y_{i} \delta {i},显然H也是个随机变量,也就是讨论E(H)的值。

    前面已经讨论过,从N个元素中抽取n个元素的形成的样本种类是C_{N}^{n}种,因为我们这里讨论的是简单随机抽样,因此每种不同h_{k}(即,H取值h_{k})的概率就是\frac{1}{C_{N}^n}=\frac{n!(N-n)!}{N!}

    E(H)=\frac{1}{C_{N}^{n}}\sum_{k=1}^{C_{N}^n}h_{k}

    为了确定E(H)求和公式中某个特定元素y_{i}(即,i取特定值,y_{i}的系数)的系数:

    所有包含y_{i}的抽样样本集合,肯定包含n-1个其他元素,那么这n-1个其他元素的组合数目就是E(H)求和公式中某个特定元素y_{i}的系数。这个剩余的n-1个元素可以来自剩余的N-1个元素,因此求和公式中存在y_{i}的系(个)数是C_{N-1}^{n-1}

    因此有:

    E(H)=\frac{n!(N-n)!}{N!}\frac{(N-1)!}{(n-1)!(N-n)!}\sum_{i=1}^{N}y_{i}

    =\frac{n}{N}\sum_{i=1}^{N}y_{i}

    因此,我们可以得出这么一个结论:

    定理 1  样本和的期望是总体总值的\frac{n}{N}.

    那么,样本均值的期望就很好求了:

    E(\bar{y})=E(\frac{H}{n})=\frac{1}{N}\sum_{i=1}^{N}y_{i}=\bar{Y}

    由此,得出新的结论:

    定理 2 样本均值\bar{y}是总体均值\bar{Y}的无偏估计量

    讲一些方便理解的废话,既然研究了样本均值的期望,那么上面的两个定理的结论应当是限制在简单随机抽样的条件下得出来的。

    定理1的结论实际上在抽样理论中更容易被忽视,这个定理需要扩大脑思路,假如要求\sum_{i=1}^{N}(y_{i}-6)^3\delta _{i}的期望:

    那么我们要将(y_{i}-6)^3整体看做样本,而不是把y_{i}看做样本,H=\sum_{i=1}^{N}(y_{i}-6)^3\delta _{i}这个求和本身也是一个变量,它的期望可以根据定理1得出是样本总值\sum_{i=1}^{N}(y_{i}-6)^3\frac{n}{N}:

    E(H)=\frac{n}{N}\sum_{i=1}^{N}(y_{i}-6)^3

    定理2 则告诉我们当总体均值比较难以获取的时候,要估计总体均值可以拿样本均值来替代,这个样本均值在估计方法上还是无偏的。

    再回到问题本身,我们一般是无法知道整个集合的总值和均值的,定理2就是告诉我们存在无偏的估计方法,求总体均值,可以拿样本均值来估计总体均值,同样的,如果要估计总体值,只要将样本均值乘以N就可以的。

    我们可以得到下面的推论(很容易证明)

    推论 \hat{Y}=N\bar{y}是总体总值Y的无偏估计。

     

    拿多少样本来估计均值比较合理,这就得讨论样本均值的方差如何了。将会在另一篇文章中进行讨论。

     

     

    展开全文
  • 随机优化中的样本均值近似方法

    千次阅读 2020-09-04 22:28:02
    随机优化中的样本均值近似方法1.SAA原理 补一下之前随机优化的学习内容,结合Gurobi的webinar求解器进行求解。 1.SAA原理 随机优化是求解包含随机变量的一类优化问题,其中随机变量的分布是确定已知的。而样本均值...
  • 样本均值服从的分布

    千次阅读 2020-12-28 10:19:18
    由书上的概念可以知道,在样本足够大的情况下,样本均值服从的正态分布 上面是说,不管样本服从什么分布,当样本足够大的时候,样本均值服从正态分布。定理证明如下: 这是一个样本服从指数分布,伯努利分布的...
  • 文章目录小知识定理1定理2定理3证明...X‾,S2\overline{X},S^2X,S2是样本均值和方差 于是有E(X‾)=μ,E(S2)=σ2E(\overline{X})=\mu,E(S^2)=\sigma^2E(X)=μ,E(S2)=σ2 D(X‾)=σ2nD(\overline{X})=\frac{\sigma^2}nD(X
  • 设总体XXX ~ N(μ,σ2)N(μ, σ^2)N(μ,σ2),X1,X2,……,XnX_1,X_2,……,X_nX1​,X2​,……,Xn​是来自总体的样本,样本均值为X‾\overline{X}X,其中X‾=1n∑i=1nXi\overline{X}=\frac{1}{n}\sum_{i=1}^{...
  • 样本均值的抽样分布的均值问题

    千次阅读 2018-02-05 17:08:45
    为什么用样本均值来作为总体均值的估计? 这样真的好吗?如果好,到底好到什么程度。 目的 本文用来解释下面这句话(本人对下面这句话的逻辑一开始是不接受的,故而写文记录,以分享个人的逻辑理解): ...
  • 一、样本均值之差的定义 设是独立的抽自总体的一个容量为的样本的均值。是独立的抽自总体的一个容量为的样本的均值。 则具备以下性质: ,表示抽取多次获取样本均值的数学期望,根据中心极限定理,则。 ...
  • 样本均值和样本方差  首先对于样本$x_1...x_n$来说,他们的均值为与方差分别为:  $\bar{x} = \frac{1}{n}\sum\limits_{i=1}^{n}x_i$  $s^2 = \frac{\sum\limits_{i=1}^{n} (x_i - \bar{x})^2}{n-1}$  要...
  • 目的:分析样本均值与总体均值的不同 比较分布: t分布 标准差: σ=SN−1\sigma = \frac{S}{\sqrt{N-1}}σ=N−1​S​ 样本t值: t = x‾−μσ\frac{\overline{x}-\mu}{\sigma }σx−μ​ 自由度: N-1; α\alphaα (小...
  • 样本均值的特征与分布

    万次阅读 2016-11-04 10:53:00
    样本均值的特征与分布@(概率论)这个分布的推导将需要回到大数定律与中心极限定理中去才能证明。需要严格区分样本均值与一次取样的分布。X1,X2,...,XnX_1,X_2,...,X_n是取自总体的样本,则E(Xi)=u,D(Xi)=σ2E(X_i) = ...
  • 样本均值和样本方差的无偏性  对于独立同分布的样本$x_1...x_n$来说,他们的均值为与方差分别为: $ \begin{aligned}&\bar{x} = \frac{1}{n}\sum\limits_{i=1}^{n}x_i \\&s^2 = \frac{\sum\limits_{i=1}^{n...
  • 首先需要清楚一件事情,样本均值为X拔(上面有个棍) 样本的均值是讲从总体中抽样,这些样本的均值,而均值是指所有样本的真实均值。 后面部分很好推导,将括号展开后,由三部分组成,中间的部分为2倍的样本和样本...
  • 样本均值的抽样分布/置信区间

    千次阅读 2019-08-23 11:24:51
    样本均值的抽样分布: 最高的是正峰态分布,中间的是正态分布,最低的是负峰态分布 正偏态分布,右尾长,负偏态分布,左尾长 样本容量越大,样本均值越趋近于总体均值 随着样本容量n趋近于无穷,样本均值的抽样...
  • 多元统计分析样本均值,协方差

    千次阅读 2020-04-17 18:51:25
    x=read.table(“C:\Users\dell\Desktop\one.csv...xbar=colMeans(x)#样本均值向量# y=cov(x)#样本协方差# m=(n-1)y#li离差# n=cor(x)#相关矩阵# u=c(7,5,4,8) T2=19t(xbar-u)%%solve(n)%%(xbar-u)#统计量# 16/(19*4)...
  • 大数定律和中心极限定理 大数定律:样本量趋近于无穷时,样本均值收敛到总体期望 中心极限定理: 1,样本均值约等于总体均值 2,抽样次数趋近于无穷时,样本均值围绕总体均值呈现正态分布(无论总体分布是否服从...
  • 【练习一】对example1_1.Rdata中数据,利用R软件,完成分别有放回和无放回抽取10名学生的姓名组成一个随机样本,输出学生姓名分别有放回和无放回抽取10名学生的姓名和分数组成一个随机样本,同时输出学生姓名和分数。...
  • MATLAB求解样本均值、标准差

    千次阅读 2018-08-06 14:37:00
    样本均值:mean  M = mean(A) : A可以是向量,返回向量元素的样本均值;  A可以是矩阵,返回一个行向量,其中每一个元素值代表的是列向量元素的样本均值;  A可以是空值,返回NaN;  M = mean(A, dim) : ...
  • 在数理统计的学习中,有一个重要的结论,即对于正态分布而言,样本均值和样本方差是独立的。这个结论初看起来是有些让人吃惊的,因为直观上样本方差依赖于样本均值。对此结论,很多教材一般通过构造正交变换来进行...
  • 概要 这些结论为参数的假设...   设 \(x_1,\cdots, x_n\) 是来自正态总体 \(N(\mu, \sigma^2)\) 的样本,其样本均值和样本方差分别为 \begin{align} \bar{x} &= \frac{1}{n} \sum_{i=1}^n x_i \\ s^2 &= ...
  • 文献[1]中例3讨论了样本均值偏离总体均值的概率的精确估计。利用极限的性质将样本均值X(1/n)偏离总体均值μ的概率的精确估计推广至样本均值X(δ),δ ∈(0,∞)偏离总体均值μ的情况。
  • 设,为总体的一个样本,且其样本均值为,样本方差为,总体方差为σ²,总体期望为μ。 证明1:为什么样本均值的期望等于总体的期望? 因为对于简单随机抽样的样本: 与总体是同分布的,所以各样本的期望均为总体...
  • 样本均值的抽样分布

    千次阅读 2017-08-17 00:27:00
    样本均值的抽样分布 重复抽样(抽取后有放回) 总体服从正态分布 X~N(μ, ),样本 的抽样分布为正态分布, 的期望为μ,方差为 ,记作 ~N(μ, ) 不 重复...
  • 样本均值:648.739393939394 顺序统计量:435.2 444.8 489.3 491.7 515.3 521.5 532.6 537.3 545.2 560.2 577.2 583.9 611.1 617.3 628.9 641.1 653.9 669.1 669.3 677 686.2 699.3 705.5...
  • 样本均值服从的分布 2018-8-28

    万次阅读 2018-08-28 22:59:58
    由书上的概念可以知道,在样本足够大的情况下,样本均值服从的正态分布  上面是说,不管样本服从什么分布,当样本足够大的时候,样本均值服从正态分布。定理证明如下: 这是一个样本服从指数分布,伯努利分布...
  • 即用总体中的样本来推断总体均值是否与指定的检验值存在显著差异 先判断样本是否服从正态分布: https://blog.csdn.net/qq_41228218/article/details/90693213
  • 1.样本均值:我们有n个样本,每个样本的观测值为Xi,那么样本均值指的是 1/n * ∑x(i),求n个观测值的平均值 2.数学期望:就是样本均值,是随机变量,即样本数其实并不是确定的   PS:从概率论的角度而言:样本...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 92,412
精华内容 36,964
关键字:

样本均值