精华内容
下载资源
问答
  • 无偏性有效性、一致性

    千次阅读 2021-05-17 17:07:30
    https://www.matongxue.com/madocs/808/ 无偏性 有效性 进行估计的时候也是,估计量越靠近目标,效果越“好”。这个“靠近”可以用方差来衡量。 一致性

    https://www.matongxue.com/madocs/808/

    无偏性

    在这里插入图片描述

    在这里插入图片描述在这里插入图片描述

    在这里插入图片描述

    有效性

    进行估计的时候也是,估计量越靠近目标,效果越“好”。这个“靠近”可以用方差来衡量。
    在这里插入图片描述

    一致性

    在这里插入图片描述

    展开全文
  • 最小二乘法中的交叉有效性计算的matlab程序,怎么计算出来的预测误差平方和PRESS不太对,大;请大牛指教!function re = GetPRESS(E0,F0,h)[n,m] = size(E0);F0n = size(F0);if F0n ~= n | n <2 | m < 2...

    偏最小二乘法中的交叉有效性计算的matlab程序,怎么计算出来的预测误差平方和PRESS不太对,偏大;请大牛指教!

    function re = GetPRESS(E0,F0,h)

    [n,m] = size(E0);

    F0n = size(F0);

    if F0n ~= n | n <2 | m < 2

    disp('errors!');

    return;

    end

    press = 0;

    for i = 1:n

    E = [ E0(1:i-1,:); E0(i+1:n,:) ];

    F = [ F0(1:i-1,:); F0(i+1:n,:) ];

    for j = 1:h % h步

    w = ( E'* F )/ norm( E'*F );

    W(:, j ) = w;

    W;

    t = E * w;

    T(:, j ) = t; % 主成分

    p = E'* t / ( (norm( t))^2 );

    P(:, j ) = p;

    r = F'* t / ( (norm( t))^2 );

    R( j ) = r; % 系数

    E = E - t * p';

    F = F - t * r';

    end

    % 求W* 的值

    for k = 1: h

    W_h_s = eye(m);

    for j = 1:(k-1)

    W_h_s = W_h_s * ( eye(m) - W(j) *( P(j) )');

    end

    W_h_s = W_h_s * W(:,k); % Wh* 的值

    W_s(:,k) = W_h_s;

    end

    F0i_s = E0(i,:) * (W_s * R'); % 求F0i的拟合值

    F0i = F0(i);

    % Yi_Yh_i = ( F0i - F0i_s )^2

    press = press + ( F0i - F0i_s )^2; % 两值相减再平方

    end

    re = press;

    展开全文
  • 在之前的学习中,主要基于充分统计量给出点估计,并且注重于点...今天我们将注重于统计量的有效性,即无偏统计量的抽样分布的方差。由于本系列为我独自完成的,缺少审阅,如果有任何错误,欢迎在评论区中指出,谢...

    在之前的学习中,主要基于充分统计量给出点估计,并且注重于点估计的无偏性与相合性。然而,仅有这两个性质是不足的,无偏性只能保证统计量的均值与待估参数一致,却无法控制统计量可能偏离待估参数的程度;相合性只能在大样本下保证统计量到均值的收敛性,但却对小样本情形束手无策。今天我们将注重于统计量的有效性,即无偏统计量的抽样分布的方差。由于本系列为我独自完成的,缺少审阅,如果有任何错误,欢迎在评论区中指出,谢谢!

    目录

    Part 1:一致最小方差无偏估计

    首先考虑这样的问题:如何刻画一个统计量的有效程度?注意到,一个统计量的取值既可能高于待估参数,亦可能低于待估参数,要综合考虑统计量对待估参数误差,需要用平方均衡这种双向偏差,因此,提出均方误差的概念:若\(\hat g(\boldsymbol{X})\)是\(g(\theta)\)的估计量,则\(\hat g(\boldsymbol{X})\)的均方误差定义为

    \[\mathrm{MSE}(\hat g(\boldsymbol{X}))= \mathbb{E}[\hat g(\boldsymbol{X})-g(\theta)]^2. \]

    对于确定的统计量\(\hat g(\boldsymbol{X})\)而言,\(\mathrm{MSE}(\hat g(\boldsymbol{X}))\)是\(\theta\)的函数。显然,一个统计量的均方误差越小,它就越在待估参数真值附近环绕,由此,用统计量的一次观测值作为待估参数的估计就有着越大的把握。

    如果对于\(g(\theta)\)的两个估计量\(\hat g_1(\boldsymbol{X})\)和\(\hat g_2(\boldsymbol{X})\),恒有\(\mathrm{MSE}(\hat g_1(\boldsymbol{X}))\le \mathrm{MSE}(\hat g_2(\boldsymbol{X}))\),且严格不等号至少在某个\(\theta\)处成立,就称\(\hat g_1(\boldsymbol{X})\)在均方误差准则下优于\(\hat g_2(\boldsymbol{X})\)。如果我们能找到均方误差最小的统计量\(\hat g(\boldsymbol{X})\),就相当于找到了均方误差准则下的最优统计量。

    不过,均方误差是\(\theta\)的函数,这就导致了某些统计量在\(\theta=\theta_1\)时均方误差小,在\(\theta=\theta_2\)时均方误差大,一致最小均方误差估计量便不存在,需要增加约束条件,找到更可能存在的“最优”。

    基于此,我们提出一致最小方差无偏估计(UMVUE)的概念,它将\(g(\theta)\)的估计量限制在了无偏估计之中,这使得UMVUE的存在可能性得以提高。并且,由于\(\mathbb{E}(\hat g(\boldsymbol{X}))=g(\theta)\),所以

    \[\mathrm{MSE}(\hat g(\boldsymbol{X}))=\mathbb{E}(\hat g(\boldsymbol{X})-g(\theta))^2=\mathbb{E}[\hat g(\boldsymbol{X})-\mathbb{E}(\hat g(\boldsymbol{X}))]^2=\mathbb{D}(\hat g(\boldsymbol{X})), \]

    即无偏估计的均方误差就是无偏估计的方差。

    不过首先要提出的是,UMVUE往往比一致最小均方误差估计量更容易存在,但依然不是所有参数都存在UMVUE的,并且,甚至可能有的参数根本不存在无偏估计。

    以下是一个典型的不存在无偏估计的例子:\(X\sim B(n,p)\),参数\(g(p)=1/p\)的无偏估计不存在。书上给出的证明过程如下:

    首先,无偏估计不依赖于样本容量,故假设\(n=1\)。若\(g(p)\)有无偏估计\(\hat g(X)\),则由于\(X=0,1,\cdots,n\),故\(\hat g(X)\)的取值只可能是\(a_0,a_1,\cdots,a_n\),可以写出其期望为

    \[\mathbb{E}(\hat g(X))=\sum_{j=0}^n a_jC_n^jp^j(1-p)^{n-j}, \]

    当\(\hat g(X)\)为无偏估计时,成立以下等式:

    \[\sum_{j=0}^na_jC_n^jp^j(1-p)^{n-j}=\frac{1}{p}, \]

    即对于某个多项式\(f\in\mathcal P_{n+1}(\mathbb{R})\),有

    \[f(p)=0,\quad \forall p\in(0,1). \]

    显然,要使上式恒成立,除非\(f\)为零多项式。但\(f\)并不是零多项式,这意味着\(f(p)=0\)只会在至多\(n+1\)个点处成立,这与无偏性要求矛盾。因此,\(g(p)=1/p\)不存在无偏估计。

    我们将存在无偏估计的待估参数称为可估参数,因此UMVUE仅对可估参数作讨论。我们的任务,就是用一定的方法,找到可估参数的UMVUE。

    Part 2:改进无偏估计量

    无偏估计量有许多,比如正态分布\(N(\mu,\sigma^2)\)中,\(\mu\)的无偏估计就有\(X_1,2X_2-X_1,\bar X\)等。充分统计量的条件期望法是改进无偏估计量的一个典型方式,它基于如下的定理:设\(T=T(\boldsymbol{X})\)是一个充分统计量,\(\hat g(\boldsymbol{X})\)是\(g(\theta)\)的一个普通无偏估计量,则\(h(T)=\mathbb{E}[\hat g(\boldsymbol{X})|T]\)是\(g(\theta)\)的无偏估计,且

    \[\mathbb{D}(h(T))\le \mathbb{D}(\hat g(\boldsymbol{X})),\quad \forall \theta\in\Theta. \]

    等号成立当且仅当\(\hat g(\boldsymbol{X})=h(T)\)是均方条件下成立的。它的证明不是很有必要掌握,权当了解。

    因为\(T\)是\(g(\theta)\)的充分统计量,故\(\mathbb{E}(\hat g(\boldsymbol{X})|T)\)与待估参数\(g(\theta)\)无关,可以作为统计量,即

    \[h(T)=\mathbb{E}(\hat g(\boldsymbol{X})|T) \]

    是合理定义的统计量。下证其无偏性,由全期望公式,有

    \[\mathbb{E}(h(T))=\mathbb{E}[\mathbb{E}(\hat g(\boldsymbol{X})|T)]=\mathbb{E}(\hat g(\boldsymbol{X}))=g(\theta). \]

    最后证明其比\(\hat g(\boldsymbol{X})\)更有效,利用一个常用的拆分技巧,得到

    \[\begin{aligned} \mathbb{D}(\hat g(\boldsymbol{X}))&=\mathbb{D}[\hat g(\boldsymbol{X})-h(T)+h(T)]\\ &=\mathbb{D}(h(T))+\mathbb{D}(\hat g(\boldsymbol{X})-h(T))+2\mathrm{Cov}(h(T),\hat g(\boldsymbol{X})-h(T)), \end{aligned} \]

    然后证明交叉项为0,这里需要再次用到全期望公式,有

    \[\begin{aligned} &\quad \mathrm{Cov}(h(T),\hat g(\boldsymbol{X})-h(T))\\ &=\mathbb{E}[h(T)-g(\theta)][\hat g(\boldsymbol{X})-h(T)]\\ &=\mathbb{E}[\mathbb{E}[(h(T)-g(\theta))(\hat g(\boldsymbol{X})-h(T))|T]]\\ &=\mathbb{E}[(h(T)-g(\theta))(\mathbb{E}(\hat g(\boldsymbol{X})|T)-h(T)]\\ &=0. \end{aligned} \]

    最后的等号是因为\(h(T)=\mathbb{E}(\hat g(\boldsymbol{X})|T)\),于是代回就得到

    \[\mathbb{D}(\hat g(\boldsymbol{X}))=\mathbb{D}(h(T))+\mathbb{D}(\hat g(\boldsymbol{X})-h(T))\ge \mathbb{D}(h(T)). \]

    等号成立当且仅当\(\mathbb{D}(\hat g(\boldsymbol{X})-h(T))^2=\mathbb{E}(\hat g(\boldsymbol{X})-h(T))^2=0\)。

    这个定理的重要意义在于,如果给定的无偏估计量不是充分统计量的函数,则可以通过条件期望法,将其转变成一个充分统计量的函数作为新的统计量,并且新的统计量总是更有效的。此外,这也对我们寻找UMVUE提出启示:UMVUE一定是充分统计量的函数。如果不然,则可以通过对充分统计量求期望,得到一个更有效的统计量。

    不过,改进后的充分统计量函数,尽管是更为有效的参数估计,但却并不一定是UMVUE,下面的定理将给出一个验证点估计是否为UMVUE的方法。

    Part 3:零无偏估计法

    零无偏估计法是用于判断某个估计量是否为UMVUE的方法,为此,首先要提出什么是零无偏估计。顾名思义,零无偏估计即零的无偏估计量,对某个统计量\(l(\boldsymbol{X})\),如果有\(\mathbb{E}(l(\boldsymbol{X}))=0\),则称\(l(\boldsymbol{X})\)是一个零无偏估计量;如果统计量\(T\)是待估参数\(g(\theta)\)的充分统计量,且\(\mathbb{E}(h(T))=0\),则\(h(T)\)也称为\(g(\theta)\)的零无偏估计量。

    零无偏估计法的思想、证明过程都与上述的充分统计量条件期望法类似。如果\(\hat g(\boldsymbol{X})\)是UMVUE,则对于任意其他无偏估计\(\hat g_1(\boldsymbol{X})\),都可以视为\(\hat g_1(\boldsymbol{X})=\hat g(\boldsymbol{X})+l(\boldsymbol{X})\),显然这里\(\mathbb{E}(l(\boldsymbol{X}))=0\),要使\(\hat g_1(\boldsymbol{X})\)的方差大于\(\hat g(\boldsymbol{X})\),可以进行拆分,即

    \[\mathbb{D}(\hat g_1(\boldsymbol{X}))=\mathbb{D}(\hat g(\boldsymbol{X}))+\mathbb{D}(l(\boldsymbol{X}))+2\mathrm{Cov}(\hat g(\boldsymbol{X}),l(\boldsymbol{X})). \]

    如果最后的协方差项为0,则必有\(\mathbb{D}(\hat g_1(\boldsymbol{X}))\ge \mathbb{D}(\hat g(\boldsymbol{X}))\)。综合以上讨论,给出零无偏估计法验证UMVUE的方式。

    设\(\hat g(\boldsymbol{X})\)是\(g(\theta)\)的一个无偏估计,\(\mathbb{D}(\hat g(\boldsymbol{X}))

    \[\mathrm{Cov}(\hat g(\boldsymbol{X}),l(\boldsymbol{X}))=0, \]

    则\(\hat g(\boldsymbol{X})\)是\(g(\theta)\)的UMVUE。

    如果\(\hat g(\boldsymbol{X})\)满足与任何零无偏估计无关,则它是UMVUE,这是一个充分条件。但反之,它也是一个必要条件,即UMVUE必定与任何零无偏估计量无关。

    如果不然,设\(\mathrm{Cov}(\hat g(\boldsymbol{X}),l(\boldsymbol{X}))=b(\theta)\ne 0\),则可以假设\(\mathbb{D}(l(\boldsymbol{X}))=a^2(\theta)>0\)。现在固定\(\theta=\theta_0\)为常数,并设\(a(\theta_0)=a,b(\theta_0)=b\),只要

    \[\mathbb{D}(l(\boldsymbol{X}))+2\mathrm{Cov}(\hat g(\boldsymbol{X}),l(\boldsymbol{X}))=a^2(\theta_0)+2b(\theta_0)=a^2+2b<0, \]

    就能找到一个在\(\theta=\theta_0\)处,比\(\hat g(\boldsymbol{X})\)方差更小的无偏估计,那么\(\hat g(\boldsymbol{X})\)就不是UMVUE。注意到,如果\(l(\boldsymbol{X})\)是零无偏估计,则\(\forall k\ne 0\),\(kl(\boldsymbol{X})\)也是零无偏估计,就有

    \[\mathbb{D}(kl(\boldsymbol{X}))+2\mathrm{Cov}(\hat g(\boldsymbol{X}),kl(\boldsymbol{X}))=k^2a^2+2bk, \]

    取\(k\)值为

    \[\left\{\begin{array}l -\frac{2b}{a}0; \\ 0

    就使得\(k^2a^2+2bk<0\)成立,于是

    \[\hat g_1(\boldsymbol{X})\xlongequal{def}\hat g(\boldsymbol{X})+kl(\boldsymbol{X}) \]

    是\(g(\theta)\)的无偏估计量,且当\(\theta=\theta_0\)时\(\mathbb{D}(\hat g_1(\boldsymbol{X}))

    有了这个方法,我们可以验证一些常用的充分统计量是UMVUE了。现以正态分布\(N(\mu,\sigma^2)\)的充分统计量\((\bar X,S^2)\)为例,它们是否是UMVUE呢?如果直接验证会稍显繁琐,对零无偏估计法稍加修改可以得到以下的推论:

    如果\(T\)是充分统计量且\(h(T)\)是\(g(\theta)\)的一个无偏估计,对任何\(\theta\in\Theta\)与一切零无偏估计量\(\delta (T)\)都有

    \[\mathrm{Cov}(h(T),\delta(T))=\mathbb{E}(h(T)\delta(T))=0, \]

    则\(h(T)\)是UMVUE。

    这里只是将样本的函数改成了充分统计量的函数,以上证明过程是依然适用的。并且,由于UMVUE一定是充分统计量的函数,因此这个推论会更有应用意义。

    对于正态分布而言,充分统计量可以视为

    \[T_1=\frac{1}{n}\sum_{j=1}^n X_j,\quad T_2=\sum_{j=1}^n (X_j-\bar X)^2,\\ T_1\sim N\left(\mu,\frac{\sigma^2}{n}\right),\quad \frac{T_2}{\sigma^2}\sim\chi^2(n-1)\Rightarrow T_2\sim\Gamma\left(\frac{n-1}{2},\frac{1}{2\sigma^2} \right). \]

    由于\(T_1,T_2\)独立,所以其联合密度函数容易写出,有

    \[f_1(t_1)=\frac{\sqrt{n}}{\sqrt{2\pi \sigma^2}}\exp\left\{-\frac{n(t_1-\mu)^2}{2\sigma^2} \right\},\\ f_2(t_2)=\frac{1}{2^{\frac{n-1}{2}}\Gamma(\frac{n-1}{2})\sigma^{n-1}}t_2^{\frac{n-1}{2}-1}e^{-\frac{t_2}{2\sigma^2}},\\ f(t_1,t_2)=\frac{C}{\sigma^n}t_2^{\frac{n-1}{2}-1}\exp\left\{-\frac{n(t_1-\mu)^2+t_2}{2\sigma^2} \right\}. \]

    如果\(\delta(t_1,t_2)\)是零均值的,则有

    \[\mathbb{E}(\delta(t_1,t_2))=\frac{C}{\sigma^n}\int_{-\infty}^\infty \delta(t_1,t_2)\cdot t_2^{\frac{n-1}{2}-1}\exp\left\{-\frac{n(t_1-\mu)^2+t_2}{2\sigma^2} \right\}\mathrm{d}t_1\mathrm{d}t_2=0. \]

    令\(\exp\)部分为\(H(\mu,\sigma^2)\),也就是我们获得了这个关键的等式(它是证明的核心):

    \[\int_{-\infty}^\infty\delta(t_1,t_2)\cdot t_2^{\frac{n-1}{2}-1}H(\mu,\sigma^2)\mathrm{d}t_1\mathrm{d}t_2=0 \]

    要验证\(\mathbb{E}(t_1,\delta(t_1,t_2))\)与\(\mathbb{E}(t_2,\delta(t_1,t_2))\)是否为0,先从第一个入手,写出其表达式为

    \[\mathbb{E}(t_1,\delta(t_1,t_2))=\frac{C}{\sigma^n}\int_{-\infty}^{\infty}\delta(t_1,t_2)t_1t_2^{\frac{n-1}{2}-1}H(\mu,\sigma^2)\mathrm{d}t_1\mathrm{d}t_2. \]

    要验证\(\mathbb{E}(t_1,\delta(t_1,t_2))=0\),实际上就是验证

    \[\int_{-\infty}^\infty \delta(t_1,t_2)t_1t_2^{\frac{n-1}{2}-1}H(\mu,\sigma^2)\mathrm{d}t_1\mathrm{d}t_2\stackrel{?}=0. \]

    不要被这个庞然大物吓到,事实上我们唯一的条件只有\(\mathbb{E}(\delta(t_1,t_2))=0\)所对应的等式,注意到上面的等式无论\(\mu,\sigma\)的真值是多少都应该成立,所以是\(\mu,\sigma\)的二元函数,我们能做的事也很有限——对参数求导。这里涉及到了求导与积分是否可交换的问题,我们姑且不考虑,默认视为可交换即可,由于\(\sigma^2\)很复杂,所以对\(\mu\)求导即可。唯一含有\(\mu\)的项是积分号中间的\(\exp\)部分,其导数为

    \[H(\mu,\sigma^2)=\exp\left\{-\frac{n(t_1-\mu)^2+t_2}{2\sigma^2} \right\},\\ \frac{\partial H(\mu,\sigma^2)}{\partial \mu}=\frac{2n(t_1-\mu)}{\sigma^2}H(\mu,\sigma^2), \]

    于是就有

    \[\frac{\partial \mathbb{E}(\delta_1,\delta_2)}{\partial\mu}=\frac{C}{\sigma^n}\int_{-\infty}^\infty\delta(t_1,t_2)t_2^{\frac{n-1}{2}-1}\frac{2n(t_1-\mu)}{\sigma^2}H(\mu,\sigma^2)\mathrm{d}t_1\mathrm{d}t_2=0, \]

    将求导后得到的式子展开,提取出参数并代入上面的结果,就有

    \[\int_{-\infty}^\infty\delta(t_1,t_2)t_1t_2^{\frac{n-1}{2}-1}H(\mu,\sigma)\mathrm{d}t_1\mathrm{d}t_2=0, \]

    也就说明了\(\mathbb{E}(t_1,\delta(t_1,t_2))=0\),由\(\delta(t_1,t_2)\)的任意性以及\(T_1\)的无偏性,可知\(\bar X\)是\(\mu\)的UMVUE。

    下一步证明\(T_2/(n-1)\)是\(\sigma^2\)的UMVUE,也就是证明\(\mathbb{E}(t_2,\delta(t_1,t_2))=0\),同样写出需要验证的等式为

    \[\int_{-\infty}^\infty\delta(t_1,t_2) t_2^{\frac{n-1}{2}}H(\mu,\sigma^2)\mathrm{d}t_1\mathrm{d}t_2\stackrel{?}=0. \]

    现在我们尝试将关键的等式对\(\sigma^2\)求导,同样,先计算\(H\)对\(\sigma^2\)的偏导,有

    \[H(\mu,\sigma^2)=\exp\left\{-\frac{n(t_1-\mu)^2+t_2}{2\sigma^2} \right\},\\ \frac{\partial H(\mu,\sigma^2)}{\partial \sigma^2}=\frac{n(t_1-\mu)^2+t_2}{2\sigma^4}H(\mu,\sigma^2), \]

    可以看到,这里除了出现已经确认代入能为0的常数项和\(t_1\)外,还多了\(t_1^2\)与\(t_2\)的项,\(t_2\)就是我们的目标,所以再处理一下\(t_1^2\)这一项。显然,对\(\mu\)求导一次能得到\(t_1\)的一次项,那么对\(\mu\)求二阶导,就能得到\(t_1^2\)项,所以

    \[\frac{\partial H(\mu,\sigma^2)}{\partial \mu}=\frac{2n(t_1-\mu)}{\sigma^2}H(\mu,\sigma^2),\\ \frac{\partial^2H(\mu,\sigma^2)}{\partial\mu^2}=H(\mu,\sigma^2)\left[\frac{4n^2(t_1-\mu)^2}{\sigma^4}-\frac{2n}{\sigma^2} \right]. \]

    这样就出现了需要的\(t_1^2\)项,剩下的工作只有繁琐的代入计算而已,我们实际上已经完成了证明的主要步骤,因此\(S^2\)也是\(\sigma^2\)的UMVUE。

    对于一元连续或离散情形下UMVUE的验证,难度要比二元情形下小得多,因此读者只要掌握了正态分布的零无偏估计法验证,理论上其他UMVUE的验证便不成问题。读者可以自己尝试其他UMVUE的验证。

    今天,我们提出了UMVUE的概念,重点在于利用充分统计量改进普通的无偏估计,并且利用零无偏估计法验证某个充分统计量函数是否是UMVUE。但是,我们并没有给出寻找UMVUE的方法,如果依靠感觉没有方向地寻找再一个个验证是否为UMVUE,是十分繁琐且难以成功的。比如对于\(B(1,p)\)的参数估计\(g(p)=p(1-p)\),如果用先猜想后验证的方法来寻找UMVUE,甚至没有入手点。

    因此,明天我们将学习寻找UMVUE的方法,并介绍一个被我们忽略已久的概念——指数族。

    展开全文
  • 点估计以及无偏性 点估计定义:设x1,x2,…,xn是来自总体的一个样本,用于估计未知参数θ的统计量θ’=θ’(x1,x2,…,xn)称为θ的估计量,或称θ的点估计,简称估计**(利用特殊统计量的一些性质,可由样本估计...

    点估计以及无偏性
    点估计定义:设x1,x2,…,xn是来自总体的一个样本,用于估计未知参数θ的统计量θ’=θ’(x1,x2,…,xn)称为θ的估计量,或称θ的点估计,简称估计**(利用特殊统计量的一些性质,可由样本估计总体的一些特征(期望,方差))**

    参数空间定义:参数空间是数学术语,自然科学计算机术语
    设(X1,……,Xn)为来自总体X的样本,(x1,…,xn)为相应的样本值,θ是总体分布的未知参数,θ∈Θ, Θ表示θ的取值范围,称Θ为参数空间

    无偏性定义:设θ’=θ’(x1,x2,…,xn)是θ的一个估计,θ的参数空间为Θ,若对任意θ的属于Θ,都有E(θ’)= θ,则称θ‘是θ的无偏估计,否则称为有偏估计

    设(x1,…,xn)为来自总体X的样本,总体的方差为c^2
    样本的方差sn^ 2=Sum((xi-x一捌)^2)/n
    E(sn^ 2)=E(Sum((xi-x一捌)^ 2)/n)=[(n-1)/n]*c^2(定理5.3.2)
    E(sn^ 2)/[n/(n-1)]= E(Sum((xi-x一捌)^ 2)/[n/(n-1)])=c^2
    由无偏性定义可得统计量E(sn^2)/[n/(n-1)]是总体参数中的方差的无偏性估计
    统计量θ’=E(sn^ 2)/[n/(n-1)]=Sum((xi-x-捌)^2)/(n-1)是总体方差的无偏估计

    大偏差通常被视为估计的一种不足,有人提出了多种缩小偏差的方法
    刀切法就是由Quenouille于1949年和1956年提出的,而正式命名则是由图基(Tukey)于1958年给出
    刀切法定义:

    有效性定义:
    当参数可估计时,其无偏估计可以有很多,如何在无偏估计中进行选择?
    直观的想法是希望该估计围绕参数真值的波动越小越好,波动大小可以用方差来衡量,因此常用无偏估计的方差大小作为度量无偏估计优劣的标准,这就是有效性
    设θ1’,θ2’是θ的两个无偏估计
    若对任意θ∈Θ有,Var(θ1’)<=Var(θ2’)
    且至少有一个θ∈Θ使得上述不等号成立
    则称θ1’比θ2’有效

    展开全文
  • 估计和无偏估计

    2021-04-24 16:07:43
    无偏和有本质来讲,无偏/无偏估计是指估算统计量的公式,无偏估计就是可以预见,多次采样计算的统计量(根据估算公式获得)是在真实值左右两边。类似于正态分布的钟型图形。比如对于均值估计:mean = (1/n)Σxi一定...
  • 样本方差与无偏估计

    千次阅读 2021-04-08 18:16:59
    偏估计无偏性有效性一致性小结 参考文章:如何理解偏估计量? by 马同学 样本方差 问题背景 首先,对于随机变量XXX的期望为μ\muμ,其方差为σ2\sigma^2σ2。 如果已知随机变量X的期望为\mu,那么可以如下计算...
  • 非劣效性 等效性 有效性临床试验 非劣效是个什么鬼? 本文只是为了更好地理解临床试验中的优效性(superiority)、等效性(equivalence)以及非劣效性(non-inferiority),进一步了解可参阅: (1)CCTS工作小组.非...
  • Stata无偏性检验(安慰剂检验代码)

    千次阅读 热门讨论 2021-03-30 23:04:43
    无偏性检验原理 Stata回归的系数值只是某个样本的观测值,不一定是真值(事实上恰好等于真值的概率极小),但较大概率会落在真值的附近,且分布有一定规律。 对于回归系数结果的无偏性,我们可以通过在整体中反复...
  • ——针对客观类平稳检验方法进行分析,从时间序列的样本长度视角探讨检验方法的实际性能,ADF 检验和PP 检验是相对较好的判定方法,在仿真实验中呈现较好的性能简介定义时间序列是一类典型的随机数据,基于随机...
  • 请从文本分析的角度,建立合理的模型,对附件1景区及酒店网络评论的有效性进行分析。 感觉上可行的方案 初步感觉是 数据清洗,但这里好像是 做一个关于垃圾评论的筛选、删除的模型。 就比如我们逛淘宝的时候,淘宝...
  • 文章目录无偏性定义3.2.1(偏差与偏估计)定义3.2.2(一致最小风险偏估计, UMRUE)定义3.2.2'(一致最小方差偏估计, UMVUE) 无偏性 定义3.2.1(偏差与偏估计) 定义3.2.2(一致最小风险偏估计, UMRUE) ...
  • 标量无偏估计参数变换的CRLB定理: 如果要从采集到的一组观测量数据: 并利用概率密度函数(此时该函数被称为似然函数)去估计未知参数。如果满足正则条件,即: 那么对于参数的任意无偏估计的方差,满足: ...
  • Bayard,Roland Brockers 主要研究点在于,基于EKF的距离-视觉-惯性里程计框架下激励的尺度可观察 摘要:对于大多数机器人应用来说,以恒定速度行驶是最有效的轨迹。不幸的是,如果没有加速度计激励,单目视觉...
  • 具有较大的微观数据分析价值,但tick数据量大,由于各种原因(服务器,网络等)导致数据出现问题的几率大,但通常日级的数据可信度较高,所以我们可以用日级数据来检验下tick数据的有效性。例如针对一个个股600769...
  • 再去测试集上训练,可以提高测试集评价结果的真实 二、梯度下降法 学习率设置技巧 1 小心翼翼调整学习率 学习率不能是一个值通用所有特征,不同的参数需要不同的学习率 一个典型算法 Adagrad 算法 也可随着迭代...
  • 由此,便引申出一系列具备不同描述有效性的应力,包括第一皮奥拉-基尔霍夫应力(First Piola - Kirchoff Stress,以下简称第一P-K应力)、第二皮奥拉-基尔霍夫应力(Second Piola - Kirchoff Stress,以下简称第二P-...
  • 有时在正常减水剂掺量时,混凝土离析现象,但露石现象比较明显,即浆体无法很好地包裹碎石。依靠单纯提高砂率无法根本解决问题,减水剂掺量降低0.1%~0.2%时,混凝土拌合物流动变差,坍落度损...
  • 会计信息可靠的分析

    千次阅读 2020-12-24 03:44:25
    信息失真的本质是信息的质量没有达到要求,而会计信息的可靠是衡量会计信息质量的一个重要因素。可靠是对会计信息质量的基本要求,是我们会计核算的一般原则之一。具备可靠的会计信息应是真实。完整的会计信息...
  • 积分梯度是一种神经网络可解释方法 此方法首先在论文《Gradients of Counterfactuals》中提出,后来 《Axiomatic Attribution for Deep Networks》再次介绍了它,这已经是2016~2017年间的工作了 此方法已得到较多...
  • 本文侧重于阐述它们的规范依据、力学原理、适应及应用方法,以助于设计人员在实际设计过程中进行合理、安全经济的设计。关键词:刚性楼板假定、弹性楼板假定、弹性楼板6、弹性楼板3、弹性膜、平面内刚度Abstract: ...
  • 所谓的均匀度量方法-read第七章 图像的分割 图像分割的目的 图像分割是指通过某种方法,使得画面场景被分为“目标物”及“非目标物”两类,即将图像的像素变换为黑、白两种。 因为结果图像为二值图像,所以通常又称...
  • 8种方案,保证缓存和数据库的最终一致

    千次阅读 多人点赞 2021-11-23 21:48:47
    由于对数据库以及缓存的整体操作,并不是原子的,再加上读写并发,究竟什么样的方案可以保证数据库与缓存的一致呢? 下面介绍8种方案,配合读写时序图,希望你能从其中了解到保证一致的设计要点。
  • 信号完整与电源完整分析信号完整(SI)和电源完整(PI)是两种不同但领域相关的分析,涉及数字电路正确操作。在信号完整中,重点是确保传输的1在接收器中看起来就像 1(对0同样如此)。在电源完整中,重点是...
  • 这些年接触了很多不同配置的电脑,不少人在购买笔记本时候多少都有点选择困难症,因此把目前价比高的的笔记本做了一个榜单,简单点评,帮助近期需要购买笔记本,又不知道怎么选的人。【价比】是商品的性能值与...
  • 论临床医疗中医学影像的重要.doc论临床医疗中医学影像的重要【摘要】为了提高临床医生对医学影像学的认识和了解,以便临床医生根据患者病情需要有针对地选择检查项目,笔者分别对X线成像、计算机体层成像(CT)...
  • 在这篇文章中,我想分解并准确记录何时发生“写斜”事件。 事务快速入门 数据库中的执行单位是事务。 事务是工作的集合,这些工作要么全部完成,要么根本不运行。没有半成品事务。 通常围绕事务提供许多保证...
  • 零基础使用 MATLAB 求解微分方程(建议收藏) 文章目录零基础使用 MATLAB 求解微分方程(建议收藏)微分开源工具介绍PDE 工具箱函数汇总介绍0 基础:GUI 界面操作示例问题工具箱求解导出为代码形式代码导出...
  • 插值、平稳假设、本征假设、变异函数、基台、块金、克里格、线性无偏最优…地学计算概念及公式推导1 引言2 空间插值3 几个重要假设3.1 平稳假设3.2 二阶平稳假设3.3 本征假设3.4 不同假设对比4 变异函数5 克里格...
  • 目录 1. 时序参数 1.1 ADC 1.2 FPGA 2. 延时计算 2.1 计算延时所需的LMFC周期数 ...前几天又重新复习了以下...该文档毕竟是一个标准文件,实现过程写的比较粗略,而且是指导的,在实际工程实现过程中作用有限。当
  • 根据mean-variance分解:均方误差=偏差+分散度 也就是说最小均方误差事实上是无偏性有效性的结合,最小偏估计量的概率分布既集中,而且集中在真值周围。 均方误差事实上是一种距离(统计决策上称为“损失”),是...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 74,712
精华内容 29,884
关键字:

无偏性有效性