精华内容
下载资源
问答
  • 总体统计量的估计方法
    千次阅读
    2019-06-26 09:56:00

    总体统计量的估计方法

    1 点估计量法

    可以用点估计量来估计总体的均值、方差或一定比例的精确值。但是无法可定估计完全正确,只是对总体做出假设。

    1.1 通过样本估算总体均值

    符号定义:

    • $\mu$:总体均值。
    • $\hat{\mu}$:总体均值的点估计量,在总体均值未知时,其可作为总体均值的估计值。
    • $\bar{x}$:样本均值,和总体均值的计算方法一样。

    如果想要十分近似的估计总体均值,可以用下列算式估算总体均值:$$\bar{x}=\frac{\sum{x}}{n}$$

    即用样本均值作为总体均值的点估计量:$$\hat{\mu}=\bar{x}$$

    1.2 通过样本估算总体方差

    符号定义:

    • $\sigma^{2}$:总体方差。
    • $\hat{\sigma}^{2}$:总体方差的点估计量,在总体方差未知时,其可作为总体方差的估计值。
    • $s^{2}$:总体方差点估计量表示符号

    一个数据集的方差度量的是数值与均值的偏离程度。当选择一个样本后,相比总体,样本总的数值数量变少了,因此与总体中数值的偏离程度相比,样本中的数值,可能更紧密的聚集在数值周围。极端数值在样本中出现的可能性下降,这是因为总的来说这样的数值变少了了。所以用样本方差来估计总体方差会出现这样的问题:估计结果会稍微偏低,样本方差可能会略小于总体方差,差别程度取决于样本的大小。样本较小时,样本方差与总体方差的差别有可能更大。

    如果样本大小为$n$,可以用下列算式估算总体方差:$$s^{2}=\frac{\sum{(x-\bar{x})^{2}}}{n-1}$$

    没有用样本方差而是用上述算式作为总体方差的点估计量:$$\hat{\sigma}^{2}=s^{2}$$

    如果需要计算总体方差的真实值,需要使用如下算式:$$\sigma^{2}=\frac{\sum{(x-\mu})^{2}}{n}$$

    1.3 通过样本估算总体比例

    符号定义:

    • $p$:总体成功比例。
    • $\hat{p}$:总体成功比例的点估计量。
    • $P_{s}$:样本成功比例。

     对于符合二项分布的总体,用$X$表示总体成功事件的数量,参数为$n$和$p$。$n$为总体的人数,$p$为成功事件的比例。

    就像总体均值最接近的估计值是样本均值一样,总体成功比例最接近的估计值是样本成功比例。样本比例算式如下:$$P_{s}=\frac{成功数目}{样本数目}$$

    即用样本成功比例作为总体成功比例的点估计量:$$\hat{p}=P_{s}$$

    1.4 比例的抽样分布(通过总体计算样本)

    符号定义:

    • $p$:总体成功比例。
    • $P_{s}$:样本成功比例。

    一大盒包装糖可供数人分享,每盒有100粒糖球,糖球总体中有25%是红色的。现在要求一大盒特定糖球中有40颗或40颗以上红色糖球的概率。总体参数已知,需要为某一盒糖球计算概率。也就是说计算的不是总体概率,而是样本比例的概率。为此,需要得出样本比例的概率分布:

    • 查看与特定样本大小相同的所有样本:如果样本大小为n,则需要考虑所有大小为n的可能样本。本例中,样本单位为盒,样本大小为100,即n为100。
    • 观察所有样本比例形成的分布,然后求出比例的期望和方差:每一个样本都有自己的情况,因此每个包装盒里红色糖球的比例都有可能发生变化。
    • 得出比例分布后,利用分布求出概率:得知一个样本中”成功比例“的分布后,就能够利用这个分布求出一个随机样本的比例概率,这里的随机样本是一大盒糖球。

    此例总,$p$总体成功比例代表总体中红色糖球的比例,即$p=0.25$

    每一盒糖球都是从总体中抽取的一个样本。每盒有100个糖球,因此样本大小$n$为100。如果用随机变量$X$表示样本中红球的数量,则$X$服从二项分布,表示为$X\sim B(n,p)$,其中$n=100$$p=0.25$

    样本中红色糖球的比例取决于$X$,样本中红色糖球的数目,即比例本身是一个随机变量,可将其记为$P_{s}$,且$P_{s}=\frac{X}{n}$

    可以取出大小为$n$的可能样本为数众多,每一个可能样本包含$n$颗糖球,每个可能样本中红色糖球都服从同一分布,即$X\sim B(n,p)$,且样本中红色糖球的比例为$P_{s}=\frac{X}{n}$

    利用所有可能的样本,能得出所有样本比例的 分布,该分布称作比例的抽样分布,或者称作$P_{s}$的分布

    利用比例的抽样分布,能够求出某一个随机选择的、大小为$n$的样本的"成功比例"的概率(本例中即为,利用比例的抽样分布,能够求出某一大盒糖球中红色糖球比例至少为40%的概率)。

    在此之前,还需要知道$P_{s}$分布的期望和方差。

    $P_{s}$分布的期望:$$E(P_{s})=E\left ( \frac{X}{n} \right )=\frac{E(X)}{n}$$

    上式中$X$为样本中红色糖球的数量,其服从二项分布$X\sim B(n,p)$,所以上式的结果为:$$E(P_{s})=E\left ( \frac{X}{n} \right )=\frac{E(X)}{n}=\frac{np}{n}=p$$

    可以期望样本的成功比例和总体的成功比例一样,上述结果也证明确实如此。

    $P_{s}$分布的方差:$$Var(P_{s})=Var(\frac{X}{n})=\frac{Var(X)}{n^{2}}$$

    上式中$X$为样本中红色糖球的数量,其服从二项分布$X\sim B(n,p)$,所以上式的结果为:$$Var(P_{s})=Var(\frac{X}{n})=\frac{Var(X)}{n^{2}}=\frac{npq}{n^{2}}=\frac{pq}{n}$$

    取方差的平方根,可得$P_{s}$的标准差,它指出样本比例与$p$(样本比例均值)的可能差距。有时称作比例标准误差,因为它能指出样本比例的可能误差。$$比例标准误差=\sqrt{\frac{pq}{n}}$$

    在求得$P_{s}$的期望和方差后,发现当$n$足够大(大于30)时,$P_{s}$的分布越接近正太分布,可表示为:$$P_{s}\sim N(p,\frac{pq}{n})$$

    由于当$n>30$时,$P_{s}$接近正太分布,可以用正太分布来解答“某一大盒糖球中红色糖球比例至少为40%的概率”。最后需要对抽样分布进行连续性修正。

    1.5 均值的抽样分布(通过总体计算样本)

    符号定义:

    • $\mu$:总体均值。
    • $\sigma^{2}$:总体方差。
    • $X$:一个包装袋中糖球的数量。
    • $\bar{X}$$n$袋糖球的容量均值。

    经过统计,每一袋小包装袋中糖球数目的均值为10,方差为1。现遭到顾客投诉:买了30袋糖球,结果发现每袋糖球中糖球的平均数目只有8.5。那么,这种事情发生的概率为多大。已知总体的均值和方差,然后抽取几袋糖球作为样本,需要计算样本均值的概率。为此,需要得出样本均值的概率分布:

    • 查看与所研究样本大小相同的所有可能样本:如果样本大小为$n$则需要考虑所有大小为为$n$的样本。此例中小包装糖球有30袋,因此样本大小$n=30$
    • 查看所有样本的分布,求出样本均值的期望和方差:每一个样本都有各自的特点,每个包装袋中的糖球数目都有变化。
    • 得知样本均值的概率分布后,利用该分布求出概率:只要知道所有可能样本的样本均值的概率分布,就能利用该分布求得一个随机样本的样本均值的概率。此例中,随机样本为小袋包装糖球。

    随机选出的每一袋糖球都是$X$独立观察结果。因此,每一袋糖球都服从同一分布,即如果用$X_{i}$代表随机抽取一袋糖球中糖球的数量,则每个$X_{i}$的期望都是$\mu$,方差都是$\sigma^{2}$

    现在取$n$包糖球作为样本,用$X_{1}$$X_{n}$标记每袋糖球的数量,每个$X_{i}$都是$X$的独立观察结果,且服从上述分布。

    $\bar{X}$表示$n$袋糖球的容量均值,$\bar{X}$的公式:$$\bar{X}=\frac{X_{1}+X_{2}+\cdot \cdot \cdot +X_{n}}{n}$$

    可以取出大小为$n$的所有可能样本。每一个样本都包含$n$袋糖球,即每一个样本都包含$X$$n$个独立观察结果。每个随机选择的包装中的糖球数量都服从相同的正太分布。可以用同样的方法计算每个样本的糖球数量均值。

    从所有可能的样本得出的样本均值形成一个分布,称作均值的抽样分布,或称作$\bar{X}$的分布

    均值的抽样分布提供了一种计算样本均值概率的方法(本例中,即为在一个30袋糖球的样本中,求糖球数目均值小于或等于8.5的概率)。

    在次之前,需要知道$\bar{X}$分布的期望和方差。

    $\bar{X}$分布的期望$$E(\bar{X})=E(\frac{X_{1}+X_{2}+\cdot \cdot \cdot +X_{n}}{n})=E\left ( \frac{X_{1}}{n} \right )+E\left ( \frac{X_{2}}{n} \right )+\cdot \cdot \cdot +E\left ( \frac{X_{n}}{n} \right )=\frac{E(X_{1})+E(X_{2})\cdot \cdot \cdot +E(X_{n})}{n}$$

    上式中$X_{i}$服从同一分布,且期望为$\mu$,方差为$\sigma^{2}$。所以上式结果为:$$E(\bar{X})=\frac{\mu+\mu+\cdot \cdot \cdot +\mu}{n}=\frac{n\mu}{n}=\mu$$

    $\bar{X}$分布的方差$$Var(\bar{X})=Var(\frac{X_{1}+X_{2}+\cdot \cdot \cdot +X_{n}}{n})=Var\left ( \frac{X_{1}}{n} \right )+Var\left ( \frac{X_{2}}{n} \right )+\cdot \cdot \cdot +Var\left ( \frac{X_{n}}{n} \right )=\frac{Var(X_{1})+Var(X_{2})+\cdot \cdot \cdot +Var(X_{n})}{n^{2}}$$

    上式中$X_{i}$服从同一分布,且期望为$\mu$,方差为$\sigma^{2}$。所以上式结果为:$$Var(\bar{X})=\frac{\sigma^{2}+\sigma^{2}+\cdot \cdot \cdot +\sigma^{2}}{n^{2}}=\frac{n\sigma^{2}}{n^{2}}=\frac{\sigma^{2}}{n}$$

    取方差的平方根,可得$\bar{X}$的标准差,其指出样本均值与$\mu$可能偏离的距离,因此也称作均值标准误差$$=\sqrt{\frac{\sigma^{2}}{n}}=\frac{\sigma}{\sqrt{n}}$$

    $n$越大,均值标准误差越小。也就是说,样本中的个体越多,作为总体均值估计量的样本均值越可靠。

    在求得$\bar{X}$的期望和方差后,还需要知道$\bar{X}$是如何分布的:

    • $X$符合正太分布时,即若$X\sim N(\mu,\sigma^{2})$,那么$\bar{X}\sim N(\mu,\frac{\sigma^{2}}{n})$
    • $X$不符合正太分布时,若$n$足够大(大于30)时,那么$\bar{X}\sim N(\mu,\frac{\sigma^{2}}{n})$

    上述第二条结论的依据是中心极限定理:如果从一个非正太总体$X$中取出一个样本,若样本足够大(大于30),则样本均值$\bar{X}$的分布近似正太分布。

    最后此例中求$P(\bar{X}<8.5)$的概率,使用上述$\bar{X}$的概率分布即可。

    2 置信区间的构建

    点估计量可以估计总体的均值、方差或一定比例的精确值。但无法保证估计完全正确。因为仅依靠一个样本对总体做出估计,若样本出现问题,这个估计就会不准确。而置信区间是一种考虑了不确定性的总体统计量的估计方法,用一个区间而不是一个精确值来估计总体统计量。

    2.1 认识置信区间

    曼帝糖果公司用一个包含100粒糖球的样本得出口味持续时间均值的点估计量为62.7分钟,同时总体方差的点估计量为25分钟。首席执行官在电视节目的黄金时段宣布:糖球口味的平均持续时间为62.7分钟。这是根据手头证据可能得出的最可靠的口味持续时间估计值。可要略有差池,该怎么办?

    以上是由精度引起的问题,点估计量很可能接近总体均值,问题是多接近才是够接近?与其用一个精确值作为总体均值的估计值,不如使用另一种方法。可以指定某一区间而不是一个十分精确的时间,作为糖球口味持续时间的估计。例如,可以说糖球口味的持续时间为55至65分钟,这仍会让听着觉得糖球口味的持续时间接近1小时,却保留更大的误差空间。那么,如果为总体均值指定一个区间,而不是一个精确的数值,我们期望糖球口味持续时间的均值介于这个区间内。让均值的点估计量处于这个区间($(a,b)$)的中央,并将这个区间的上下限设定为均值点估计量加上或减去某个误差

    选择区间上下限是为了让总体均值介于$a$和$b$之间这一结果具有特定概率。例如,希望通过选择$a$$b$,使得该区间包含总体均值的概率为95%。也就是说选择的$a$$b$使得:$$P(a<\mu<b)=0.95$$

    用$(a,b)$表示这个区间,由于$a$和$b$的数值取决于自己对该区间包含总体均值这一结果具有的可信程度(置信度或置信水平),因此,$(a,b)$被称为置信区间

    2.2 求解置信区间

    • 选择总体统计量:用于构建置信区间的总体统计量。
    • 求出其抽样分布:比例抽样分布或均值抽样分布等。
    • 决定置信水平:置信区间包含该统计量的概率。
    • 求出置信上下限:为了求出上下限,需要知道抽样分布和置信水平。

    求出糖果口味持续时间的置信区间。

    2.2.1 选择总体统计量

    在此例中需要为糖球口味持续时间构建一个置信区间,也就是为总体均值$\mu$构建一个置信区间。

    2.2.2 求出所选统计量的抽样分布

    为了求出总体均值的抽样分布,需要知道均值的抽样分布($\bar{X}$分布)的期望和方差 。根据点估计量法可知:$$E(\bar{X})=\mu$$ $$Var(\bar{X})=\frac{\sigma^{2}}{n}$$

    为了利用上述结果求出$\mu$的置信区间,带入总体方差数值$\sigma^{2}$和样本大小$n$。但是,现在只知道样本的均值为100,样本方差为25,并不知道总体的方差。所以用样本的方差进行估算。于是均值的抽样分布的期望和方差为:$$E(\bar{X})=\mu$$  $$Var(\bar{X})=\frac{\sigma^{2}}{n}=\frac{\hat{\sigma}^{2}}{n}=\frac{s^{2}}{n}$$

    糖果公司用包含100颗糖球的样本计算估计值,得到$s^{2}=25$,于是:$$Var(\bar{X})=\frac{s^{2}}{n}=\frac{25}{100}=0.25$$

    为了求出$\mu$的置信区间,还需要知道$\bar{X}$的分布。

    假定$X\sim N(\mu,\sigma^{2})$,且样本数量包含很大,那么$$\bar{X}\sim N(\mu,\frac{\sigma^{2}}{n})$$

    $$\bar{X}\sim N(\mu,0.25)$$

    2.2.3 决定置信水平

    置信水平表明对于置信区间包含总体统计量这一结果由多大把握。例如,希望总体均值的置信水平为95%,表示总体均值处于置信区间的概率为95%。常用的置信水平为95%。

    Tips:置信水平越高,置信区间越宽,置信区间包含总体统计量的概率越大

    2.2.4 求出置信上下限

    最后一步求出$a$$b$,即置信上下限。其值确切取决于需要使用的抽样分布以及需要的置信水平。

    此例,让糖球口味持续时间具有95%的置信水平。即$\mu$位于区间$(a,b)$的概率为95%。则可利用$\bar{X}\sim N(\mu,0.25)$分布求出$a$$b$,例如$P(\bar{X}<a)=0.025$$P(\bar{X}>b)=0.025$

    $\bar{X}$进行标准化:$$Z=\frac{\bar{X}-\mu}{\sqrt{0.25}}$$

    其中:$$Z\sim N(0,1)$$

    标准化后,转为求$P(z_{a}<Z<z_{b})=0.95$,查询标准正太分布表得知,$z_{a}=-1.96$$z_{b}=1.96$,即:$$P\left ( -1.96<\frac{\bar{X}-\mu}{0.5}<1.96 \right )=0.95$$

    $\mu$改写不等式,即得到其置信区间:$$P(\bar{X}-0.98<\mu<\bar{X}+0.98)=0.95$$

    $\bar{X}$指样本均值的分布,于是采用糖果公司样本的$\bar{x}$值(62.7),计算出置信区间为$(61.72,63.68)$。

    2.3 置信区间的简便算法

    只需要查看要求的总体统计量、总体分布以及各种条件,然后带入总体统计量或其估计量,就行了。数值$c$取决于置信水平。

    • 总体统计量$\mu$;总体呈正太分布;$\sigma^{2}$已知、$n$可大可小、$\bar{X}$为样本均值;则置信区间为:$\left ( \bar{X}-\frac{c\sigma}{\sqrt{n}}, \bar{X}+\frac{c\sigma}{\sqrt{n}}\right )$
    • 总体统计量$\mu$;总体呈非正太分布;$\sigma^{2}$已知、$n$很大(至少30)、$\bar{X}$为样本均值;则置信区间为:$\left ( \bar{X}-\frac{c\sigma}{\sqrt{n}}, \bar{X}+\frac{c\sigma}{\sqrt{n}}\right )$
    • 总体统计量$\mu$;总体呈正太或非正态;;$\sigma^{2}$未知、$n$很大(至少30)、$\bar{X}$为样本均值、$s^{2}$为样本方差;则置信区间为:$\left ( \bar{X}-\frac{cs}{\sqrt{n}}, \bar{X}+\frac{cs}{\sqrt{n}}\right )$
    • 总体统计量为$p$;总体呈二项分布;$n$很大、$p_{s}$为样本比例、$q_{s}=1-p_{s}$;则置信区间为:$\left ( p_{s}-c\sqrt{\frac{p_{s}q_{s}}{n}},p_{s}+c\sqrt{\frac{p_{s}q_{s}}{n}} \right )$
    • 总体统计量为$\mu$;总体呈正太或非正太;$\sigma^{2}$未知、$n$很小(小于30)、$\bar{X}$为样本均值、$s^{2}$为样本方差;则置信区间为:$\left ( \bar{X}-\frac{t(v)s}{\sqrt{n}},\bar{X}+\frac{t(v)s}{\sqrt{n}} \right )$

    Tips:$t(v)$是自由度为$v=n-1$的$t$分布。

     $c$值的确定方法:

    • 置信水平90%,则$c=1.64$
    • 置信水平95%,则$c=1.96$
    • 置信水平99%,则$c=2.58$  

    一般情况下,置信区间的计算式为:$$统计量\pm(误差范围)$$

    误差范围等于$c$与检验统计量标注查的乘积:$$误差范围=c\times(统计量的标准差)$$

    转载于:https://www.cnblogs.com/strivepy/p/11088205.html

    更多相关内容
  • 第一章 工程总体概述及项目特点重点难点分析 第一节 工程概况 1 工程基本情况 工程名称重庆江北国际机场东航站区及第三跑道建设工程新建 T3A 航站楼综合交通枢纽和 ITC 大楼消防工程二标段 工程地点重庆江北国际机场...
  • 第一章 工程总体概述及项目特点重点难点分析 第一节 工程概况 工程基本情况 工程名称重庆江北国际机场东航站区及第三跑道建设工程新建 T3A 航站楼综合交通枢纽和 ITC 大楼消防工程二标段 工程地点重庆江北国际机场 ...
  • 第一章 工程总体概述及项目特点重点难点分析第一节 工程概况 工程基本情况 工程名称重庆江北国际机场东航站区及第三跑道建设工程新建T3A 航站楼综合交通枢纽和 ITC 大楼消防工程二标段 工程地点重庆江北国际机场 招 ...
  • 第一章 工程总体概述及项目特点重点难点分析 第一节 工程概况 1 工程基本情况 工程名称重庆江北国际机场东航站区及第三跑道建设工程新建 T3A 航站楼综合交通枢纽和 ITC 大楼消防工程二标段 工程地点重庆江北国际机场...
  • 山西地勘单位人才存在着流失严重、引进不足、管理不善、分布失衡等问题,总体呈现青黄不接、知识断层、人才储备缺乏的不利状况。针对山西地勘单位特点及发展要求,从人才引进、人才合理使用、人才支持体系建设三方面...
  • 系统总体结构设计

    千次阅读 2020-02-16 04:25:08
    系统总体结构设计     系统设计工作应该自顶向下地进行。首先设计总体结构,然后再逐层深入,直至进行每一个模块的设计。总体设计主要是指在系统分析的基础上,对整个系统的划分(子系统)、机器...


    系统总体结构设计

        系统设计工作应该自顶向下地进行。首先设计总体结构,然后再逐层深入,直至进行每一个模块的设计。总体设计主要是指在系统分析的基础上,对整个系统的划分(子系统)、机器设备(包括软、硬设备)的配置、数据的存贮规律以及整个系统实现规划等方面进行合理的安排。

    一、系统设计的任务

    1. 系统设计的概念

    系统设计又称为物理设计,是开发管理信息系统的第二阶段,系统设计通常可分为两个阶段进行,首先是总体设计,其任务是设计系统的框架和概貌,并向用户单位和领导部门作详细报告并认可,在此基础上进行第二阶段――详细设计,这两部分工作是互相联系的,需要交叉进行,本章将这两个部分内容结合起来进行介绍。

    系统设计是开发人员进行的工作,他们将系统设计阶段得到的目标系统的逻辑模型转换为目标系统的物理模型,该阶段得到工作成果――系统设计说明书是下一个阶段系统实施的工作依据。

    2.系统设计的主要内容

    系统设计的主要任务是进行总体设计和详细设计。下面分别说明它们的具体内容。

    (1) 总体设计

    总体设计包括系统模块结构设计和计算机物理系统的配置方案设计。

    <1>系统模块结构设计

    系统模块结构设计的任务是划分子系统,然后确定子系统的模块结构,并画出模块结构图。在这个过程中必须考虑以下几个问题:

    如何将一个系统划分成多个子系统;

    每个子系统如何划分成多个模块;

    如何确定子系统之间、模块之间传送的数据及其调用关系;

    如何评价并改进模块结构的质量。

    <2>计算机物理系统配置方案设计

    在进行总体设计时,还要进行计算机物理系统具体配置方案的设计,要解决计算机软硬件系统的配置、通信网络系统的配置、机房设备的配置等问题。计算机物理系统具体配置方案要经过用户单位和领导部门的同意才可进行实施。

    开发管理信息系统的大量经验教训说明,选择计算机软硬件设备不能光看广告或资料介绍,必须进行充分的调查研究,最好应向使用过该软硬件设备的单位了解运行情况及优缺点,并征求有关专家的意见,然后进行论证,最后写出计算机物理系统配置方案报告。

    从我国的实际情况看,不少单位是先买计算机然后决定开发。这种不科学的、盲目的做法是不可取的,它会造成极大浪费。因为,计算机更新换代是非常快的,就是在开发初期和在开发的中后期系统实施阶段购买计算机设备,价格差别就会很大。因此,在开发管理信息系统过程中应在系统设计的总体设计阶段才具体设计计算机物理系统的配置方案。

    (2) 详细设计

    在总体设计基础上,第二步进行的是详细设计,主要有处理过程设计以确定每个模块内部的详细执行过程,包括局部数据组织、控制流、每一步的具体加工要求等,一般来说,处理过程模块详细设计的难度已不太大,关键是用一种合适的方式来描述每个模块的执行过程,常用的有流程图、问题分析图、IPO图和过程设计语言等;除了处理过程设计,还有代码设计、界面设计、数据库设计、输入输出设计等。

    (3) 编写系统设计说明书

    系统设计阶段的结果是系统设计说明书,它主要由模块结构图、模块说明书和其它详细设计的内容组成。


    系统设计的方法与工具

    系统设计的工作复杂又细致,总体设计阶段需要进行系统模块结构设计,要将一个大系统分解成不同层次、多个模块组成的系统,在详细设计阶段要在模块结构设计的基础上,给出每个模块实现方法的细节,并对模块的输入、输出和处理过程作详细描述,以便在系统实施阶段进行程序设计时可以把这个描述直接“翻译”成用某种程序设计语言书写的程序。系统设计在技术上有相当的难度,为此需要有一定的设计方法和设计工具来指导。70年代以来,出现了多种设计方法,其中结构化设计方法是较为典型的方法,本章将对该设计方法进行论述并介绍几个常用的设计工具。

    一、结构化设计的方法

    结构化设计(STRUCTURED DESIGN, 简称SD)方法是使用最广的一种设计方法,由美国IBM公司的W·STEVENS、G·MYERS和L·CONSTANTINE等人提出。该方法适合于软件系统的总体设计和详细设计,特别是将一个复杂的系统转换成模块化结构系统,该方法具有它的优势。在使用过程中可将结构化设计方法与结构化分析(SA)方法及编程阶段的结构化程序设计方法(SP)前后衔接起来,SD方法具有以下特点:

    1. 相对独立、功能单一的模块结构

    结构化设计的基本思想是将系统设计成由多个相对独立、功能单一的模块组成的结构。由于模块之间相对独立,每一模块就可以单独地被理解、编写、测试、排错和修改,从而有效地防止错误在模块之间扩散蔓延,提高了系统的质量(可维护性、可靠性等)。因此,大大简化了系统研制开发的工作。

    2. “块内联系大、块间联系小”的模块性能标准

    “模块内部联系要大,模块之间联系要小”,这是结构化设计中衡量模块“相对独立”性能的标准。事实上,块内联系和块间联系是同一件事的两个方面。系统中各组成成分之间是有联系的,若把联系密切的成分组织在同一模块中,块内联系高了,块间联系自然就少了。反之,若把密切相关的一些组成成分分散在各个模块中,势必造成很高的块间联系,这将影响系统的可维护性。所以,在系统设计过程中一定要以结构化设计的模块性能标准为指导。

    3. 采用模块结构图的描述方式

    结构化设计方法使用的描述方式是模块结构图。例如,图6-2-1示了一个计算工资的模块结构图。

    图6-2-1  计算工资的模块结构图

    系统模块结构设计

    总体设计的另外一个主要内容是合理地进行系统模块结构的分析和定义,将一个复杂的系统设计转为若干个子系统和一系列基本模块的设计,并通过模块结构图把分解的子系统和一个个模块按层次结构联系起来。下面来介绍如何进行模块的分解、如何从数据流图导出模块结构图以及模块结构图的改进。

    一、模块分解的原则和依据   

    系统逻辑模型中数据流图中的模块是逻辑处理模块,模型中没有说明模块的物理构成和实现途径,同时也看不出模块的层次分解关系,为此在系统结构设计中要将数据流图上的各个逻辑处理模块进一步分解,用模块结构图确定系统的层次结构关系,并将系统的逻辑模型转变为物理模型。

    1.“耦合小,内聚大”的基本原则

    在结构化设计中,采用自顶向下,逐步细化的方法将系统分解成为一些相对独立、功能单一的模块。如何度量模块之间的独立性呢?

    在一个管理信息系统中,系统的各组成部分之间总是存在着各种联系的,将系统或子系统划分成若干模块,则一个模块内部的联系就是块内联系,而穿越模块边界的联系就是块间联系。由于模块之间的互相联系越多,模块的独立性就越少,因此,引入模块耦合和内聚的概念。

    耦合表示模块之间联系的程度。紧密耦合表示模块之间联系非常强,松散耦合表示模块之间联系比较弱,非耦合则表示模块之间无任何联系,是完全独立的。

    内聚表示模块内部各成分之间的联系程度。

    一般说来,在系统中各模块的内聚越大,则模块间的耦合越小。但这种关系并不是绝对的。耦合小使得模块间尽可能相对独立,从而各模块可以单独开发和维护。内聚大使得模块的可理解性和维护性大大增强。因此,在模块的分解中应尽量减少模块的耦合,力求增加模块的内聚。

      2.对子系统或模块进行划分的依据

    一个合理的子系统或模块划分,应该是内部联系强,子系统或模块间尽可能独立,接口明确、简单,尽量适应用户的组织体系,有适当的共用性。也就是上面所说的“耦合小,内聚大”。按照结构化设计的思想,对模块或子系统进行划分的依据通常有以下几种:

    (1)按逻辑划分,把相类似的处理逻辑功能放在一个子系统或模块里。例如,把“对所有业务输入数据进行编辑”的功能放在一个子系统或模块里。那么不管是库存、还是财务,只要有业务输入数据都由这个子系统或模块来校错、编辑。

    (2)按时间划分,把要在同一时间段执行的各种处理结合成一个子系统或模块。

    (3)按过程划分,即按工作流程划分。从控制流程的角度看,同一子系统或模块的许多功能都应该是相关的。

    (4)按通信划分,把相互需要较多通讯的处理结合成一个子系统或模块。这样可减少子系统间或模块间的通讯,使接口简单。

    (5)按职能划分,即按管理的功能。例如,财务、物资、销售子系统,或输入记帐凭证、计算机优解子系统或模块等等。

    一般来说,按职能划分子系统,按逻辑划分模块的方式是比较合理和方便的,图6-4-1表示了按这种方式划分所组成的系统。

    图6-4-1  子系统按职能、模块按逻辑划分所形成的系统

    详细设计

    进行了系统的总体设计后即可在此基础上进行系统的详细设计了,即各种输入、输出、处理和数据存储等的详细设计。下面分别介绍详细设计的内容。

    一、代码设计

    代码是用来表示事物名称、属性和状态等的符号。在管理信息系统中,代码是人和机器的共同语言,是系统进行信息分类、校对、统计和检索的依据。代码设计就是要设计出一套能为系统各部门公用的、优化的代码系统,这是实现计算机管理的一个前提条件。

    1. 代码设计的原则

    代码设计是一项重要的工作,合理的编码结构是使管理信息系统具有生命力的重要因素。设计代码的基本原则是:

    (1) 具备唯一确定性。每一个代码都仅代表唯一的实体或属性。

    (2) 标准化与通用性。凡国家和主管部门对某些信息分类和代码有统一规定和要求的,则应采用标准形式的代码,以使其通用化。

    (3) 可扩充且易修改。要考虑今后的发展,为增加新代码留有余地。当某个代码在条件或代表的实体改变时,容易进行变更。

    (4) 短小精悍即选择最小值代码。代码的长度会影响所占据的内存空间、处理速度以及输入时的出错概率,因此要尽量短小。

    (5) 具有规律性、便于编码和识别。代码应具有逻辑性强,直观性好的特点,便于用户识别和记忆。   

    2.分类方法

        目前最常用的分类方案有两种,一种是线分类方法,一种是面分类方法。在实际应用中根据具体情况各有其不同的用途。

        线分类方法:首先给定母项,然后下分若干子项,由对象的母项分大集合,由大集合确定小集合,最后落实到具体对象

        特点:结构清晰,容易识别和记忆,易查找;

              适应于手工系统;

        缺点:结构不灵活,柔性差。

              机关党政生产经营 … …

           线分类时要掌握两个原则:唯一性和不交叉性。

        例:公司生产组织结构,如图6-5-1所示。

    图6-5-1  公司生产组织结构

        面分类方法:它主要从面的角度来考虑分类

        面分类的特点:

        柔性好,面上的增、删、改很容易;

        可实现按任意组配面的信息检索,对机器处理有良好的适应性;

        缺点是不易直观识别,不便于记忆。


    系统设计报告

        系统设计阶段的成果是系统设计报告, 其主要是各种设计方案和设计图表,它是下一步系统实现的基础。

    一、系统设计的成果

        系统设计阶段的成果归纳起来一般有 (点击这里观看“各开发环节之间的关系”动画演示)

        1.系统总体结构图(包括总体结构图,子系统结构图,计算机流程图等)。

        2.系统设备配置图(系统设备配置图: 主要是计算机系统图,设备在各生产岗位的分布图,主机、网络、终端联系图等)。

        3.系统分布编码方案(分类方案、编码系统)。

        4.数据库结构图(DB的结构,主要指表与表之间的结构,表内部结构(字段、域、数据字典等)。

        5.HIPO图(层次化模块控制图、IPO图等等)。

        6.系统详细设计方案说明书

    二、系统设计说明书的组成

    1.引言

     

    (1) 摘要   系统的目标名称和功能等的说明

    (2) 背景

    l 项目开发者

    l 用户

    l 本项目和其它系统或机构的关系和联系

    (3) 系统环境与限制

    l硬件、软件和运行环境方面的限制

    l保密和安全的限制

    l有关系统软件文本

    l有关网络协议标准文本

    (4) 参考资料和专门术语说明

     

    2.系统设计方案 

    (1) 模块设计

    l系统的模块结构图

    l各个模块的IPO图(包括各模块的名称、功能、调用关系、局部数据项和详细的算法说明等)

    (2) 代码设计

    l各类代码的类型、名称、功能、使用范围和使用要求等的设计说明书

    (3) 输入设计

    l输入项目

    输入人员(指出所要求的输入操作人员的水平与技术专长,说明与输入数据有关的接口软件及其来源)

    l主要功能要求(从满足正确、迅速、简单、经济、方便使用者等方面达到要求的说明)

    l输入校验(关于各类输入数据的校验方法的说明)

    (4) 输出设计

    l输出项目

    l输出接受者

    l输出要求(所用设备介质、输出格式、数值范围和精度要求等)

    (5) 文件(数据库)设计说明

    l概述(目标、主要功能)

    l需求规定(精度、有效性、时间要求及其它专门要求)

    l运行环境要求(设备支撑软件,安全保密等要求)

    l逻辑结构设计(有关文件及其记录、数据项的标识、定义、长度和它们之间的关系)

    l物理结构设计(有关文件的存贮要求、访问方法、存贮单位、设计考虑和保密处理等)

    (6) 模型库和方法库设计(本系统所选用的数学模型和方法以及简要说明)

    (7) 安全保密设计

    (8) 物理系统配置方案报告

    l硬件配置设计

    l通信与网络配置设计

    l软件配置设计

    l机房配置设计

    (9) 系统实施方案及说明

    l实施方案

    l实施计划(包括工作任务的分解、进度安排和经费预算)

    l实施方案的审批(说明经过审批的实施方案概况和审批人员的姓名)

    3.案例   

    序号模块名称主要用途
    1无线寻呼管理信息系统-系统设计说明书    研究开发5-10万用户寻呼机管理信息系统,它可以进行普通寻呼服务;漫游寻呼服务;群呼服务;试机服务;定时服务;系统管理;运行管理。 
    2库存管理系统-系统设计说明书    研发库存控制系统的主要目的:1)为顾客订货提供更好的服务;2)控制库存水平;3)决定向厂家订货的时间和批量。
    3百货商店业务管理信息系统-系统设计

    实现登记、整理数据,处理核对顾客订货单;向经理提供各种业务统计报表;提供各级查询;销售、采购、会计各部门的业务数据处理实现自动化。

    4铁道财务会计管理信息系统-系统设计    运用系统的方法以计算机和现代通信技术为基本信息处理手段和工具的,能为全国铁道财务会计核算、管理、决策提供信息服务的人—机系统。
    5高校选课辅助决策    本选课系统能够使学生在INTERNET上自主、便捷、准确地进行全校性课程选择的一种软件。学生在选择选修课前,可以上网进行查询,当学生输入其学号与密码后,系统便调出其所有相关信息,包括已修课程、已修课程的成绩、专业培养计划、全校性可选课程,系统进行综合分析后,得到一些可行的方案,供选课学生参考,并提出合理建议。
    6条形材料选材优化    要制造器件,必须先制造一定的零件,而这些零件又由某种原材料截取而得到。例如:用某一种条形材料锯成数种需要的零件,求最少的用料数量。使用<<运筹学>>线性规划的思想和解决方法。

        


    https://blog.csdn.net/aa2397199142/article/details/50686499

    展开全文
  • 用样本估计总体

    千次阅读 2019-02-12 17:50:00
    频率分布折线图和总体密度曲线 茎叶图 利用茎叶图既可以对数据的平均值和方差做定量计算,也可以根据样本数据的分散与集中程度对数据的平均值和方差做定性分析。 二、相关计算 样本数据的数字...

    前言

    本小节中的细小知识点很多,需要认真学习,仔细体会。

    一、基础知识梳理

    频数分布表,频率分布表

    注意公式及其变形应用,\(频率=\cfrac{频数}{样本容量}\)\(频数=频率\times 样本容量\)

    频率分布折线图和总体密度曲线

    茎叶图

    利用茎叶图既可以对数据的平均值和方差做定量计算,也可以根据样本数据的分散与集中程度对数据的平均值和方差做定性分析。

    二、相关计算

    样本数据的数字特征计算:

    比如给定一组样本数据\(2,2,4,4,4\)

    则①众数为4;②中位数为4;

    ③平均数为\(\bar{x}=\cfrac{2+2+4+4+4}{5}=2\times \cfrac{2}{5}+4\times \cfrac{3}{5}\)

    数据与其对应的频率乘积,再求和;

    ④方差为\(s^2=\cfrac{1}{5}[(2-3.2)^2\times 2+(4-3.2)^2\times 3]=(2-3.2)^2\times \cfrac{2}{5}+(4-3.2)^2\times \cfrac{3}{5}\)

    数据与平均值的差的平方与频率乘积,再求和;

    ⑤标准差\(s=\sqrt{(2-3.2)^2\times \cfrac{2}{5}+(4-3.2)^2\times \cfrac{3}{5}}\)

    频率分布直方图中的数字特征的计算

    当一组数据经过加工整理成频率分布直方图后,数据信息会有所损失,所以计算数据的数字特征有一定的难度。

    ①众数:直方图中最高矩形的中点横坐标;

    ②中位数:频率分布直方图频率和(面积和)的一半处所对应的横坐标,即面积等分线所对应的横坐标;

    ③平均数:每个矩形的分组的中点值乘以每个对应矩形的面积再求和;

    ④方差:每个矩形的分组的中点值与平均值的差的平方与频率乘积,再求和;

    ⑤标准差:方差的算术平方根;

    用样本估计总体的两层含义

    ①用样本的频率分布估计总体的频率分布;

    ②用样本的基本数字特征估计总体的基本数字特征;

    频率分布直方图的特点

    ①直方图中相邻两横坐标之差表示组距,纵轴表示\(\cfrac{频率}{组距}\)\(频率=\cfrac{频率}{组距}\times 组距\)

    ②频率分布直方图中各小长方形的面积(频率)之和为\(1\),各小长方形高之比也就是频率比。

    ③频率分布表和频率分布直方图是一组数据频率分别的两种形式,前者准确,后者直观。

    平均数的计算技巧

    比如计算数据\(515,521,527,531,532,536,543,548,558,559\)的平均数。

    \(\bar{x}=500+\cfrac{15+21+27+31+32+36+43+48+58+59}{10}=537\)

    \(\bar{x}=540+\cfrac{-25-19-13-9-8-4+3+8+18+19}{10}=540+\cfrac{-30}{10}=537\)

    给定频数分布表求平均数

    思路一:每个矩形的分组的中点值乘以频数再求和,最后除以样本容量;思路二:转化为频率分布表再计算;

    分组15~2525~3535~4545~5555~65
    频数\(5\)\(5\)\(25\)\(15\)\(10\)
    频率\(\cfrac{5}{60}\)\(\cfrac{5}{60}\)\(\cfrac{25}{60}\)\(\cfrac{15}{60}\)\(\cfrac{10}{60}\)

    如上表,\(\bar{x}=\cfrac{20\times 5+30\times 5+40\times 25+50\times 15+60\times 10}{60}\)

    \(=20\times \cfrac{5}{60}+30\times \cfrac{5}{60}+40\times \cfrac{25}{60}+50\times \cfrac{15}{60}+60\times \cfrac{10}{60}\)

    给定频率分布表求平均数:

    如果数据\(x_1\)\(x_2\)\(\cdots\)\(x_n\)在样本中各自出现的频率分别是\(p_1\)\(p_2\)\(\cdots\)\(p_n\),则\(\bar{x}\) \(=x_1p_1\) \(+x_2p_2\) \(+\cdots+\) \(x_np_n\);在频率分布直方图中,\(x_i\)通常取其所在组的中间值。

    三、数字特征的性质推广

    平均数、方差、标准差的性质推广

    如果一组样本数据\(x_1\)\(x_2\)\(\cdots\)\(x_n\),其平均数为\(\bar{x}\),方差为\(s^2\),标准差为\(s\)

    则样本数据\(ax_1+b\)\(ax_2+b\)\(\cdots\)\(ax_n+b\),其平均数为\(a\bar{x}+b\),方差为\(a^2\cdot s^2\),标准差为\(a\cdot s\)

    四、典例剖析

    例1【2015\(\cdot\)安徽卷】

    若样本数据\(x_1,x_2,\cdots,x_{10}\)的标准差为\(8\),则数据\(2x_1-1,2x_2-1,\cdots,2x_{10}-1\)的标准差为【 】

    $A.8$ $B.15$ $C.16$ $D.32$

    分析:原样本数据的相关数字特征如下:

    \(x_1,x_2,\cdots,x_{10}\)的平均数为\(\bar{x}=\cfrac{x_1+x_2+\cdots+x_{10}}{10}\)

    其方差为\(s_1^2=\cfrac{1}{10}[(x_1-\bar{x})^2+(x_2-\bar{x})^2+\cdots+(x_{10}-\bar{x})^2]\)

    其标准差为\(s_1=\sqrt{\cfrac{1}{10}[(x_1-\bar{x})^2+(x_2-\bar{x})^2+\cdots+(x_{10}-\bar{x})^2]}=8\)

    则新样本数据的相关数字特征如下:

    \(2x_1-1,2x_2-1,\cdots,2x_{10}-1\)的平均数为

    \(\bar{x'}=\cfrac{(2x_1-1)+(2x_2-1)+\cdots+(2x_{10}-1)}{10}=2\bar{x}-1\)

    【引申】

    ①如果数据\(x_1\)\(x_2\)\(\cdots\)\(x_n\)的平均数为\(\bar{x}\),则数据\(ax_1+b\)\(ax_2+b\)\(\cdots\)\(ax_n+b\)的平均数为\(a\bar{x}+b\)

    其方差为\(s_2^2=\cfrac{1}{10}[(2x_1-1-\bar{x'})^2+(2x_2-1-\bar{x'})^2+\cdots+(2x_{10}-1-\bar{x'})^2]\)

    \(=\cfrac{2^2}{10}[(x_1-\bar{x})^2+(x_2-\bar{x})^2+\cdots+(x_{10}-\bar{x})^2]=2^2\cdot s_1^2\)

    【引申】

    ②如果数据\(x_1\)\(x_2\)\(\cdots\)\(x_n\)的方差为\(s^2\),则数据\(ax_1+b\)\(ax_2+b\)\(\cdots\)\(ax_n+b\)的方差为\(a^2\cdot s^2\)

    其标准差为\(s_2=\sqrt{\cfrac{1}{10}[(2x_1-1-\bar{x'})^2+(2x_2-1-\bar{x'})^2+\cdots+(2x_{10}-1-\bar{x'})^2]}\)

    \(=\sqrt{\cfrac{1}{10}[(2x_1-2\bar{x})^2+(2x_2-2\bar{x})^2+\cdots+(2x_{10}-2\bar{x})^2]}\)

    \(=\sqrt{\cfrac{2^2}{10}[(x_1-\bar{x})^2+(x_2-\bar{x})^2+\cdots+(x_{10}-\bar{x})^2]}\)

    \(=2\sqrt{\cfrac{1}{10}[(x_1-\bar{x})^2+(x_2-\bar{x})^2+\cdots+(x_{10}-\bar{x})^2]}\)

    \(=2\cdot s_1=2\times8=16\),故选\(C\)

    【引申】

    ③如果数据\(x_1\)\(x_2\)\(\cdots\)\(x_n\)的标准差为\(s\),则数据\(ax_1+b\)\(ax_2+b\)\(\cdots\)\(ax_n+b\)的标准差为\(a\cdot s\)

    例1-1【2018\(\cdot\)石家庄质检】

    设样本数据\(x_1\)\(x_2\)\(\cdots\)\(x_{2018}\)的方差是4,若\(y_i=2x_i-1(i=1,2,\cdots,2018)\),则\(y_1\)\(y_2\)\(\cdots\)\(y_{2018}\)的方差是____________。

    分析:其方差为\(s^2=2^2\cdot 4=16\)

    例2【2017高考真题卷Ⅱ文科19题改编】【题文】如右图所示,求该频率分布直方图的众数、中位数、平均数、方差。

    992978-20170703234916909-113054221.jpg

    考点:频率分布直方图,众数、中位数、平均数、方差

    分析:以上图为例,

    • 求众数:

    “旧养殖法”的众数为\(47.5\);“新养殖法”的众数为\(52.5\)

    • 求中位数:

    “旧养殖法”的中位数先判断其大概位置,由于\(25-50\)之间的面积和为\(0.62\),25-45之间的面积和为\(0.42\)

    故中位数一定位于\(45-50\)之间,设中位数为\(x\),则\(0.42+(x-45)\times0.04=0.50\),求得\(x=47\),即中位数为\(47\)

    • 求平均数:比如“旧养殖法”的平均数的计算

    \(\bar{x}=27.5\times5\times0.012+32.5\times5\times0.014+37.5\times5\times0.024\)

    \(+42.5\times5\times0.034+47.5\times5\times0.040+52.5\times5\times0.032\)

    \(+57.5\times5\times0.020+62.5\times5\times0.012+67.5\times5\times0.012\)

    \(=47.1\)

    “新养殖法”的平均数的计算

    \(\bar{y}=37.5\times5\times0.004+42.5\times5\times0.020+47.5\times5\times0.044\)

    \(+52.5\times5\times0.068+57.5\times5\times0.046\)

    \(+62.5\times5\times0.010+67.5\times5\times0.008\)

    \(=52.35\)

    求方差:比如“新养殖法”的方差计算

    \(S^2=(37.5-52.35)^2\times 0.004\times 5+(42.5-52.35)^2\times 0.020\times 5+(47.5-52.35)^2\times 0.044\times 5\)

    \(+(52.5-52.35)^2\times 0.068\times 5+(57.5-52.35)^2\times 0.046\times 5\)

    \(+(62.5-52.35)^2\times 0.010\times 5+(67.5-52.35)^2\times 0.008\times 5\)

    \(=?\)

    例3【利用条形统计图计算样本数字特征】

    992978-20190213110154232-440076157.jpg

    992978-20190213110157626-1126356146.jpg

    例4【2015高考广东卷】

    992978-20190213110201129-442982157.jpg

    992978-20190213110203984-1751427753.jpg

    992978-20190213110217881-206797983.jpg

    例5【从表格中提取数据并加工整理】

    992978-20190213110224675-2088103293.jpg

    992978-20190213110226280-1774522775.jpg

    992978-20190213110230995-1497002616.jpg

    992978-20190213110233316-1354371145.jpg

    例6【2016高考四川卷】

    992978-20190213111552913-822592342.jpg

    992978-20190213111555031-2141731262.jpg

    992978-20190213111558575-1682050706.jpg

    例7【2014高考全国卷Ⅰ】

    992978-20190213112311470-315956465.jpg

    992978-20190213112318794-266641276.jpg

    992978-20190213112326466-2067346328.jpg

    992978-20190213112326975-839002008.jpg

    例8【2019届高三理科数学课时作业第8题】

    为了考查某校各班参加课外书法小组的人数,从全校随机抽取\(5\)个班级,把每个班级参加该小组的人数作为样本数据。已知样本平均数为7,样本方差为4,且样本数据各不相同,则样本数据中的最大值为【】

    $A.9$ $B.10$ $C.11$ $D.12$

    法1:不妨设这五个数据分别为\(x_1<x_2<x_3<x_4<x_5\),则有\(\cfrac{x_1+x_2+x_3+x_4+x_5}{5}=7\)\(s^2=\cfrac{1}{5}[(x_1-7)^2+(x_2-7)^2+(x_3-7)^2+(x_4-7)^2+(x_5-7)^2]=4\)

    \((x_1-7)^2+(x_2-7)^2+(x_3-7)^2+(x_4-7)^2+(x_5-7)^2=20\)

    很显然当最大数据\(x_5=12\)时,不满足;

    再代入\(x_5=11\),得到\((x_1-7)^2+(x_2-7)^2+(x_3-7)^2+(x_4-7)^2=4\)

    由于样本数据互不相同,这是不可能成立的;

    若样本数据为\(4,6,7,8,10\),代入验证知①②式均成立,

    此时样本数据中的最大值为 10.故答案选\(B\)

    法2:不妨设这五个数据分别为\(x_1<x_2<x_3<x_4<x_5\),则有\(\cfrac{x_1+x_2+x_3+x_4+x_5}{5}=7\)\(s^2=\cfrac{1}{5}[(x_1-7)^2+(x_2-7)^2+(x_3-7)^2+(x_4-7)^2+(x_5-7)^2]=4\)

    \((x_1-7)^2+(x_2-7)^2+(x_3-7)^2+(x_4-7)^2+(x_5-7)^2=20\)

    要使其中一个达到最大,这五个数必须是关于\(0\)对称分布的,就像“最小二乘法”中要求样本点要均匀分布在回归直线的两侧一样,

    \(9+1+0+1+9=20\),也就是\((-3)^2+(-1)^2+0^2+1^2+3^2=20\)

    所以五个班级参加的人数分别为\(4,6,7,8,10\),故最大数字为10。

    例9【2019届高三理科数学课时作业第9题】【涉及逻辑推理】

    气象意义上从春季进入夏季的标志为“连续5天的日平均气温均不低于\(22^{\circ}C\)”。现有甲、乙、丙三地连续5天的日平均气温的记录数据(数据都是正整数,单位:\(^{\circ}C\))

    ①甲地:5个数据的中位数为24,众数为22;

    ②乙地:5个数据的中位数为27,均值为24;

    ③丙地:5个数据中有一个是32,均值为26,方差为10.8;

    则满足进入夏季标志的地区有【】个。

    $A.0$ $B.1$ $C.2$ $D.3$

    分析:对甲地而言,由于中位数为24,众数为22;故可以将适合题意的5个数据由小到大排序为22,22,24,25,26;其中前三个数据不能变化,后两个数据可以变化,但其必须都大于24,且不能相同,故甲地的数据满足进入夏季的条件;

    对乙地而言,由于中位数为27,均值为24;故可以将适合题意的5个数据由小到大排序为18,19,27,28,28;显然其不满足进入夏季的条件;

    对丙地而言,不妨设32为最大的数据,由于均值为26,故尝试5个数据为22,22,22,22,32;计算得到均值为24,那么前四个数据中若有小于22的,均值会小于24,故我们调整前4个数据,显然都应该大于22,此时如我们调整的恰当,必然会得到其均值为26,方差为10.8;故丙地的数据也满足进入夏季的条件;

    综上所述,满足进入夏季标志的地区有2个,故选\(C\)

    转载于:https://www.cnblogs.com/wanghai0666/p/10366239.html

    展开全文
  • 应用不同的假设检验的依据,是不同的数据条件。数据条件包括了实验设计方案(完全随机设计、配对设计或者单样本设计等)、样本量、独立性、正态性...联系前文,从抽样研究所得的样本均数特点来看,只要样本量>60...

    ea55310d26e9918909856163e8dda46a.png

    应用不同的假设检验的依据,是不同的数据条件。

    数据条件包括了实验设计方案(完全随机设计、配对设计或者单样本设计等)、样本量、独立性、正态性、方差齐性等,由于数据条件和实验需求的不同,选择不同的检验方法。

    一、t 检验的应用

    • 应用条件:
    计量资料
    小样本
    独立性、正态性、方差齐性

    t检验基于t分布的函数图像,用于小样本的检验。

    为什么小样本用t检验?

    联系前文,从抽样研究所得的样本均数特点来看,只要样本量>60,(无论总体是否服从正态分布)抽样研究的样本均数服从或者近似服从正态分布;而如果样本量较小(参考样本量<100),抽样分布随着样本量的减小,与正态分布的差别越来越大。此时需要用小样本理论来解释样本均数的分布——之前学习过的t分布就是小样本理论的代表。

    因此,小样本的检验需要用到t检验。

    当样本含量越来越大时,依据t分布函数变化规律,样本含量越大则函数曲线越接近正态分布曲线,即t值近似u值,属于t检验的特殊情况。

    ——满足以上三个条件可以考虑运用t检验,而课本中介绍了 t 检验三种不同情况,具体什么满足什么条件可以运用哪一种呢?
    • t 检验的分类

    11ed2800c2ab699ef2851dfdbba6083b.png

    t检验分为三种不同方法,在应用时,依据各种方法的用途、适用条件选择不同的检验方法。

    1. 单样本t检验
    2. 配对样本t检验
    3. 两样本t检验
    • 单样本t检验用于样本和总体均数的比较,其应用条件需要满足:计量资料、小样本、正态分布。(两小样本比较时还要求方差齐性,但因单样本t检验中不存在两个小样本,故无法检验方差齐性。)
    方差齐性:两小样本所对应的 两总体方差相等
    • 配对样本t检验,其应用条件需要满足:计量资料、配对设计、小样本、正态分布。其实质与单样本t检验相同,都是一个样本均数所代表的的未知总体均数与一个已知总体均数的比较。
    • 两样本t检验,适用于完全随机设计的两样本均数的比较,也就是前文提到的两小样本比较。因此,其应用条件除了满足:计量资料、小样本、正态性之外,还需要方差齐性。如果方差齐,可进行两样本t检验,如果方差不齐,则需要其他的检验方法。

    841e2534ab7172680c78b0310b251092.png
    方差不齐时可选的检验方法

    值得注意的是,两个样本均数的比较在满足情况的条件下可以用两样本t检验,多个样本均数的比较则需要用方差分析。


    一个示例:两独立样本t检验

    1. 建立假设检验,确定检验水准

    AB两组药物施加作用效果相同。

    AB两组药物施加作用效果不同。(双侧检验)

    = 0.05

    2. 计算检验统计量

    SPSS软件实现步骤

    数据的正态性检验:P>
    ,不拒绝
    ,尚不能认为样本均数总体不符合正态分布。

    2dfb80d8f3d09f4fe68d63eb67fb49b1.png
    两独立样本t检验:在spss中,不需要专门分步骤来进行方差齐性检验,在两独立样本t检验的结果中已经出示了假定方差齐和假定方差不齐两种结果。可直接通过独立样本t检验结果显示表格来判断方差齐与不齐。

    59670d17c9ecb5774a0d33069ce315c3.png

    3. 确定P值,作出推断结论

    由结果显示:P=0.389,可作出结论:P >

    ,按检验水准
    ,不拒绝
    ,差异无统计学意义。尚不能认为两组药物施加效果有差异。

    二、F检验的应用

    在上文示例,spss所呈现的独立样本检验结果有"F"一值,所代表的的是F检验。

    F检验:判断两总体方差是否不等的判断。图表中的Levene方差等同性检验结果,其F值和sig值(显著性)可用来判断两样本资料是否具有方差齐性。

    其具体假设检验过程可写作如下形式:

    1. 建立假设检验,确定检验水准

    两组数据总体方差相等。

    两组数据总体方差不等。

    = 0.05

    2. 计算检验统计量

    用上例数据,F = 0.812 , P = 0.378

    3. 确定P值,作出推断结论

    若P >

    ,则结论为按检验水准
    ,不拒绝
    ,差异无统计学意义。尚不能认为l两组数据总体方差不等。

    因此,在两独立样本t检验中,Levene检验的sig值大于

    ,我们判读为两组样本数据方差齐。

    总结:

    关于SPSS结果图表的判读,以上图为例:

    53e8c6799fe67ed5fd9ec00a1cceb523.png

    在leneve方差等同性检验中,F值及其显著性(sig值)判断数据是否方差齐;在右侧t检验中,sig值用来判断两组数据是否有差异。

    在正态性和方差齐性检验中,P>

    ,判读为数据符合正态分布和方差齐。
    展开全文
  • 由于随机抽样的偶然因素使样本各单位的结构不足以代表总体单位的结构,而引起抽样指标和全局指标的绝对离差。 2、样本均数的抽样分布特点 各样本均数未必等于总体均数 样本均数之间存在差异(可以利用这一点来...
  • 管理统计学 全

    千次阅读 2020-05-30 14:59:02
    统计学是研究如何测定、收集、描述和分析大量客观现象总体数量的数据和给出正确认识的方法论科学。 2、学派及代表人物 (1) 政治算术学派: 创始人和代表人物,英国威廉·配地、代表著作是《政治算术》。 该学派被...
  • 第一节 细胞是生命活动的基本单位

    千次阅读 2020-08-14 19:37:46
    文章目录第一章走进细胞第一节 细胞是生命活动的基本单位 第一章走进细胞 第一节 细胞是生命活动的基本单位 导入:植物嫁接、运动员受伤。
  •  YARN总体上仍然是Master/Slave结构。在整个资源管理框架中,ResourceManager为Master,NodeManager为Slave,并通过HA方案实现了ResourceManager的高可用。ResourceManager负责对各个NodeManager上的资源进行统一...
  • 1. 概述 随着云计算逐渐成为主流,云安全也获得了越来越多的关注,传统和新兴的云计算厂商以及安全厂商均推出了大量云安全产品。但是,与有清晰定义的“云计算”(NIST SP 800-145和ISO/IEC 17788)不同,业界对...
  • POSIX标准总体分析

    万次阅读 2016-03-26 12:12:28
    POSIX标准总体分析 转自: http://blog.csdn.net/novagx/article/details/2077561 POSIX 标准总体分析  POSIX,全称为可移植性操作系统接口,是一种关于信息技术的IEEE标准。它包括了系统应用程序接口...
  • 6.低功耗、也许Freescale系列的单片机的功耗没有MSP430的低,但是他具有全静态的“等待”和“停止”两种模式,从总体上降低您的功耗!新近推出的几款超低功耗已经与MSP430的不相上下! 使用最多的器件:MC9S12G系列 ...
  • 超硬核!数据结构学霸笔记,考试面试吹牛就靠它

    万次阅读 多人点赞 2021-03-26 11:11:21
    数据元素:数据的基本单位 数据项:数据的不可分割的最小单位 数据对象:性质相同的数据元素的集合。 举例:动物是数据,某只动物是数据元素,猫狗是数据对象,颜色可以是数据项。 数据元素之间存在某种关系,这种...
  • 在Internet飞速发展的今天,互联网...本论文从系统需求分析、总体设计、详细设计、系统实现和系统测试这五个角度对系统的开发过程进行了详细的介绍,并对该系统的主要特点以及采用的主要系统开发工具进行了简单的介绍。
  • 2021中国WMS市场发展趋势和特点

    千次阅读 2022-02-07 10:06:10
    图2:2020年WMS企业国内市场份额占比情况(单位:%) 二 中国企业仓储管理现状 当前,我国智能仓储在“互联网+”战略的带动下快速发展,与大数据、云计算等新一代互联网技术深度融合,整个行业向着运行高效、流通...
  • 二统计基本知识 教学目标 知识 统计的基本概念 能力 能...举例提问 二 课程讲解用多媒体PPT展示 1总体与总体单位 (一)统计总体和总体单位的概念 (二)统计总体的特点 2统计标志与指标 (一) 统计标志 (二)统计指标 六个
  • 几大数据库的特点

    千次阅读 2017-08-07 20:31:32
    由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。 与其他的大型数据库例如Oracle、DB2、SQL Server等相比,MySQL规模小、功能...
  • 1、体积小、速度快、总体拥有成本低,开源; 2、支持多种操作系统; 3、是开源数据库,提供的接口支持多种语言连接操作; 4、MySQL的核心程序采用完全的多线程编程。线程是轻量级的进程,它可以灵活地为用户提供服务...
  • 欢迎您阅读此系列文章,文章参考自《全国计算机等级考试三级教程.网络技术》。内容为NCRE三级网络技术主要知识点以及常考点,此知识点总结参照《三级网络技术考试大纲...教材第二章《中小型网络系统总体规划与设计.
  • 以玉皇山南基金小镇为例,该小镇根据金融人才国际化、精英型的特点,坚持市场化运作、产业链招商、生态圈建设的模式,通过联合政府性行业组织、龙头企业和知名中介,开展海内外招商及合作业务,快速推动私募金融集聚...
  • 标志、指标(参数)和统计量 标志:总体单位普遍具有的属性或特征称为标志。标志按其表现分为品质标志和数量标志两种。 ① 品质标志表明单位属性方面的特征,品质标志的表现只能用非数值来描述。 例如商品的类别;...
  • JVM系列(一) - JVM总体概述

    千次阅读 2018-08-23 14:33:07
    单位读取 Java 字节码。它就像一个 CPU 一样,一条一条地执行 机器指令 。每个字节码指令都由一个1字节的 操作码 和附加的 操作数 组成。 执行引擎 取得一个 操作码 ,然后根据 操作数 来执行任务,完成后就...
  • 系统总体设计 设计思路 我公司利用多年的视频技术沉淀优势 并结合深入的市场调研分析 推出明 厨亮灶视频联网监管系统解决方案该方案贴合各省市推行的透明厨房标准 能有效地满足监管部门 餐饮单位公众对于视频图像的...
  • 1、AIoT的发展现状与特点 1)AIoT的定义 AIoT是近几年流行起来的热词之一,特指在人工智能加持下的物联网,通过人工智能(AI)与物联网(IoT)的结合,使得传统的物联网能力更强、“智商”更高、应用更上一个台阶。 ...
  • )1 系统 整体解决方案 (V1.0) 有限公司 Co, Ltd 2012年 2 月 文档信息 目录 项目概述 (3) 项目说明 (3) 项目名称 (3) 项目建设单位 (3) 供应商简介 (3) (3(3) (3) (3) 公司成立于发展情况 拓普网络的优势和特点 ...
  • 新核心系统的特点 基于以客户为中心的架构,提供全面、适合不同客户类型的客户信息,并实现统一的客户视图 提供标准化、产业化的功能和流程支持 通过产品和费率配置的功能,使产品管理得以参数化和标准化,并...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 41,274
精华内容 16,509
关键字:

总体单位的特点