精华内容
下载资源
问答
  • 最佳回答加权平均数的概念 加权平均数是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算, 若 n个数中,x1出现f1次,x2出现f2次,…,xk出现fk次,.加权是一个什么概念?加权平均数是不同比重...

    最佳回答

    加权平均数的概念 加权平均数是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算, 若 n个数中,x1出现f1次,x2出现f2次,…,xk出现fk次,.

    加权是一个什么概念?

    加权平均数是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算。若在一组数中,x1出现f1次,x2出现f2次,…,xk出现fk次,那么(x1f1 + x2f2+ ...

    用一个例子来说明问题:一个班50人,5分制考试,10人得5分,20人得4分,10人得3分,8人得2分,2人得1分。求这个班的平均分是多少?所谓平均数,是算术平均数。.

    概况: 加权平均数是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算, 若在一组数中,x1出现f1次,x2出现f2次,…,xk出现fk次,那么(x1f.

    但得分也是不相同的; (f1 + f2 + ; 表示具有不同比重的观察值,xk出现fk次: (4. 四次射中7环,所以平均数是特殊的加权平均数. 比如在一些体育比赛项目中. xkfk xy.

    “统计初步”这部分内容中,平均数是一个非常重要而又有广泛用途的概念,在日常生活中,我们经常会听到这样一些名词:平均气温、平均降雨量、平均产量、人均年收.

    加权平均值里 何为加权?加权是什么?为何加权?

    1,1,2,2,2,3,4,4, 这组数中(1*2+2*3+3*1+4*2)/8=19/8 平均数19/8成为1,2,3,4,的加权平均数 2,3,1,2,分别为三个数的权 或者各项数据的比重不同,每个数据占的比重就.

    所谓的加权平均就是各组数据不是简单的按照求和,除以组数进行平均结果。 而是掺杂进去各组数据所占据的不同权重(即不同比例)之和,平均处理的数据结果。 一般.

    加权平均值就是期望,将每个数据的值和它的概率相乘都加起来就是了.反映了一个事件中最有可能出现的值

    加权平均 统计学名词. “统计初步”这部分内容中,平均数是一个非常重要而又有广泛用途的概念,在日常生活中,我们经常会听到这样一些名词:平均气温、平均降雨量.

    一般来说,平均数反映了一组数据的一般水平,利用平均数,可以从横向和纵向两个方面对事物进行分析比较,从而得出结论.例如,要想比较同一年级的两个班同学学习成.

    加权平均值指的是将各数值乘以相应的单位数,然后加总求和得到总体值,再除以总的单位数。平均数的大小不仅取决于总体中各单位的标志值(变量值)的大小,而且取.

    加权平均数是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算, 若 n个数中, x1出现f1次,x2出现f2次,…,xk出现fk次,那么(x1f1 + x2f2+ ..

    加权平均数是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算。 若在一组数中,X1出现F1次,X2出现F2次,…,Xk出现Fk次,那么(X1F1 + .

    加权平均数的概念 加权平均数是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算, 若 n个数中,χ1出现f1次,χ2出现f2次,…,χk出现fk次,.

    加权平均数的概念 加权平均数是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算, 若 n个数中,χ1出现f1次,χ2出现f2次,…,χk出现fk次,.

    加权平均数的概念 加权平均数是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算, 若 n个数中,x1出现f1次,x2出现f2次,…,xk出现fk次,.

    举个形象的例子,你就明白了: 一年级1班平均成绩是90分 一年级2班平均成绩是85分 一年级3半平均成绩是95分 那么,一年级加权平均分是:(90+85+95)/3 = 90分 一.

    加权平均数是不同比重数据的平均数,用 表示。计算公式如下: (4.3) 在这里, 表示各观察值的权重; 表示具有不同比重的观察值。 加权平均数的计算方法 例1,某学.

    加权平均数是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算 x拔=(x1f1 + x2f2+ . xkfk)/n,其中f1 + f2 + . + fk=n,f1,f2,…,fk叫做权。通过数.

    标题:什么是加权平均数(加权平均数公式例子)

    展开全文
  • 调和平均数的几何意义

    千次阅读 2019-03-07 10:10:25
    调和平均数的代数形式(通俗): 应用场景:样本自变量(身高)和因变量(胖瘦)的乘积相等的情况下,改变每个样本的因变量(胖瘦),而不改变因变量的总和(井宽),所得自变量为调和平均数。 上图也可以...

     

    调和平均数的代数形式(通俗):

     

             应用场景:样本自变量(身高)和因变量(胖瘦)的乘积相等的情况下,改变每个样本的因变量(胖瘦),而不改变因变量的总和(井宽),所得自变量为调和平均数。

     

            上图也可以看成中速,慢速,快速,跑3个100米,x轴是时间,y轴是速度,xy的积是路程,每份面积相等符合上方应用场景。

    还有网上其它资料显示:调和平均数应用的范围较小。在实际中,往往由于缺乏总体单位数的资料而不能直接计算算术平均数,这时需用调和平均

    法来求得平均数。假如这个人是跑马拉松,我们只能观测他的300米,没有更多样本的情况下,调和平均数的方法就是尚佳的。

            注意,由于分子分母都可以乘以相同的数,所以因变量和自变量的乘积不一定是1可以是M,比如跑步的路程就是每份100。但是每个样本的面积M约掉公约数M后也还是面积为1的正方形(我采集3段100米和3段1米是一样的),分子分母都约调公约数M后就成了公式中令人费解的样子。

            这样的话顺带就理解了带权重的调和平均数:假设第一个橡皮泥是班长,改他的面积为2,其它人还是1。这样班长的就是宽度就是2/x1,上方分子(总面积)也要把1+1+1改成2+1+1。就是把带权重的样本面积等比例放大缩小。

     转自: http://www.cnblogs.com/xiaobajiu/p/7867162.html

    展开全文
  • 概述本节内容概念比较绕,可先看例题,便于理解!加权平均值即将各数值乘以相应的权数,然后加总求和得到总体...因为加权平均值是根据权数的不同进行的平均数的计算,所以又叫加权平均数。在日常生活中,人们常常把...

    概述

    本节内容概念比较绕,可先看例题,

    便于理解!

    加权平均值即将各数值乘以相应的权数,然后加总求和得到总体值,再除以总的单位数。加权平均值的大小不仅取决于总体中各单位的数值(变量值)的大小,而且取决于各数值出现的次数(频数),由于各数值出现的次数对其在平均数中的影响起着权衡轻重的作用,因此叫做权数。

    因为加权平均值是根据权数的不同进行的平均数的计算,所以又叫加权平均数。在日常生活中,人们常常把“权数”理解为事物所占的“权重”。

    概念

    b818e1f1daa35e9c98273a8760ad04d2.png

    加权平均值即将各数值乘以相应的权数,然后加总求和得到总体值,再除以总的单位数。

    加权平均值的大小不仅取决于总体中各单位的数值(变量值)的大小,而且取决于各数值出现的次数(频数),由于各数值出现的次数对其在平均数中的影响起着权衡轻重的作用,因此叫做权数。

    因为加权平均值是根据权数的不同进行的平均数的计算,所以又叫加权平均数。

    数学概念

    (1)如概述图所示,若n个数

             778a74c8-4942-eb11-8da9-e4434bdf6706.svg 的权分别是:7a8a74c8-4942-eb11-8da9-e4434bdf6706.svg

             那么:

             7b8a74c8-4942-eb11-8da9-e4434bdf6706.svg

             叫做这n个数的加权平均值。

    (2)在求n个数的平均数时,若 n个数中,x1出现f1次,x2出现f2次,…,xk出现fk次,(这里f1+f2+...+fk=n),

    即:

    7d8a74c8-4942-eb11-8da9-e4434bdf6706.svg 表示权数。

    理解方法:将原式看作

    7f8a74c8-4942-eb11-8da9-e4434bdf6706.svg

    那么这n个数的平均数

    b85713ea6f9e4928731db6a63020c66d.png

    也叫做x1,x2... xk这k个数的加权平均数。

    例 1

    b818e1f1daa35e9c98273a8760ad04d2.png

    权重已知

    假设以下是小明某科的考试成绩:

    平时测验期中考试期末考试
    809095

    学校规定的学科综合成绩的计算方式是:

    平时测验占比期中考试占比期末考试占比
    20%30%50%

    (注:在这里,每个成绩所占的比重叫做权重)

    那么,加权平均值(综合成绩)

    868a74c8-4942-eb11-8da9-e4434bdf6706.svg

    权重未知

    现有以下两只股票:

    股票名股数价格
    股票A100010
    股票B200015

    (注:在这里,股票占总股数的比重叫做权重)

    那么,加权平均值(所有拥有股票的平均价格)

    898a74c8-4942-eb11-8da9-e4434bdf6706.svg

    意义

    b818e1f1daa35e9c98273a8760ad04d2.png

    权重是一个相对的概念,是针对某一指标而言。某一指标的权重是指该指标在整体评价中的相对重要程度。权重表示在评价过程中,是被评价对象的不同侧面的重要程度的定量分配,对各评价因子在总体评价中的作用进行区别对待。事实上,没有重点的评价就不算是客观的评价。

    例 2

    下面通过两个示例加以说明

    (1)计算考试成绩时的加权平均数

    使用“示例—权重已知”中的数据,我们对比两位学生的考试成绩

    考试项目及其占比平时测验期中考试期末考试
    20%30%50%
    小明809095
    小刚959080

    通过计算,我们可以获知:

    通过算术平均值获得的综合成绩通过加权平均值获得的综合成绩
    小明88.3390.5
    小刚88.3386

    也就是说,由于小明在权重较大(重要程度较大)的考试中考得了高分,尽管他与小刚通过算术平均值获得的综合成绩相同,但是他的综合成绩会比小刚高。

    (2)工作事务决定中的加权平均数

    假设有一件事情,你给它打60分,你的老板给它打100分,但因为老板说的话分量比你重,所以通过不同权重的配比,将得到事务决定不同的结果。

    你的打分老板的打分权重配比加权平均值
    老板
    601001180(算术平均值)
    1286.67
    1390
    1492
    1593.33

    很明显,随着老板打分权重的增加,最终得分将向你的老板那里倾斜,也就是说,老板打分权重越大,他对事务所拥有的决定权越大。

    4d47cd9c86016a181286da35bd4984ff.gif

    19f1a4b21db53f3a1874b1e3d97396b3.png

    总  结

    1.算术平均数与加权平均数的联系

          如果各个数的全相同,则加权平均数就是算术平均数,因此算术平均数实质上是加权平均数的一种特例。

    2.算术平均数与加权平均数的区别

          算术平均数是指一组数据的和除以数据的个数,加权平均数是指实际问题中,每个数据的“重要程度”未必相同,即每个数据的权未必相同,因此在计算上与算术平均数有所不同。

    3.求一组数据的加权平均数有两种情况:

       ①该组数据中的各数据重要程度不同,所占比例          不一样。

       ②该组数据中有多个数据反复出现。

    展开全文
  • 不同平均数的比较;图片来源:维基百科 大概是最常见的数据分析任务 你有一组数字。你希望用更少的数字概括它们,最好是只用一个数字...我们通常说的平均数是“算术平均数”,具体计算过程如前述。我们称其为...

    不同平均数的比较;图片来源:维基百科

    大概是最常见的数据分析任务

    你有一组数字。你希望用更少的数字概括它们,最好是只用一个数字。因此,你将这组数字加起来,然后除以数字的数目。哇,你得到了“平均数”,没错吧?

    也许。

    和流行的观点不同,从数学上说,平均数通常不是一样东西。意思是:没有可以恰当地称作“平均数”的数学运算。我们通常所说的平均数是“算术平均数”,具体计算过程如前所述。我们称其为“平均数”,是因为我们期望它符合“平均数”的口头定义:一个典型的、正态的中间值。我们常常是对的,但正确的频率比我们想象的要低。

    概述统计量

    算术平均数仅仅是得到“平均”值的许多方法的其中之一。技术一点地说,这些属于概述统计量、集中趋势测度、位置测度。

    中位数大概是第二出名的概述统计量。由于中位数是数据集中间的值,因此常常比均值更平均。我这里不讨论中位数,不过在许多情形下,算术平均数被滥用在中位数更合适的地方。更多关于中位数的内容,可以参考下面三篇文章:

    https://www.linkedin.com/pulse/20140715160509-29681087-median-vs-average-household-income/

    http://wkuappliedeconomics.org/indblogs/mean-vs-median-income-which-one-to-use-and-what-it-means-for-south-central-kentucky/

    https://medium.com/%40JLMC/understanding-three-simple-statistics-for-data-visualizations-2619dbb3677a

    本文将重点讨论知名度相对较低的几何平均数和调和平均数。

    毕达哥拉斯平均数

    平方平均数和毕达哥拉斯平均数;图片来源:维基百科

    算术平均数是3种毕达哥拉斯平均数之一(名称源自研究这些性质的毕达哥拉斯及其学派)。另外两种毕达哥拉斯平均数是几何平均数和调和平均数。

    为了了解它们的基本功能,让我们从熟悉的算术平均数开始。

    算术平均数

    算术平均数的名字取得很合适:我们累加数据集中的所有数字,接着除以数据集包含的数字数目。

    不过,加法没有什么特别的。它只不过是一种简单的数学运算。在数字之间存在可加性(additive)关系的数据集上,算术平均数效果很好。这样的关系经常被称为线性,因为如果我们将所有数字按升序或降序排列,数字倾向于落在一根直线上。一个简单而理想化的例子是公差为3的等差数列:

    然而,不是所有的数据集都适宜用这种关系描述的。有些数据集内部存在乘法或指数关系,例如,公比为3的等比数列:

    我们看到,算术平均数(156)并不特别接近我们的数据集中的大多数数字。实际上,它是中位数(27)的5倍。

    将数据绘制在一根数轴上,能够更明显地看到这一扭曲。

    所以,我们做什么?

    引入……

    几何平均数

    由于数据集中数字之间的关系是相乘,我们通过乘法和取方根(总共有几个数字就开几次方根)来得到几何平均数。

    我们可以看到,在等比数列上,几何平均数更能代表数据集的中间值。事实上,在这个等比数列数据集上,它等于中位数。

    从单根数轴上也可以看到这一点:

    几何平均数的真实世界应用

    实际上,有很多实际场景适合使用几何平均数,因为类似相乘的关系在真实世界中很常见。

    一个经典的例子是复利问题。

    假设我们有一笔5年期存款,本金为$100,000,每年的利率是变动的:

    年利率:1%、9%、6%、2%、15%

    我们想要找到平均年利率,并据此计算5年后本金和利息的总和。我们尝试“平均”这些利率:

    (.01 + .09 + .06 + .02 + .15) ÷ 5 = .066 = 6.6%

    然后我们将平均利率代入复利计算公式:

    100000 * (1.066 ** 5 - 1) + 100000 = 137653.11

    比较以下不使用平均利率,直接计算的结果:

    100000 * 1.01 * 1.09 * 1.06 * 1.02 * 1.15 = 136883.70

    可以看到,我们的简便计算方法误差接近$1,000。

    我们犯了一个常见的错误:我们将加法操作应用于相乘过程,得到了不精确的结果。

    现在,让我们试试几何平均数:

    1.01 * 1.09 * 1.06 * 1.02 * 1.15 = 1.368837042

    1.368837042开5次方根 = 1.064805657

    将几何平均数代入复利计算公式:

    100000 * (1.0648 ** 5 - 1) + 100000 = 136883.70

    这个数字正好等于我们逐年计算所得的结果。

    我们使用了合适的平均数,并得到了正确的结果。

    几何平均数还适合什么场景呢?

    几何平均数的一个很酷的特性是,你可以对尺度完全不同的数字取平均数。

    例如,假设我们想比较两间咖啡店来源不同的在线评价。问题在于,来源一的评价使用五星制,而来源二的评分评价使用百分制:

    咖啡店A

    来源一:4.5

    来源二:68

    咖啡店B

    来源一:3

    来源二:75

    如果我们直接根据原始分值计算算术平均数:

    咖啡店 A = (4.5 + 68) / 2  =  36.25

    咖啡店 B = (3 + 75) / 2 = 39

    根据上面的数据,我们得出结论咖啡店B是赢家。

    如果我们对数字有一点敏感性,我们会知道在应用算术平均数得到精确的结果之前,我们首先需要标准化(normalize)数据集中的值至同一尺度。

    所以,我们将来源一中的评价乘以20,将其从五星尺度拉伸到来源二的百分制尺度:

    # 咖啡店A

    4.6 * 20 = 90

    (90 + 68) / 2 = 79

    # 咖啡店B

    3 * 20 = 60

    (60 + 75) / 2 = 67.5

    我们发现,其实咖啡店A才是赢家。

    然而,几何平均数,允许我们在不考虑尺度问题的前提下得到一样的结论:

    咖啡店A = (4.5 * 68) 的平方根 =  17.5

    咖啡店B = (3 * 75) 的平方根 = 15

    算术平均数被尺度较大的数字支配了,以至于得出了错误的结果。这是因为算术平均数期望数字间的加法关系,而没有考虑尺度和比例问题。所以需要在应用算术平均数之前将数字转换为同一尺度。

    另一方面,几何平均数,很容易就能处理比例问题,因为它本质上是乘法关系。这是一个极为有用的性质,但注意我们损失了什么:我们不再具有可解释的尺度了。在这样的情况下,几何平均数其实是无单位的(unitless)。

    例如,以上的几何平均数既不意味着百分制中的17.5分,也不意味着五星制中的15星。它们不过是无单位的数字,互相之间比例一致(技术上说,它们的尺度是原尺度5 & 100的几何平均数,也就是22.361)。不过,如果我们只需比较两间咖啡店评价的高低,那么这不会成为一个问题。

    几何平均数回顾

    几何平均数对值相乘,而不是相加,接着取n次方根,而不是除以n。

    它基本上是在说:如果我们的数据集中的数字都是一样的,那么这个数字应该是什么,才能得到和实际数据集一样的乘积?

    这使它非常适合描述相乘关系,例如比率,即使这些比率的尺度不同。(因此,它经常用来计算财经指数和其他指数。)

    缺点: 应用几何平均数时,可能会丢失有意义的尺度和单位。另外,它对离散值的不敏感性可能会遮蔽可能具有较大影响的大数值。

    和生活中的大多数事情一样,极少有牢不可破的规则说必须使用几何平均数(复利等少数情形除外)。有一些启发式的规则和经验规则,但无疑需要判断力和科学的怀疑,才能应用合理的经验。

    在最后的总结中我们将继续讨论这些,不过现在让我们引入最后一种毕达哥拉斯平均数……

    调和平均数

    算术平均数需要加法,几何平均数则利用乘法,调和平均数使用倒数。

    我们可以用语言描述调和平均数:数据集的倒数的算术平均数的倒数。

    听起来当中包含很多倒数,但实际上不过是一些简单的步骤:

    对数据集中的所有数字取倒数

    找到这些倒数的算术平均数

    对上一步所得取倒数

    源自维基百科的一个简单例子:1、4、4的调和平均数是2:

    注意,由于0没有倒数,因此调和平均数和几何平均数一样,无法处理包含0的数据集。

    好,我们已经明白数学部分如何工作了。不过调和平均数适用于哪些场景呢?

    调和平均数的现实世界应用

    为了回答上面的问题,我们需要回答:倒数适用于哪些场景?

    由于倒数和除法类似,不过是伪装的乘法(乘法不过是伪装的加法),我们意识到:倒数帮助我们更方便地除以分数。

    例如,5 ÷ 3/7等于多少?如果你还记得初等数学,你大概会将5乘以7/3(3/7的倒数)。

    不过有一个等价的方法,将5和3/7缩放至共同的分母:

    5/1 ÷ 3/7 = 35/7 ÷ 3/7 = 35 ÷ 3 = 112/3 = 11.66667

    类似之前使用几何平均数作为快捷路径,在未标准化的情况下找到不同尺度评分的相加算术平均数的关系,调和平均数帮助我们在不操心共同分母的情况下找到乘/除关系。

    因此,调和平均数很自然地成为几何平均数之上的另一层乘/除。因此,它有助于处理包含长度或周期不同的比率的数据集。

    (你可能在想:“等一下,我原以为几何平均数用在平均利率和不同尺度的比率上!”你想的没错。你也不是第一个为此感到困惑的人。我自己写下下面的内容正是为了厘清我自己的思考和理解。我希望下面的例子让这个主题更清楚了,在文章后面的总结部分也会回顾所有的区别。)

    平均速度

    现实世界中,使用调和平均数的经典例子是以不同的速度通过物理空间。

    考虑一次去便利店并返回的行程:

    去程速度为30 mph

    返程时交通有一些拥堵,所以速度为10 mph

    去程和返程走的是同一路线,也就是说距离一样(5 miles)

    整个行程的平均速度是多少?

    同样,我们可以不假思索地直接应用30 mph和10 mph的算术平均数,然后自豪地宣布结果是20 mph。

    但是再想一想:由于你在一个方向上的速度较高,因此你更快地完成了去程的5 miles,在那个速度上花了整个行程中更少的时间,所以整个行程期间你的平均速度不会是30 mph和10 mph的中点,它应该更接近10 mph,因为你更多的时间是以10 mph的速度行驶。

    为了正确地应用算术平均数,我们需要判定以每种速率行驶所花的时间,然后以适当的权重加权算术平均数的计算:

    去程:5 / (30/60) = 10 minutes

    返程:5 / (10/60) = 30 minutes

    总行程:10 + 30 = 40 minutes

    加权算术平均数:(30 * 10/40) + (10 * 30/40) = 15 mph

    所以,我们看到,真正的平均速度是15 mph,比使用未加权的算术平均数计算所得低了5 mph(或者25%)。

    你大概猜到了我们下面要做什么……

    让我们试着使用调和平均数:

    2 / (1/30 + 1/10) = 15

    真正的行程平均速度,自动根据在每个方向上使用的时间进行调整,是15 mph!

    有一些地方需要注意:

    可以直接应用调和平均数的前提是不同速度行驶的总距离是相等的。如果距离不同,我们需要使用加权调和平均数,或加权算术平均数。

    当距离不等时,算术平均数仍然以不同速度行驶的时间作为加权,而调和平均数则以不同速度行驶的距离作为加权(因为通过取倒数,已经隐式地考虑了不同速度的时间比例)。

    毕达哥拉斯平均数大部分的复杂性和麻烦源于比率的本质以及我们对比率的哪方面更感兴趣。例如,算术平均数总是用分母的单位表示。在行程问题中,比率是每小时的英里数,因此,算术平均数给出的结果是以分母(某种意义上隐藏的)单位表示,小时:(30m / 1hr + 10m / 1hr) ÷ 2 = 20m/1hr = 20 mph。如果我们在每个方向上所花的时间是一样的,那么这个结果会是精确的。然而,我们知道,在每个方向上所花的时间并不一样。相反,调和平均数通过取倒数翻转这些比率,将我们实际感兴趣的数字放入分母,接着取算术平均数,并再次翻转,给出我们要求的平均速度。(可以使用财经的P/E率更深入地探讨这一问题,请参阅论文Using the Price-to-Earnings Harmonic Mean to Improve Firm Valuation Estimates。)

    几何平均数适用于复利问题的原因是,利率的周期是相等的:每种利率一年。如果周期是可变的,也就是说每种利率的持续时间不同,那么我们同样需要使用某种权重。

    几何平均数可以处理相乘关系,例如复利问题和不同评分尺度上的比率,而调和平均数则通过神奇的倒数容纳了另一层次的乘/除关系,例如可变周期或长度。

    类似复利问题和几何平均数,这是一个准确、客观正确的调和平均数的应用案例。不过,事情并不总是如此清晰。有其他准确的、可以在数学上论证的调和平均数的应用,包括物理、财经、水文学,甚至(源自传统)棒球统计。和数据科学关系更密切的:调和平均数经常用在评估机器学习模型的准确率和召回中。但是,在更多的情况下,调和平均数的应用需要判断力,需要你对数据和手头问题的灵活理解。

    总结

    1. 3种毕达哥拉斯平均数密切相关

    例如,我们已经看到:

    不同尺度评分的几何平均数有时保留了这些值标准化至同一尺度后的算术平均数的次序。

    调和平均数等价于行程速度的加权算术平均数(权重为相对行程时间)

    在下篇中,我们将看到,数据集的几何平均数等价于数据集中每个数字的对数的算术平均数。所以,正如调和平均数不过是算术平均数加上一些倒数变换,几何平均数不过是算术平均数加上对数变换。

    2. 毕达哥拉斯平均数遵循严格的次序

    根据相应的公式,调和平均数总是小于几何平均数,几何平均数总是小于算术平均数。

    这三种平均数是彼此接近还是互相远离,取决于数据的分布。以上规则唯一的例外是,在数据集中所有数字相等的极端情形下,3种平均数同样相等。也就是说,以下不等关系成立:

    调和平均数 ≤ 几何平均数 ≤ 算术平均数

    从本节开头的毕达哥拉斯平均数的几何描述中也能看到这一点。

    认识到这一次序关系有助于理解何时应用哪种平均数,以及不同平均数对结果的影响。

    让我们回顾之前的相加和相乘数据集,这次我们将画出所有三种平均数:

    很明显,几何平均数和调和平均数看起来要比这一线性、相加数据集的中间低不少。这是因为这两种平均数对较小的数字而不是较大的数字更敏感(让它们相对而言对较大的离散值不敏感)。

    这里,几何平均数准确地位于数据集的中点,而调和平均数则向低端扭曲,算术平均数则受较大的离散值的影响,向高端扭曲。

    描绘一个集中趋势用调和平均数表达最佳的数据集并不容易,因此我将直接转入下一部分……

    3. 强硬的规则,一些启发式的方法,和许多判断的空间

    不同尺度的比率:使用几何平均数(或在标准化的数据上应用算术平均数)。

    周期一致的复合比率:使用几何平均数。

    不同周期或长度上的比率:使用调和平均数(或加权平均数)。

    了解比率的哪一边你更感兴趣,以决定应用哪种平均数。算术平均数是以分母的单位表达的(显式或隐式)。调和平均数让你可以倒置比率,让结果以原本分子的单位表达。

    如果数据体现出相加结构:算术平均数通常是安全的选择。

    如果数据体现出相乘结构和/或包含较大的离散值:几何平均数或调和平均数可能更合适(中位数可能也比较合适)。

    任何决定都有缺陷和折衷:

    使用几何平均数可能损失有意义的尺度或单位。

    包含0的数据集无法应用几何平均数或调和平均数,包含负数的数据集意味着无法应用几何平均数。

    使用几何平均数或调和平均数时,受众可能不熟悉这两个概念。

    经常,更实用、更易解释的方法是:

    存在较大的离散值时直接使用中位数

    移除离散值

    使用加权算术平均数或统计学变换,而不是难懂的毕达哥拉斯平均数

    统计计算语言R内置矩阵求逆和三次样条插值的方法,却没有内置计算简单的几何平均数或调和平均数的函数,这可能多少暗示了这两种平均数狭窄的使用场景。(不过Google sheets和Excel倒是包含这两种平均数。)

    如果要用一句话概括整篇文章,那么:

    理解数据的本质,仔细思考你用来描述数据的概述统计量,才能避免用错平均数的风险。

    请留言分享你使用这两种不那么常见的毕达哥拉斯平均数的案例和经历(以及你发现的本文的错误)。

     

     

     

     

    展开全文
  • 加权平均数定义和实例

    千次阅读 2020-12-21 23:36:10
    内容提要:什么是加权平均数?本文介绍了相关的定义,并给出了excel中计算加权平均数的公式:用SUMPRODUCT和SUM函数计算加权平均数。第一,什么是加权平均数通过3个简单举例来认识什么是加强平均数。1.吃三碗的有4人...
  • 平均数 中位数 众数的实际意义

    千次阅读 2019-04-08 10:45:04
    平均数:反映了一组数据的平均大小,常用来一代表数据的总体 “平均水平”。 中位数:像一条分界线,将数据分成前半部分和后半部分,因此用来代表一组数据的“一般水平”。 众数:反映了出现次数最多的数据,用来...
  • catalog平均数算术平均数几何平均数调和平均数算术-几何平均数标准差 平均数 比如我们有n个数据: {1, 2, 3, 4, ...} 我们想要得到 “一个常数C”,用这1个常数C 就可以代表这个n个数据! 我们以往只知道 用: C =...
  • 不同平均数的比较;图片来源:维基百科 大概是最常见的数据分析任务 你有一组数字。你希望用更少的数字概括它们,最好是只用一个数字。因此,你将这组数字加起来,然后除以数字的数目。哇,你得到了“平均数”,没...
  • 指数加权平均数

    2020-08-07 15:02:57
    1.什么是指数加权平均? 指数加权平均也叫指数加权移动平均,是一种常见的序列数据处理方式。计算公式如下: 其中, θ_t:为第 t 天的实际观察值, V_t: 是要代替 θ_t 的估计值,也就是第 t 天的指数加权...
  • 调和平均数

    千次阅读 2020-03-01 23:55:04
    调和平均数(Harmonic mean),是求一组数值的平均数的方法中的一种,一般是在计算平均速率时使用。 计算方法为: nHn=1a1+1a2+⋯+1an\frac{n}{H_n} = \frac{1}{a_1} + \frac{1}{a_2} + \cdots + \frac{1}{a_n}Hn​n...
  • 算术平均数、几何平均数

    千次阅读 2017-03-16 23:00:43
    之所以称之为几何平均数,主要是从数学参数的物理意思上划分的,我们知道算术平均数,(a+b)/2,体现纯粹数字上的关系,而根号ab,称为几何平均数,这个体现了一个几何关系,即过一个圆的直径上任意一点做垂线,直径被分开的两...
  • dao加权平均值的大小不仅取决于总体中各单位的数值(变量值)的大小,而且取决于各数值出现的次数(频数),由于各数值出现的次数对其在平均数中的影响起着权衡轻重的作用,因此叫做权数。例子:假设以下是小明某科的...
  • 个人理解,说简单点: 一组数据中如果有特别大的数或特别小的数时,一般用中位数 一组数据比较多(20个以上),范围比较集中,一般用众数 ... 1、平均数是通过计算得到的,因此它会因每一个数据的变化而变...
  • 1}=(\frac{1}{P}+\frac{1}{R})\times\frac{1}{2} F1​1​=(P1​+R1​)×21​ 在统计学中,调和平均数( FFF)、几何平均数( GGG)、算数平均数( X‾\overline XX) 它们之间的关系用公式表示为 F≤G≤X‾F\le G\le \...
  • 通常我们说的平均数是算术平均数,就是对数据求和后再除以数据的个数。在统计学中,均值,中间值和众数都用作对数据集中趋势(central tendency)的测量。所以它们三个也可以被称为平均数。 In colloquial ...
  • python求平均数、方差、中位数的例子CalStatistics.pydef getNum(): #获取用户不定长度的输入nums = []iNumStr = input("请输入数字(回车退出):")while iNumStr != "":nums.append(eval(iNumStr))iNumStr = input(...
  • 【基础能力训练】一、利用计算器求平均数的应用1.已知一组数据-2,-3,-5,0,2,3,6,5,1,那么这组数据的平均数是______(精确到百分位).2.一周内某班卫生得分如下:9.5,9.8,9.7,9.0,9.6,则该班卫生平均得分...
  • 标准差(Standard Deviation) ,中文环境中又常称均方差,是离均差平方的算术平均数的平方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。 ...
  • C语言:输入数值求平均数(T&F)

    千次阅读 2020-02-18 16:38:42
    C语言求平均数 算法思想 平均数 aver=(∑num)/n; 1、设置3个变量,用来存放数据,将每次数据的累加和存储到一个变量中,给计数变量+1,最后输出。 2、可以考虑用数组实现,首先要求读入数组的大小,即要输入多少个...
  • 平均数 平均数的概念很简单,不再详述,直接给出其公式: 对于n个数字x1、x2…xn,其平均数公式为: 加权平均数 什么是权,就是重要性,在数学中就是一个表示占比重的数值。 ...
  • 1 ,数据例子 : 14 个数字 : 1,2,3,3,4,4,4,5,6,10 2 ,极差 : 最大值 - 最小值 ...定义 : 方差表示的是,数据的离散程度 ( 距离平均数的波动程度 ) 如图 : 5 ,标准差 : 数据的离散程度 ...
  • 加权平均数以及方差

    万次阅读 2016-01-23 15:35:06
    平均数的大小不仅取决于总体中各单位的标志值(变量值)的大小,而且取决于各标志值出现的次数(频数),由于各标志值出现的次数对其在平均数中的影响起着权衡轻重的作用,因此叫做权数。 加权平均值 即将各数值...
  • 偏度大于0表示正偏差值大,称为正偏或右偏,这时 一般来说,中位数 偏度值小于0表示负偏差值大,称为负偏或左偏,这时 一般来说,平均数 下面会结合图形解释一下原因 2. 峰度 峰度(Kurtosis) :描述变量 取值分布...
  • ",min(li)) print("总和:",sum(li)) """ 功能二:平均数 平均数,统计学术语,是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数。 它是反映数据集中趋势的一项指标。解答平均数...
  • 在讨论1的基础上,结合案例分析整理众数、中位数、平均数的特点及其应用。 一、三个衡量指标的特点 ①众数特点:众数体现了样本数据的最大集中点, 但它对其它数据信息的忽视使得无法客观地反映总体特征。众数容易...
  • 平均数的称霸之路

    2017-05-02 00:12:00
    中位数还是平均数之间的抉择有着重要的意义。选择了平均数,心理学家容易做出错误的诊断,金融家可能误估市场的发展。平均数已经统治了人类世界数百个春秋,或许是时候让我们做出一些改变了。 原文发布时间为:...
  • 平均值、中位、众数分别是什么? mean、median、mode、Range 平均值:它是统计学中的一个重要概念。算术平均值也可称为平均值,它是通过将两个或多个数字/变量相加,然后将总和除以数字/变量的总数而...
  • 本文内容 平均数 中位数 众数 参考资料 演示 最近大 BOSS“迷上”了一个网络游戏(什么游戏就不多说啦~),让我写个程序帮他算一下(现在他让另一个同事写了,我要改 bug 没时间,所以,我主要是没事时“凑热闹”提...
  • 通过科学试验的观察、测定和记载,可得到大量的数据资料,这些资料必须按照一定的程序进行整理和分析,才能透过数据表现看到...总体包含的个体数目可能是无穷多个,这种总体称为无限总体(infinite population)...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 179,605
精华内容 71,842
关键字:

平均数表示的意义