精华内容
下载资源
问答
  • 《众数与中位数典型例题》由会员分享,可在线阅读,更多相关《众数与中位数典型例题(3页珍藏版)》请在人人文库网上搜索。1、典型例题例1 求下列数据的众数(1)3,2,5,3,1,2,3(2)5,2,1,5,3,5,2,2分析:一...

    《众数与中位数典型例题》由会员分享,可在线阅读,更多相关《众数与中位数典型例题(3页珍藏版)》请在人人文库网上搜索。

    1、典型例题例1 求下列数据的众数(1)3,2,5,3,1,2,3(2)5,2,1,5,3,5,2,2分析:一组数据的众数不一定唯一,因此,如果一组数据中有几个数据重复的次数相同,并且次数是最高的,那么这几个数据都是这组数据的众数解:(1)众数是3(2)众数是5和2说明:众数是一组数据中,出现次数最多的数据,(1)中3出现了三次最多,所以众数是3,(2)中5,2这两个数据都出现了三次,最高次数,所以数据5,2都是众数,即一组数据的众数不一定唯一例2 已知一组数据为20,30,40,50,50,50,60,70,80,其中平均数、中位数和众数的大小关系是 A平均数中位数众数B平均数中位数众数C中位数。

    2、众数平均数D众数=中位教=平均数分析:众数、中位数和平均数从不同的角度描述一组数据的集中趋势对于不同的数据三者之间的大小关系也不同,这里可具体计算出来后再比较解:解答本题,需求出平均数、众数和中位数众数:50中位数:50故选D例3 求下面这组数据的平均数、中位数、众数249 252 250 246 251 249 252 249253 254 249 256 249 252 255 253分析:通过观察发现,上面16个数据都在250左右波动,可将上面各数据同时减去250,转化为计算一组数值较小的新数据的平均数解:取a=250,得到一组新数据:-1,2,0,-4,1,-1,2,-1,3,4,-1。

    3、,6,-1,2,5,3把这组数据从小到大排列:246,249,249,249,249,249,250,251,252,252,252,253,253,254,255,256最中间的两个数据是251,252在16个数据中,249出现了5次,出现的次数最多,所以这组数据的众数是249例4 某文具厂生产一批铅球,其重量(单位:kg)如下:重量(kg)3个数4121086求这组数据的中位数、众数和平均数解析:由上表可知,这40个数中,位于最中间的两个数为3和3所以中位数是3,众数是 平均数 说明:这组数据的中位数是3,说明生产的铅球中不低于3kg和不超过的个数各占一半;它们的众数是 ,说明生产的铅球 。

    4、kg的个数最多;它们的平均数为 kg,说明生产出的铅球的平均重量为 kg这说明中位数、众数和平均数从不同的角度描述了一组数据的集中趋势例5 下表是某班20名学生的第一次数学测验的成绩分配表:成绩(分)5060708090人数(人)142(1)若成绩的平均数为73分,求 和 的值(2)设此班20名学生成绩的众数为a,中位数为b,求ab的值分析:本题考查平均数,众数和中位数这三个最基本的特征数解(1)由题意,得:整理,得 解之,得: 答: 、y的值分别为5和8(2)由题意,得: 最中间的两个数为70和80, 中位数是 说明:平均数的概念要灵活掌握,不仅要求会解,更要会用另外中位数不一定是数据中的数。

    展开全文
  • 大数据查找中位数

    千次阅读 2020-12-28 21:24:25
    前两天同学面试遇到的一道题,大数据怎么找出中位数。大数据 --> 所有数据不能一下子读入内存中位数 --> 需要遍历所有数据1. 题目在一个大文件中有100亿个32位整数,乱序排列,要求找出中位数;内存限制为512M...

    前两天同学面试遇到的一道题,大数据怎么找出中位数。大数据 --> 所有数据不能一下子读入内存

    中位数 --> 需要遍历所有数据

    1. 题目

    在一个大文件中有100亿个32位整数,乱序排列,要求找出中位数;内存限制为512M;请写出算法设计思路;

    2. 基本知识b --> bit 比特,位(二进制中的位)

    B --> Byte 字节,1个字节=8位,1B=8bit

    K --> KB 千字节,1KB = 1024B

    M --> MB 兆字节,1M = 1024KB = 1024*1024B

    G --> GB 1GB = 1024MB

    问题分析:

    100亿个32位整数,那么占用内存为:100亿*32 b = 100亿*32/8 B = 100亿*32/8/1024 KB = 100亿*32/8/1024/1024 MB = 38146.9727 MB > 512M

    所以肯定不能一次全部载入内存。

    那么512M可以装多少个32位整数呢?512M=512*1024K=512*1024*1024B=512*1024*1024*8b=4294967296b

    可存储32位整数:4294967296b/32b=134217728个,是1亿多个。

    3. 设计思路

    中位数需要遍历数据才能找出来,512M是我们可用的内存限制,每次只能载入1亿多个数据,100亿个数据,我们可以分成100次进行载入遍历。

    那么遍历的时候我们需要记录哪些信息呢,因为要求中位数,我们可以考虑将数据划分区间,计算每个区间我们的数据落进去的数目,就可以大致知道数据分布了。

    所以整体的数据区间是多少呢?一个有符号的32位整数,他的取值范围是:

    ,总共有4294967296个整数值,我们把它划成100000组,那么每组的数据是43000个,最后一组少点。

    所以第一个区间

    的取值范围是

    ,第二个区间

    的取值范围是

    ,以此类推。

    我们分一百次载入数据,每次载入1亿个,遍历这一亿个数据,数据落入哪个区间,则那个区间的统计值+1。100次载入完成之后,我们便得到了每个区间的统计值,我们用

    来代表数据落入

    区间的统计值。那么肯定有

    现在我们需要寻找中位数落入哪个区间,100亿个数据的话,中位数应该等于第50亿大和第50亿+1大的数据的平均。所以我们需要知道这两个数,落在哪个区间了。

    我们从

    开始累加,一直累加到

    使得总和大于50亿+1,(等于的情况比较特殊,这里假设不等于。)那么关系到中位数计算的两个数应当落在区间

    里。

    到这里我们可以得到中位数的区间,我们计算一下上面的过程所需内存情况:载入1亿个数据需要内存32*1亿/8/1024/1024=381.5M,100000个数据组的统计值需要内存8*100000/1024/1024=0.76M 总和小于512,是可行的。

    现在我们知道涉及中位数计算的两位数的区间是

    ,而

    里有43000个数据,在

    之前的区间中的数据总数为

    ,下面我们需要找到第50亿个以及第50亿+1这两个数到底是多少。

    我们需要再次遍历数据,对落在

    区间的数都加以关注,统计

    区间内数字

    出现的频词

    再次分100次载入数据,对落在

    区间的数进行关注,为

    区间内的每一个整数

    都设计一个统计值

    区间有43000个数据,所以有43000个统计量。

    全部载入完成之后,我们再在

    的基础上累加

    ,如果加上

    大于50亿了,那么第50亿大的数据就是

    ,第50亿+1大的数同理。这样我们就可以计算中位数了。

    再次对上面的过程进行内存分析,每次载入1亿个数据需要内存381.5M,43000个统计量需要内存肯定小于上面100000个统计量的情况,所以内存也是足够的。哦还有个

    需要内存,但是8位,不值一提。

    设计思路以上。

    4. 总结数据量过大,分次载入

    一共需要两次完全遍历数据。

    5. 类似题目

    大量数据寻找topK,

    解决思路:数据多次载入,进行堆排序,每次载入都获得堆的topK,最后将这些topK再进行排序。

    加油,一件事竟然决定去做了,就请做好他。耐住性子,慢慢来。

    展开全文
  • 中位数是指一组数据排序以后,位于中间位置的数据值。如果数据个数是奇数,中位数就是最中间位置那个值;如果是偶数,则是中间位置那两个数的平均值。怎么查询出数据分组以后每个组的中位数呢?用SQL来解决这个问题...

    中位数是指一组数据排序以后,位于中间位置的数据值。如果数据个数是奇数,中位数就是最中间位置那个值;如果是偶数,则是中间位置那两个数的平均值。

    怎么查询出数据分组以后每个组的中位数呢?

    用SQL来解决这个问题是很有难度的!

    SQL的集合是无序的,没有数据位置的概念,需要人为地造出行号,但是要对各分组独立编行号也困难。后来在SQL2003标准中加入了窗口函数,可以对分组编行号了,但是求各组中位数依然繁琐。

    举个例子:现有成绩表SCORES数据如下,要求查出每科成绩的中位数。

    COURSE

    SCORE

    History

    68.5

    History

    79.0

    History

    82.5

    History

    88.0

    History

    93.5

    Maths

    75.5

    Maths

    83.0

    Maths

    85.0

    Maths

    95.5

    查询出来的各科成绩中位数应该是:

    COURSE

    SCORE

    History

    82.5

    Maths

    84.0

    以Oracle为例,用SQL写出来是这样:

    WITH  A  AS

    ( SELECT COURSE, SCORE,

    ROW_NUMBER()OVER ( PARTITION BY COURSE ORDER BY SCORE) AS RN,

    COUNT(*) OVER (PARTITION BY COURSE) AS CNT

    FROM SCORES ),

    B  AS

    (SELECT * FROM A WHERE RN>(CNT-0.5)/2 AND RN

    SELECT COURSE, AVG(SCORE) AS SCORE FROM B

    GROUP BY COURSE

    ORDER BY COURSE;

    这里的A为每组数据加上组内行号并统计每组记录数,B查出位于每组中间位置的记录,最后从B里算出每组平均值,即为中位数。解题步骤比较多,这种SQL不好写。另外还有不用窗口函数的办法,语句就更加复杂了,这里不再列出。

    集算器的SPL语言支持组内运算,也提供了中位数函数,解决这个问题就会简单很多,只需1行代码:

    connect("mydb").query("select * from scores order by course, score").group(COURSE).new(~.COURSE,~.(SCORE).median():SCORE)

    SPL 擅长解决这类分组子集和组内有序计算,请阅

    集算器 SPL 是解决 SQL 难题的专业脚本语言,它语法简单,符合自然思维,是天然分步、层次清晰的面向过程计算语言。它采用与数据库无关的统一语法,编写的算法可在数据库间无缝迁移。它是桌面级计算工具,即装即用,配置简单,调试功能完善,可设置断点、单步执行,每步执行结果都可查看。请参阅

    SPL也能很方便地嵌入到JAVA应用,可参考

    具体使用方法可参考

    展开全文
  • 而MYSQL没有直接提供median()这样的直接算中位数的算法。于是就在百度上百度了下。看到有为朋友提供了一种算法。但是只要代码,没有解释。花了挺久的时间,终于理解了这种算法的含义。源代码如下:create table ...

    前2天,老板有个报表需求,需要用到中位数算法。而MYSQL没有直接提供median()这样的直接算中位数的算法。于是就在百度上百度了下。看到有为朋友提供了一种算法。但是只要代码,没有解释。花了挺久的时间,终于理解了这种算法的含义。

    源代码如下:

    create table state_mid

    as

    select user_id,avg(price)

    from (

    select e.user_id, e.price

    from

    producte e, producte d

    where e.user_id = d.user_id

    group by e.user_id, e.price

    having sum(case when e.price = d.price then 1 else 0 end)>=

    abs(sum(sign(e.price - d.price)))

    )t

    group by user_id。

    首先,向写出这位代码的前辈致敬。

    这段代码的精髓地方,就在于

    having sum(case

    when e.price = d.price then 1 else 0 end)>= abs(sum(sign(e.price -

    d.price)))

    理解这段代码,其实就是理解了中位数的一个体征:

    1、当一列数列的数量N是奇数的时候。则中位数的那个数字在数列中的数量>=中位数减去所有数字的结果的符号值(1,0,-1中的一个)的和的绝对值。

    简单的例子:

    例:数列为1,2,3,4,5

    可以看出它的中位数为3,它的数量是1.所以 having

    sum(case when e.price = d.price then 1

    else 0 end)=1。

    而它减去所以数字的差值为2,1,0,-1,-2.符号值就为1,1,0,-1,-1.符号值的和为1+1+0+(-1)+

    (-1)=0.所以绝对值也为0.所以abs(sum(sign(e.price

    - d.price)))=0

    因此 having

    sum(case when e.price = d.price then 1 else 0 end)>= abs(sum(sign(e.price

    - d.price)))成立。

    接下来我们看下如果是2的话,会不会条件成立。首先2的数量是1,它与所有数字的差值为

    1,0,-1,-2,-3,符号值为1,0,-1,-1,-1。和为-2,绝对值就为2.可以看出,这就和我们要求的

    条件不符合,就会被剔除。

    其他种数列的话大家也可以试试,这里举一个最简单的例子用于方便理解

    2、当一列数列的数量N是偶数的时候。这时候用条件筛选出来的就会是最靠近中位数的那两个数字。则为最靠近中位数的那两个数字在数列中的数量>=那两个数字减去所有数字的结果的符号值(1,0,-1中的一个)的和的绝对值。ps:我们都知道,当数列数量N为偶数的时候,中位数就是用最靠近中位数的那两个数字求平均值得来的。

    所以     select

    user_id,avg(price)

    from

    producte e, producte d

    where e.user_id = d.user_id

    group by e.user_id, e.price

    having sum(case when e.price = d.price then 1 else 0 end)>=

    abs(sum(sign(e.price - d.price)))

    就是帮我们找出了最中间的那一个数字(N为奇数的时候)或者两个数字(N为偶数的时候)。

    最后在求出这一个数字或者两个数字的平均值,就是我们所要求的中位数了。

    展开全文
  • 中位数,四分位数

    2021-04-19 04:05:40
    三、Excel,Matlab求四分位数 先说Excel: MEDIAN(array)中位数 QUARTILE(array,quart) 第二参数为:0--最小值,相当于min 1--25%的值 2--50%的值,相当于Median ​3--75%的值 4--最大值,相当于max​ Percentile ...
  • 该楼层疑似违规已被系统折叠隐藏此楼查看此楼简介 中位数(Median)统计学名词。人教版初二教材内容(在高中必修3中也会出现)。北师大版初二上册内容。 1、定义:一组数据按从小到大(或从大到小)的顺序依次排列,处在...
  • 问题描述我们先来看关于“中位数”的解释:中位数(Median)又称中值,统计学中的专有名词,是按顺序排列的一组数据中居于中间位置的数,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两...
  • 原标题:数学八(下):中位数与众数的典型例题,以及在中考题目中的应用八年级,离九年级很接近了,这个时候我们或许已经开始接触中考的各种预备卷,冲刺卷等等类型的卷子,经过接触,我们会不断地了解到中考会考哪些...
  • (2)中位数算出来可避免极端数据,代表着数据总体的中等情况。 (3)如果总数个数是奇数的话,按从小到大的顺序,取中间的那个数 (4)如果总数个数是偶数个的话,按从小到大的顺序,取中间那两个数的平均数 1、创建一...
  • 无序数组找中位数

    2021-04-04 09:27:11
    1.无序数组找中位数 思路一 把无序数组排好序,取出中间的元素 时间复杂度 采用普通的比较排序法 O(N*logN) 如果采用非比较的计数排序等方法, 时间复杂度 O(N), 空间复杂度也是O(N). 思路二 (1)将前(n+1)/2个...
  • ------+ | sex|median_age| +------+----------+ |female| 8| | male| 5| +------+----------+ spark.sql的percentile_approx函数算出来中位数似乎不是很准确,具体原因,暂不清楚                ...
  • 本文介绍平均值、几何均值、调和均值、中位数、截尾法以及众值估计的求解方法,并用matlab对实例进行求解。 各值的特点 平均值 无系统误差和粗大误差时,直接求平均的结果最接近真值,用它来表示测量结果是最为可靠...
  • 在初中数学课本中,我们学习了平均数,但是平均数与中位数、众数有是关系呐,下面我就为大家总结一下:平均数:是指在一组数据中所有数据之和再除以数据的个数。平均数是表示一组数据集中趋势的量数,它是反映数据...
  • leetcode刷题笔记-295. 数据流的中位数(java实现)
  • R语言mad函数、median函数、mean函数计算中位数绝对偏差、中位数、均值实战 目录 R语言mad函数、median函数、mean函数计算中位数绝对偏差、中位数、均值实战 #基本语法 #mad、median、mean函数基本示例 #数据...
  • 寻找两个有序数组的中位数,看似简单的题目却蕴含着不简单的知识,从中我们能够学习到什么算法思路呢,一起来看看吧
  • 编辑本词条缺少概述、信息栏、名片图,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧!简介编辑四分位数间距:...即:Q3 --Q1四分位数求法编辑第一步确定四分位数的位置四分位数是将数列等分成四个部分的...
  • 四分位数计算以及使用pandas计算

    千次阅读 2020-12-19 12:45:24
    最近学习python数据分析,遇到了四分位数计算问题,因四分位数计算公式不...方法1:n+1法Q1的位置= (n+1) × 0.25Q2的位置= (n+1) × 0.5Q3的位置= (n+1) × 0.75n表示数据的数据个。上面的是大家常用的n+1法。...
  • C语言int的取值范围是怎么算出来的(2010-10-11 17:45:35)标签:杂谈转:http://blog.sina.com.cn/s/blog_59eb86d70100hvp1.html这得从二进制的原码说起:如果以最高为符号,二进制原码最大为0111111111111111=2...
  • 根号一个数字怎么算出来

    千次阅读 2020-12-24 03:12:11
    ==================先一起来研究一下,怎样求,这里1156是四位数,所以它的算术平方根的整数部分是两位数,且易观察出其中的十位数是3.于是问题的关键在于;怎样求出它的个位数a?为此,我们从a...
  • 计算器怎么改小数点位数

    千次阅读 2021-06-19 02:07:50
    掉档计算器几D是准确的,掉什么也是没问题的不过模拟数据不是100%准确的像我同样2只3D掉敏的红鬼,模拟出的108级数据都是一样的但是实际2只宠数据是有点小差别的,血魔跟模拟数字都差了2点影响不大,但只能说是...
  • 输入用空格、制表符、回车符或(英文半角)逗号隔开的数据序列后点击...先确定四分位数的位置:四分位数是将数列等分成四个部分的数,一个数列有三个四分位数,设下四分位数、中位数和上四分位数分别为Q1、Q2、Q3,则...
  • 海明码 校验位数公式的理解

    千次阅读 2021-04-15 12:23:32
    #问题 设海明码的校验位数为,数据位数为,...我们先来复习一下二进制的划分,假设现在有七二进制数据,用序号来指向。为什么选择七呢?因为它们的序号刚好可以用三二进制来表示。 我们再来看看海明码的纠错
  • 最近就连续有2同学提出来,明明数据没有错,按计算器时也没有手抖,为什么用Excel计算的结果,和用计算器按出来的结果不一样?有一个结果,不管对错,可能你就忽略了。但是有2个不一样的结果,就一脸懵啊。曾经有...
  • excelsumif统计位数,结果不准确

    千次阅读 2021-07-26 19:18:35
    结果出现了偏差,原因是:sumif()/countif函数有一个缺陷,只能判断15数字,超过15就直接忽略了后面的数字,这样就会造成统计出错。 解决办法 总结 =SUMIF(B:B,G2,D:D)替换为下面的方法 =SUMPRODUCT((B:B=G2)...
  • 四分位数的两种计算方法

    千次阅读 2020-12-29 20:16:54
    在数据导论课上,我们学习了如何求解四分位数的方法,其实操作起来也不难先用 (n+1) / 4 * i 计算出四分位数的位置,再求出该位置上的的值即可。如一组数据 【1,3,6,8,10】 根据公式先求出第一个四分位数的...
  • 输入一个整数,要求: 1、求出它是几位数 2、顺序输出每一位数字 3、按逆序输出各位数字。 样例输入: 12345 样例输出: 5 1 2 3 4 5 5 4 3 2 1 算法步骤: 1、首先,我们我们将输入的整数进行除以10,若结果...
  • 数位之和计算: 算法遇到很多到题都是要计算一个整数的各位数字,这里提供二种解法。 1.末尾取余法 设一数字 x ,向下取整除法符号 //,求余符号 ⊙\odot⊙ ,则有: x⊙10x \odot 10x⊙10 :得到 x 的个数字;...
  • 如今的超级计算机到了亿万说到数学我猜一定有很多小伙伴是感觉到十分头疼的吧,毕竟在读书期间,大家也是没少被那个爱而不得的数学折磨……但是也有一些少部分的学霸对待数学那可是说是游刃有余呢。数学这个学科...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 168,157
精华内容 67,262
关键字:

中位数怎么算出来的