-
Excel在统计分析中的应用—第二章—描述性统计-分组数据的中位数的求解方法(组离散数据)
2018-01-08 18:58:00首先要构造累积频率分布表,然后通过累积频率分布表确定数据的中位数对应的观测值的位置,然后根据观测值的位置按照插值法估算数据的中位数。 2. 组连续数据的中位数 在假设数据在每个等级区间内均匀分布下,采用...对于未分组数据,可使用Excel的MEDIAN函数求解中位数。
对于分组数据,分为:
1. 组离散数据的中位数:
首先要构造累积频率分布表,然后通过累积频率分布表确定数据的中位数对应的观测值的位置,然后根据观测值的位置按照插值法估算数据的中位数。
2. 组连续数据的中位数在假设数据在每个等级区间内均匀分布下,采用以下公式来估计组数据的中位数。
看似非常简单的中位数计算,在使用了实际数据进行计算时,并不简单,耗时约1小时。
结论:分组时分的越细致,计算出的分组数据的中位数越接近未分组中位数。
其中,观测值数目通过Frequency数组函数计算得到。
备注:上次没搞清楚组离散数据和组连续数据的区别,这次加以修正。(访问量是离散数据,而不是连续数据)。
对于组连续数据的中位数求解,留待日后单独说明。
-
运用wps在excel一串数字中提取中间某几位字符拼接编辑
2020-05-26 11:54:12注意:字符就是指类字型...使用MID函数公式,MID(字符串,开始位置,字符个数)选取单元格内从开始位置(字符的序号)算起的字符个数的字符段来进行数据输出。 使用 & 字符来进行字符段拼接; 使用 ±字符来进行字注意:字符就是指类字型符号或单位,包含字母、数字、运算符号、标点符号和其他符号,以及一些功能性符号,字符是计算机或电子通信中字母、数字、符号的统称,是数据结构中数据存取中最小的数据单位,通常有8个二进制单位(一个字节)来表示一个字符,字符是计算机中最常用的二进制编码形式,是计算机中最常用的信息形式(引自百度百科)。
使用MID函数公式,MID(字符串,开始位置,字符个数)选取单元格内从开始位置(字符的序号)算起的字符个数的字符段来进行数据输出。
使用 & 字符来进行字符段拼接;(连接文本字符串非单元或非函数的时候需要使用 “” 字符来进行字符的包括。)
使用 ±字符来进行字符数值加减;
使用( )字符来进行运算次序规定,公式段优先级选取;
例如下图,公式为使用MID函数公式选取E1单元格第1个字符(值为2)开始的6个字符(为 2.1.3. ),使用括号()括起来使用&拼接的使用MID函数公式选取E1单元格第7个字符(值为2)开始的3个字符(为 250)然后用+来加数值1得到(251),使用&拼接使用MID函数公式选取E1单元格第10个字符(值为 . )开始的2个字符(为 .3 )。得到2.1.3.251.3。
得到2.1.3.251.3。
下拉运用公式获取F列其他值;
复制F列到G列,选取数值,得到F列这部分纯数值。
得到纯数值格式数值。
-
数据分析工程师笔试题:计算平均数的指标及其优缺点
2013-10-06 11:30:12平均指标的种类有:算术平均数、调和平均数、几何平均数、众数和中位数。前三种平均数是根据总体所有标志值计算的所以称为数值平均数,后两种平均数是根据标志值所处的位置确定的,因此称为位置平均数。 1、...平均指标的种类有:算术平均数、调和平均数、几何平均数、众数和中位数。前三种平均数是根据总体所有标志值计算的所以称为数值平均数,后两种平均数是根据标志值所处的位置确定的,因此称为位置平均数。
1、算术平均数的计算
算术平均数是计算平均指标的最常用方法,它的基本公式形式是总体标志总量除以总体单位总量。在实际工作中,由于资料的不同,算术平均数有两种计算形式:即简单算术平均数和加权算术平均数。
简单算术平均数:
其中:
算术平均数,X各单位标志值(变量值),n总体单位数(项数)。
其中:
----代表算术平均数,x 代表各单位标志值(变量值),f 代表各组单位数(项数)。
简单算术平均数适用于未分组的统计资料,如果已知各单位标志值和总体单位数,可采用简单算术平均数方法计算。
加权算术平均数适用于分组的统计资料,如果已知各组的变量值和变量值出现的次数,则可采用加权算术平均数计算。在“加权算术平均数=
(各组变量值×各组次数)/
各组次数”,公式中,各组次数具有权衡各组变量值轻重的作用,某一组的次数越大,则该组的变量值对平均数的影响就越大,反之越小。加权算术平均数的大小受两个因素的影响,其一是受变量值大小的影响。其二是受次数分配值即各组次数占总次数比重的影响。加权算术平均数中的权数,指的就是标志值出现的次数或各组次数占总次数的比重。在计算平均数时,由于出现次数多的标志值对平均数的形成影响大些,出现次数少的标志值对平均数的形成影响小些,因此就把次数称为权数。在分组数列的条件下,当各组标志值出现的次数或各组次数所占比重均相等时,权数就失去了权衡轻重的作用,这时用加权算术平均数计算的结果与用简单算术平均数计算的结果相同。
2、调和平均数的计算
在实际工作中,有时由于缺乏总体的单位数资料,而不能直接计算平均数,这时就可采用调和平均数计算。因此在统计工作中,调和平均数常常被作为算术平均数的变形来使用。调和平均数也有简单调和平均数和加权调和平均数两种形式。
例2、某月某企业按工人劳动生产率高低分组的生产班组数和产量资料如下:
按工人劳动生产率
分组(件/人)生产班组 产量(件) 50-60
60-70
70-80
80-90
90以上10
7
5
2
18250
6500
5250
2550
1520试计算该企业工人平均劳动生产率。
解:列计算表如下:
工人平均劳动生产率按工人劳动生产率
分组(件/人)组中值 产量(件) 人数 50-60
60-70
70-80
80-90
90以上55
65
75
85
958250
6500
5250
2550
1520150
100
70
30
16合 计 24070 366 注意本题计算中权数的选择。资料中“生产班组”可以是次数,但并不是合适的权数。因为本题中的工人劳动生产率是按件/人计算的,和生产班组没有直接关系,所以它不能作为权数进行平均数的计算。本题应以“产量”权数,进行加权调和平均数的计算。
加权算术平均数与加权调和平均数是计算平均指标时常常用到的两个指标。加权算术平均数中的权数一般情况下是资料已经分组得出分配数列的情况下标志值的次数。而加权调和平均数的权数是直接给定的标志总量。在经济统计中,经常因为无法直接得到被平均标志值的相应次数的资料而采用调和平均数形式来计算,使调和平均数的计算结果与加权算术平均数的计算结果相同,所以:
在实际应用加权算术平均数时,需注意权数的选择。
应用平均指标必须注意的问题有:⑴计算和应用平均指标,必须注意现象总体的同质性;⑵用组平均数补充说明总平均数;⑶计算和运用平均数时,要注意极端数值的影响,因为算术平均数受极端数值的影响很明显。
3、众数和中位数
众数和中位数是两个位置平均数,在一定条件下用它们反映变量数列的一般水平是非常有效的。
众数是总体中出现次数最多的变量值。在单位数不多或一个无明显集中趋势的资料中,众数的测定没有意义。一般来讲,只有根据分组数列才能确定众数。
中位数是将总体各单位标志值按大小顺序排列后,处于中间位置的那个数值。根据未分组资料和分组资料都可确定中位数。
4.平均指标的特点
1、把总体各单位标志值的差异抽象化了。
2、平均指标是个代表值,代表总体各单位标志值的一般水平。5.平均指标的作用
1、它可以反映总体各单位变量分量分布的集中趋势,可以用来比较同类现象在不同单位发展的一般水平。
2、用来比较同一单位的同类指标在不同时期的发展状况。
3、还可以用来分析现象之间的依存关系等相对指标数值的表现形式,有名数和无名数两种。6.平均指标与强度相对指标的区别
1、指标的含义不同。强度相对指标说明的是某一现象在另一现象中发展的强度、密度或普遍程度;而平均指标说明的是现象发展的一般水平。
2、计算方法不同。强度相对指标与平均指标,虽然都是两个有联系的总量指标之比,但是,强度相对指标分子与分母的联系,只表现为一种经济关系,而平均指标是在一个同质总体内标志总量和单位总量的比例关系。分子与分母的联系是一种内在的联系,即分子是分母(总体单位)所具有的标志,对比结果是对总体各单位某一标志值的平均。 -
霍涛避开红黑树结构,霍涛优先扩容桶位数
2020-11-05 19:55:12霍涛认为如果桶位数小于64,则先进行扩容(2倍),扩容之后重新计算哈希值,这样桶中的链表长度就变短了(之...霍涛将元素放入桶(数组)中,定位桶的方式:通过数组下标 i 定位,添加元素时,目标桶位置 i 的计算公式,i霍涛认为如果桶位数小于64,则先进行扩容(2倍),扩容之后重新计算哈希值,这样桶中的链表长度就变短了(之所以链表长度变短与桶的定位方式有关,请接着往下看)。
霍涛认为如果桶位数大于64,且某个桶中的链表长度大于8,则对链表进行树化(红黑树,即自平衡的二叉树)
霍涛认为如果红黑树的节点数小于6,树也会重新变会链表。
所以得出树化条件:链表阈值大于8,且桶位数大于64(数组长度),才进行树化。
霍涛将元素放入桶(数组)中,定位桶的方式:通过数组下标 i 定位,添加元素时,目标桶位置 i 的计算公式,i = hash & (cap - 1),cap为容量。
为什么优先扩容桶位数(数组长度),而不是直接树化?
这样做的目的是因为,霍涛认为当桶位数(数组长度)比较小时,应尽量避开红黑树结构,这种情况下变为红黑树结构,反而会降低效率。因为红黑树需要逬行左旋,右旋,变色这些操作来保持平衡。同时数组长度小于64时,搜索时间相对要快些。所以结上所述为了提高性能和减少搜索时间,底层阈值大于8并且数组长度大于64时,链表才转换为红黑树,具体可以参考下文要讲述的 treeifyBin() 方法。
-
HDU-3709 Balanced Number (数位dp)
2017-08-29 11:49:53题目大意:给定你一个区间 [x,y],要你求出这个区间里是平衡数的数的个数,平衡数的定义为:在一个数中取定一个平衡位置,满足该位置左边的数的重量等于右边的数的重量,重量的计算公式为该位的值乘上到选定位置的... -
组织机构中校验码的计算方法
2010-04-01 19:09:001.组织机构中校验码的计算方法 全国组织机构代码由八位数字(或大写拉丁字母)本体代码和一位数字(或大写拉丁字母)校验码组成。校验码按下列公式计算: 8C9=11-MOD(∑Ci×Wi,11) i=1 MOD-表示求余函数;i-表示... -
EXCEL函数公式集
2010-03-16 03:26:38得到单元格编号组中最大的数或最小的数 标记出3个最大最小值 取前五名,后五名的方法 如何用公式求出最大值所在的行? 求多个最高分 如何求多条件的平均值 想求出第三大之数值 【查询和查找引用】 查找顺序公式 怎样... -
Excel公式与函数大辞典.宋翔(带书签高清文字版).pdf
2019-03-02 08:33:513.1.4 两位数年份问题 121 3.2 返回当前的日期、时间和指定的日期、时间 121 3.2.1 NOW——返回当前日期和时间 121 3.2.2 TODAY——返回当前日期 123 3.2.3 DATE——返回指定日期的序列号 124 3.2.4 TIME——... -
Excel公式大全操作应用实例(史上最全)
2018-03-06 21:09:38得到单元格编号组中最大的数或最小的数 标记出3个最大最小值 取前五名,后五名的方法 如何用公式求出最大值所在的行? 求多个最高分 如何求多条件的平均值 想求出第三大之数值 【查询和查找引用】 查找顺序公式 怎样... -
地质图例符号大全_小学数学公式大全(三)
2020-12-06 19:18:06小学数学公式大全(三)1、小数乘法先按照整数乘法算出积,再点小数点,在点小数点时,因数(乘数)中一共有几位小数,就从积的右边起数出几位,点上小数点。一个数(0除外)乘以大于1的数,积比原来的数大;一个数(0除外)... -
【学习笔记之计算机组成原理篇】海明码校验码的编码与解码
2020-11-27 20:02:581.编码 确定校验码的位数 确定校验码中信息位D与校验位P...②确定校验码中 信息位D 与 校验位P 的位置 : (第 i 个校验位在校验码中的位置为 2i-1 ) 根据①可知有5个校验位,21个海明码,16个数据位(信息位): P1=21- -
python输入整数n计算并输出1+22+333_2019年C语言期末考试题与答案
2021-01-30 04:27:57计算公式为:e=1+1/1!+1/2!+1/3!+......+1/n!当1/n!<0.000001时e=2.718282。3、求一批数中最大值和最小值的积。4、某一正数的值保留2位小数,对第三位进行四舍五入。5、从键盘上输入任意实数... -
oracle round函数保留两位0没有了_随心所欲的“四舍五入” 之 ROUND函数如何使用?四舍五入” 之 ROUND函数...
2020-12-03 16:40:36Excel的ROUND函数主要作用根据指定的位数位置四舍五入本文介绍Microsoft Excel中ROUND函数的公式语法和用法。ROUND函数功能ROUND 函数用于返回某个数字按指定位数取整后的数字。也就是说计算保留去掉指定的位数后的... -
利用Python - Matplotlib 绘制箱线图
2020-05-04 04:41:13第一步:计算上四分位数,中位数,下四分位数(计算公式略)。 第二步:计算上四分位数和下四分位数之间的差值,四分位数差。 第三步:绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数。在箱子内部中位数... -
数据分析复习.pptx
2020-03-08 00:12:08总体个体样本和样本容量反映数据集中趋势的统计量用样本估计总体反映数据离散程度的统计量一知识链接1平均数的计算公式两种平均数的求法2中位数中位数仅与数据的排列位置有关当一组中的个别数据相差较大时可用中位数... -
利用Python – Matplotlib 绘制箱线图
2020-12-20 23:22:31第一步:计算上四分位数,中位数,下四分位数(计算公式略)。 第二步:计算上四分位数和下四分位数之间的差值,四分位数差。 第三步:绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数。在箱子内部中位数... -
关于KMP算法的理解,next数组和改进的nextval数组的计算
2020-05-20 12:49:07KMP算法主要是为了解决暴力匹配中主串指针前移而造成的资源和时间的浪费,KMP算法主要由三个步骤实现: 1、算子串的部分匹配值(PM值),列出PM表 2、按照PM表的指示确定下一次匹配时子串右移的长度。 公式: 移动距离... -
样本与数据分析初步.ppt
2019-12-20 10:47:52* * 表示数据集中的统计量平均数中位数众数 表示数据离散的统计量方差标准差 1中位数与数据的排列位置有关当 一组数据中的 个别数据相差较大时, 可用中位数来描述这组数据的集中趋势 2计算方法将一组数据按一定的... -
统计学名词解释
2019-12-28 22:45:59中位数 百度百科解释:中位数(Median)又称中值,统计学中的专有名词,是按顺序排列的一组数据中居于中间位置的数,代表一个样本、种群或概率分布中...计算公式:定义数组的个数是N,N是奇数时,中位数是arr[(N+1)... -
找出一批正整数中的最大偶数_c语言上机题库
2020-12-24 21:09:10计算公式为: e=1+1/1!+1/2!+1/3!+......+1/n!当1/n!<0.000001时e=2.718282。3、求一批数中最大值和最小值的积。4、某一正数的值保留2位小数,对第三位进行四舍 五入。5、从键盘上输入任意实数x,求出其所对应的函... -
Python 组织机构代码证校验
2016-08-03 14:59:13校验码按照以下公式计算: C9=11−MOD(∑i=18Ci×Wi,11)C_9=11-MOD(\sum_{i=1}^{8}C_i×W_i,11) 式中: MOD——代表求余函数; i——代表代码字符从左至右位置序号; CiC_{i}——代表第i位上的代码字符的值,... -
算法中的数学---康托展开
2020-05-12 10:04:48康托展开的实质是计算当前排列在所有由小到大全排列中的顺序。 康托展开的公式为: x=a[n](n-1)!+a[n-1](n-2)!+…+a[1]*0!,x代表比当前排列小的排列的个数,因此最终我们需要的答案就是x+1,其中a[i]表示当前排列... -
点阵字库HZK32的使用方法和显示
2019-05-18 23:43:18因此,汉字在汉字库中的具体位置计算公式为:(94*(区号-1)+位号-1)*字节数(一个汉字字模占用的字节数)。以32*32点阵字库为例,计算公式则为:(94*(区号-1)+(位号-1))*32*32/8。32*32字模为长和宽都是32位的数... -
随心所欲的“四舍五入” 之 ROUND函数如何使用?
2021-01-14 09:17:13本文介绍Microsoft Excel中ROUND函数的公式语法和用法。 ROUND函数功能 ROUND 函数用于返回某个数字按指定位数取整后的数字。也就是说计算保留去掉指定的位数后的值。 ROUND函数格式 ROUND(number,num_digits) 翻译... -
excel中161个VBA_自定义函数超级实用
2018-03-28 08:36:32函数作用:选取当前工作表中公式出错的单元格﹐关返回出错个数...............................................101 '101.函数作用:将工作表中最后一列作为页脚打印在每一面页尾101 '102.函数作用:获取vbproject引用... -
任意大小汉字点阵字库(字模)的制作与生成 单片机GUI/STemwin
2017-09-22 08:43:141、首先介绍一下汉字点阵在汉字... 计算公式为: (94*(区号-1)+位号-1) * 一个汉字字模占用字节数 对于16点阵的字库,1个汉字字模占用32字节。对于12点阵字库,字摸每行的位数均补齐为8的整数倍,于是实际该字库的位 -
条形码编码规则
2013-05-15 18:57:05同学们一定见过商品的条形码吧!商品条形码是一个13位数,它...其计算公式见下表. 步骤 举例说明 1.自右向左编号 某商品条形码为:690123456789X(X为校验码) 位置序号 13 12 -
CCF模拟题 44. 身份证校验
2020-08-23 11:52:36我国国标〖GB 11643-1999〗中规定:公民身份号码是18位特征组合码,由十七位数字本体码和一位数字校验码组成。排列顺序从左至右依次为:六位数字地址码,八位数字出生日期码,三位数字顺序码和一位数字校验码。其... -
R语言经典实例(中+英)
2014-12-03 18:46:159.10 中位数的置信区间 217 9.11 检验样本比例 218 9.12 比例的置信区间 219 9.13 检验正态性 220 9.14 游程检验 222 9.15 比较两个样本的均值 223 9.16 比较两个非参数样本的位置 225 9.17 检验...
-
数据资源质量监控平台.zip
-
Drying (二分)
-
MySQL Router 实现高可用、负载均衡、读写分离
-
【Linux】nexus3搭建npm私服
-
声纹识别matlab全部代码
-
STM32单片机程序+原理图.zip
-
Liunx 优化思路与实操步骤
-
PowerBI重要外部工具详解
-
基于电商业务的全链路数据中台落地方案(全渠道、全环节、全流程)
-
2020-L1V3.pdf
-
自动化数据分析框架比较—EDA Is All You Need
-
HDM3200总线消防电话使用说明书.pdf
-
JMETER 性能测试基础课程
-
Docker
-
北京邮电大学算法设计与分析课件.zip
-
MMM 集群部署实现 MySQL 高可用和读写分离
-
MySQL 管理利器 mysql-utilities
-
【爱码农】C#制作MDI文本编辑器
-
惠普HP OfficeJet Pro 9018 打印机驱动
-
Docker从入门到精通