精华内容
下载资源
问答
  • 极简核心论文写作指南 更多免费资料关注微信公众号青春博长 扫码关注微信公众号 了解更多课程 考博圈 kaoboquan10 0 极简核心论文写作指南 更多免费资料关注微信公众号青春博长 选修5 如何用Excel做关键词的词频分析 ...
  • 一、用EXCEL做数据分析的知识点汇总如下:数据分析的步骤1 明确问题把原始数据复制为清洗数据2 理解数据根据研究问题采集相关数据查看数据集信息(描述统计数据、字段含义)3 数据清洗(数据预处理)选择子集(列...

    2ca463b7b506a24a1378dee7570c766a.png

    一、用EXCEL做数据分析的知识点汇总如下:

    • 数据分析的步骤
      • 1 明确问题
        • 把原始数据复制为清洗数据
      • 2 理解数据
        • 根据研究问题采集相关数据
        • 查看数据集信息(描述统计数据、字段含义)
      • 3 数据清洗(数据预处理)
        • 选择子集(列隐藏,尽量不删除;全选表格-开始-格式-隐藏和取消隐藏)
        • 列名重命名(双击列名单元格修改)
        • 删除重复值(数据-删除重复项-取消全选-勾选列-确定)
        • 缺失值处理(通过查看列对应的计数判断)
          • 通过人工手动补全(选中列-开始-查找和选择CTRL+G-定位条件-空值-输入一个,按Ctrl+Enter)
          • 删除缺失值
          • 用平均值代替缺失值
          • 用统计模型计算值代替缺失值
        • 一致化处理
          • 分列(点击列号-复制-最后一列后空白列-粘贴;数据-分列ALT+A+E-分隔符号)
          • 文本转为数值
          • 截取字符串(find/left/right/mid函数)
          • 字符串形式数字转换成数字类型( 插入-复制-选择性粘贴-数值-分列)
        • 数据排序(选中列-开始-排序和筛选ALT+H+S-降序-扩展选定区域)
        • 异常值处理
          • 数据透视表
            • 原理:数据分组(split)应用函数(apply)组合结果(combine)
            • 应用(插入-数据透视表ALT+N+V-新工作表-拖拽行/列/值-行标签-其它排序选项-降序排序-计数项-插入函数IF判断是否包含关键字筛选数据)
      • 4 数据分析或构建模型
        • 工作城市职位数:(插入-数据透视表-行(城市)-列(工作年限)-值(城市)-城市-其它排序选项-排序降序-计数项-总计列任选一单元格-右键-值显示方式-列汇总的百分比)
        • 薪水描述统计分析
        • 日期数据的处理:(选中日期列-数据-分列-下一步-下一步-日期-选中日期列-右键-设置单元格格式-自定义-yyyy/m/d-数据透视表-行(日期)-值(涨分量)-日期列任选一单元格-右键-组合)
        • 多表关联:vlookup函数
          • 函数参数:(找什么,在哪找(第一列必须是要查找值的列),第几列,近似找1or精确找0),
          • 重复数据查找:利用辅助列,A&B可将两个单元格内容拼接
          • 实现分组:需使用模糊匹配查找范围
          • 三种引用方式:相对引用:A1(按四次F4),绝对引用:$A$1(按一次F4),混合引用:A$1(按两次F4),$A1(按三次F4)
      • 5 数据可视化(图表)

    二、用EXCEL进行数据分析的实战案例

    仍然以阿里巴巴天池提供的数据为例进行分析。

    数据集-阿里云天池tianchi.aliyun.com

    1 明确问题:

    1)分别按年、季度、月比较一类商品的婴儿用品的销量情况;

    2)男宝宝和女宝宝各自的用户数量及占比;

    3)分析各个年龄段用户的商品偏好。

    2 理解数据:在《统计学——数据分析的基石》一文中已经对表1购买商品,表2婴儿信息中的描述统计数据和字段含义进行了分析。

    3 数据清洗

    把表1购买商品和表2婴儿信息进行复制,对复制后的表格进行清洗。

    表1隐藏商品编号和商品属性。表1删除了27个重复值,表2无重复值。

    对表1中商品属性一列的缺失值填充为0。

    对表1的购买时间和出生日期均一致化为yyyy/mm/dd格式,将表2中再插入一性别列,用IF函数将性别一列1改为男,0改为女,2的未知,筛选出所有未知,视为异常值,删除对应行。

    通过表2出生日期筛选升序排列,发现出生日期为1984/6/16的不属于婴儿,是异常值,直接删除。再利用数据透视表看到表2中男女性别数量,男女比例分布相差不大。

    表1无异常值。最终表1共29944条数据,表2共926条数据。

    c23d796f11190dc850b6c195339cc78b.png

    对表1按照购买数量降序进行排序。两表数据清洗结果如下:

    2eb0056044a2c9f6646ff71d83d6205c.png

    4 数据分析

    1)分别按年、季度、月比较一类商品的婴儿用品的销量情况。利用数据透视表对表1分析结果如下:

    e98f8b2d526ba702e4bec5a08ce50a57.png

    分析结果:表中分别显示了2012年-2015年每年、每季度、每月的一类商品的总销量。可以看出2013年和2014年均是从第一季度到第四季度商品销量递增,这可能是因为第四季度有双十一,导致第四季度销量最高。

    2)分析各类一级商品和二级商品的销量情况。利用数据透视表汇总表1中各个一类商品的销量,和各个一类商品中所有二类商品销量。

    58f22e973e5b5e5781a0e8dec4920aa0.png

    分析结果:销量最高的一类商品是28,销量为28537,销量最差的商品是122650008,销量是2239。

    3)男宝宝和女宝宝各自的用户数量及占比,以及商品销量。利用vlookup函数找到表2中各个用户ID在表1中对应的购买数量:

    4a500bc1106d6d9f6dfb1e780034465b.png

    利用数据透视表分析不同性别对应的用户数量及购买数量:

    ea5703335251f4cec809f7d41f081bff.png

    4)分析各个年龄段用户的商品偏好。在表2中新增列:年龄。利用vlookup函数找到表2中各个用户ID在表1中对应的商品一级分类,购买时间,用year(购买时间)-year(出生日期)即可得出所有用户年龄,设置格式为常规。

    5eaec14e0441030e9ef141284bec820f.png

    利用数据透视表分析不同年龄段的各类商品购买数量,在年龄中右键-组合-设置步长为3:

    3d4d5c3d4591697a506d9b9ba0a8c247.png

    数据分析:年龄段在1-3岁的用户对商品需求量最多,为863,其次是0岁,用户更偏好购买50014815类商品和50008168类商品。

    展开全文
  • 用excel做数据分析,不难,难在如何做好。拆分成两块:掌握excel分析技能+数据分析的硬核经验。一、快速掌握excel分析技能1、excel学习excel教程不要太多,如何快速学习excel,我之前也回答过,反正就是逮住一本教程...

    文科出身,在excel上算是一路摸爬滚打。现在带着3个人的团队,组建了信息部,主要负责公司的营运数据分析。分享一些我的经验。

    用excel做数据分析,不难,难在如何做好。拆分成两块:掌握excel分析技能+数据分析的硬核经验。

    一、快速掌握excel分析技能

    1、excel学习

    excel教程不要太多,如何快速学习excel,我之前也回答过,反正就是逮住一本教程,照着练:

    把一本体系化的excel教程吃透了,就足以应对业务工作所需的数据分析了。

    如果觉得书籍太枯燥,那把视频课看起来。对数据分析有帮助的一些还不错的视频课,我梳理了一下:

    数据计算课程:Excel函数与公式_ExcelHome - 全球极具影响力的Excel门户,Office视频教程培训中心​www.excelhome.net

    数据处理实战课程:实战技巧精粹_ExcelHome - 全球极具影响力的Excel门户,Office视频教程培训中心​www.excelhome.net

    还有一些短期的系统训练课程,比如腾讯教育的数据分析训练营,一样适合数据分析新手,比较偏向商业数据分析:

    2、excel实操

    好用的函数能让你数据分析时,如有神助,下面是我在数据分析时常用的函数:常用函数(加总求和、计数、平均、最值、排序、乘积、除余、取整)

    逻辑运算(if、iferror、and、or)

    文本编辑(文本提取、文本查找、文本替换、文本转换及合并)

    引用与查找(vlookup、hlookup、lookup、indirect、index、match)

    1)排序函数

    rank(排序的目标数值,区域,逻辑值)

    逻辑值如果输入0或者不输入时,为降序排列(数值越大,排名越靠前);逻辑值输入非0时,为升序排列(数值越大,排名越靠后)比如:对业绩排名的计算,小李排名第5

    2)逻辑判断

    if(计算条件的表达式或值,满足条件返回true,否则返回false)

    根据指定条件来判断其“满足”(TRUE)、“不满足”(FALSE),从而返回相应的内容。比如:判断团队业绩是否达标,小李和小军均不合格

    3)计算文本长度

    len(要计算字符长度的文本),用来计算文本串的字符数比如:判断手机号是否有效,小李手机号少一位,为无效信息

    不全部列举了,这篇讲的比较全,可以移步参考:数据分析excel常用函数_大数据_su_2018的博客-CSDN博客​blog.csdn.net

    数据处理上,可以使用一些excel插件,提高处理速度:

    1)

    3)

    5)

    注:插件方便也不用贪多,挑顺手的数据处理和图形制作的各一个即可。

    缺实操的伙伴,可以从https://hao.199it.com/找点数据练练手。常见的公开数据网站都可以搜索到:

    好的图表可视化是一份分析报告的点睛之笔。平时要多看美图、多参考:图表配色参考地址:图表配色

    关于如何制作干净漂亮的excel表格,我在这篇回答分享了自己经验,有需要可以看:怎样做出干净漂亮的excel表格?​www.zhihu.com

    二、数据分析的几点硬核经验

    1、务必提升数据采集的效率

    因为读了四年社会学(社会调查专业户),经常需要大面积采集数据,所以吃够了数据收集的亏。excel重处理而弱采集,尤其在大体量的公司,跨部门收集、汇总四面八方的数据,很崩溃。

    所以我从去年5月找了一些表单工具(j简道云、麦客、金数据、氚云等),一圈试下来,碰上年初的疫情我们公司上了钉钉,现在是【钉钉+简道云+excel】搭配使用,数据收集效率还是很可观地,目前在库存管理、销售管理上都已形成了规范的数据采集管理:

    关于实际使用的心得,我就不展开讲了,以后再作分享。

    数据采集还涉及线上数据爬取,但这方面我了解不多,就不班门弄斧了。有意者可以参考这篇回答:如何入门 Python 爬虫?

    2、业务知识大于工具选择

    所有数据分析师都会告诉后来人“业务知识很重要”,因为大家在踩了坑之后才恍然大悟分析中遇到的很多难题问题都源于对业务的不了解。

    例如,同样是对客户进行分析,互联网电商的客户与保险客户具有明显区别,前者重视来源,活跃度,购买率,流失率,后者关注渠道,报价,理赔风险,投诉。业务知识包括这种大方向的行业知识,也包括公司内部特殊情况,了解得越详细可以避免绕很多弯路。

    例如,有些行为是内部人员参与的造成的数据异常要提前做处理,有些业务开展是带地区特性的,分析时候要区分对待等。

    而真正做分析时候,你会发现市面上有太多的分析工具,需要掌握的实在是太多了,其实不必纠结于此,依据个人能力,配合当前的数据分析环境,适用的工具自然会被选出。

    数据分析过来人都会说80%的时间都在做数据处理工作,所以数据处理能力是必须的,简单工具有Excel、SQL,复杂的有R,Python,Java。专业点的是finebi、tableau等。

    3、规范良好的数据思维

    分享几本在我成长过程中帮助较大的【数据分析书籍】

    数据分析入门第一本。通俗简单,能够让你对数据分析的相关概念有大致的了解。这本书蕴含的思想逻辑和分析原则,要好好体会,会对你以后的学习有很大的帮助。

    号称“文科生也能看懂”的统计书。阅读起来相当容易,一口气就能看完。这本书所讲的知识在数据分析中都是常见且必须掌握的,比如基本的统计量,基本上每个分析项目中都会用到;比如基本的概率分布,总体与样本的概念、置信区间、假设检验、回归分析,都是关于数据分析的统计学知识。“HeadFirst类的书籍,一向浅显易懂形象生动,可以对分析概念有个全面的认知。”“此书优势在于将企业分成了几个大的行业类别,并分门别类的讲解了每个行业的商业模式特点及分析技巧,对使用者的分析能力要求较高,且必须具备相应的业务知识。”

    书中并没有讲到具体的数据分析技术,主要分析了各种产品中用到的指标、模型和“数据驱动型产品”的一些思路。

    阿里巴巴前数据副总裁车品觉所著,讲解了阿里巴巴在企业内部治理数据过程中的心得,所讲“存-通-用”数据管理三板斧和“从数据化运营到运营数据”,字字珠玑,可堪借鉴。

    由于回答以来很多伙伴来私信一些问题,尤其最常提问“自己是否适合数据分析”,害怕自己零基础入门难,或者文科生学不会。

    我再多说一点,个人建议的是最好去尝试一下,但尝试≠立马转行,我指的尝试是去尝试入门、尝试使用。所以我推荐的一些书籍也好、工具也罢,是希望大家能从看到练,有一个系统的体验过程。

    我在回答中间也提到可以看一些免费的视频课程,除了比较常见的一些excel视频学习网站之外,一些平台开设的短期训练营也非常适合新手。

    体验一下数据分析过程中真正的思维与方法、体验一下各大主流数据工具、体验一下如何用数据分析解决商业问题……体验之后你就知道自己是不是真的适合数据分析了。

    推荐这个,偏向商业数据分析入门训练:

    个人经验仅分享,不当之处,欢迎大家补充交流~

    展开全文
  • 数据分析第一步,一定是先从数据库提取数据基本的描述统计分析,整体查看做到心中有数,而80%的描述统计需要SQL尝试取数后,或放到Excel或其他Tableau等工具,待基本了解数据整体现状之后,才会上模型上算法,去...

    数据分析第一步,一定是先从数据库提取数据做基本的描述统计分析,整体查看做到心中有数,而80%的描述统计需要用SQL尝试取数后,或放到Excel或其他Tableau等工具,待基本了解数据整体现状之后,才会上模型上算法,去进一步挖掘数据价值。

    不要忽略这第一步,实际工作中,它是极其高频的使用场景,80%的数据需求依赖于SQL解决,不会SQL的数据分析师, 只能站在数据仓库的门口望洋兴叹,因为自己手里没有"钥匙",没法进去盘点库存。

    今儿大白话说《如何用SQL做数据分析》

    1. 目的

    用最简单的例子,达到80%的效果:

    通过一个实例数据库,数据足够简单, 粗略演示下最基本的数据探查过程。真实的工作环境,数据环境可能会复杂些,我们一步一步来,以后会写更多文章来补充。

    这篇文章,希望你能get到下面几点

    • 常用SQL练手
    • 数据探查思路
    • 隐藏价值提取

    2. 数据

    • 网上共享Mysql实例数据库: employees, 以及安装方法

    如果不想花时间搭建环境,我已经在云端搭建了数据学习环境,按照下面文章中第三部分“学习环境”的说明,申请远程访问权限:

    2019年,数据民工的大白话规划

    • 数据库表结构
    456d6f1b04e27928512acdf546b766c4.png
    mysql> show tables;+---------------------+| Tables_in_employees |+---------------------+| departments         || dept_emp            || dept_manager        || employees           || salaries            || titles              |+---------------------+# 部门表, 记录部门编号和部门名称CREATE TABLE `departments` (  `dept_no` char(4) NOT NULL,  `dept_name` varchar(40) NOT NULL,  PRIMARY KEY (`dept_no`),  UNIQUE KEY `dept_name` (`dept_name`)) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4# 部门员工表,记录各部门下属员工编号, 以及员工在该部门工作的起始和终止日期CREATE TABLE `dept_emp` (  `emp_no` int(11) NOT NULL,  `dept_no` char(4) NOT NULL,  `from_date` date NOT NULL,  `to_date` date NOT NULL,  PRIMARY KEY (`emp_no`,`dept_no`),  KEY `emp_no` (`emp_no`),  KEY `dept_no` (`dept_no`),  CONSTRAINT `dept_emp_ibfk_1` FOREIGN KEY (`emp_no`) REFERENCES `employees` (`emp_no`) ON DELETE CASCADE,  CONSTRAINT `dept_emp_ibfk_2` FOREIGN KEY (`dept_no`) REFERENCES `departments` (`dept_no`) ON DELETE CASCADE) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4# 部门经理表, 记录对应的部门经理的员工编号, 以及在该部门工作的起始和终止日期CREATE TABLE `dept_manager` (  `dept_no` char(4) NOT NULL,  `emp_no` int(11) NOT NULL,  `from_date` date NOT NULL,  `to_date` date NOT NULL,  PRIMARY KEY (`emp_no`,`dept_no`),  KEY `emp_no` (`emp_no`),  KEY `dept_no` (`dept_no`),  CONSTRAINT `dept_manager_ibfk_1` FOREIGN KEY (`emp_no`) REFERENCES `employees` (`emp_no`) ON DELETE CASCADE,  CONSTRAINT `dept_manager_ibfk_2` FOREIGN KEY (`dept_no`) REFERENCES `departments` (`dept_no`) ON DELETE CASCADE) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4# 员工信息表, 记录员工初始日期, 姓名, 性别和雇佣日期信息CREATE TABLE `employees` (  `emp_no` int(11) NOT NULL,  `birth_date` date NOT NULL,  `first_name` varchar(14) NOT NULL,  `last_name` varchar(16) NOT NULL,  `gender` enum('M','F') NOT NULL,  `hire_date` date NOT NULL,  PRIMARY KEY (`emp_no`)) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4# 薪水表, 记录员工某段日期的薪水CREATE TABLE `salaries` (  `emp_no` int(11) NOT NULL,  `salary` int(11) NOT NULL,  `from_date` date NOT NULL,  `to_date` date NOT NULL,  PRIMARY KEY (`emp_no`,`from_date`),  KEY `emp_no` (`emp_no`),  CONSTRAINT `salaries_ibfk_1` FOREIGN KEY (`emp_no`) REFERENCES `employees` (`emp_no`) ON DELETE CASCADE) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4# 岗位表, 记录员工的岗位信息, 即该岗位任职起始和终止日期信息CREATE TABLE `titles` (  `emp_no` int(11) NOT NULL,  `title` varchar(50) NOT NULL,  `from_date` date NOT NULL,  `to_date` date DEFAULT NULL,  PRIMARY KEY (`emp_no`,`title`,`from_date`),  KEY `emp_no` (`emp_no`),  CONSTRAINT `titles_ibfk_1` FOREIGN KEY (`emp_no`) REFERENCES `employees` (`emp_no`) ON DELETE CASCADE) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4

    3. 好奇心

    几张简单的表, 放在你面前, 你会好奇那些问题? 我先抛砖:

    数据能否反应公司发展趋势?

      • 公司各年工资支出
      • 公司各年入职和离职数量

    数据能否反应公司对男女员工价值观?

      • 公司男女比例
      • 公司年龄分布

    数据能否反应那种岗位涨薪最快?

      • 不同岗位, 每年收入增长
      • 有岗位升迁的员工, 每年收入增长

    4. 满足好奇心

    针对上面的好奇心,你可以先尝试自己完成数据提取和分析, 然后对比下面的思路

    公司发展趋势

    • 公司各年工资支出 :线性递增
    mysql> select year(from_date), sum(salary) as cost       from salaries       group by year(from_date);+-----------------+-------------+| year(from_date) | cost        |+-----------------+-------------+|            1985 |   972864875 ||            1986 |  2052895941 ||            1987 |  3156881054 ||            1988 |  4295598688 ||            1989 |  5454260439 ||            1990 |  6626146391 ||            1991 |  7798804412 ||            1992 |  9027872610 ||            1993 | 10215059054 ||            1994 | 11429450113 ||            1995 | 12638817464 ||            1996 | 13888587737 ||            1997 | 15056011781 ||            1998 | 16220495471 ||            1999 | 17360258862 ||            2000 | 17535667603 ||            2001 | 17507737308 ||            2002 | 10243347616 |+-----------------+-------------+18 rows in set (1.86 sec)

    上面数据,放到Excel表里,很容易生成一个柱状图:

    b54aeac7a0df157d18524c7a8844f8ea.png

    公司各年入职和离职数量: 入大于出,但离职率在逐年递增

    # 每年入职mysql> select year(tt.from_date) as from_date, count(*) as num       from       (select emp_no, min(from_date) as from_date, max(to_date) as to_date       from dept_emp       group by emp_no) tt       group by year(tt.from_date)       order by from_date;+-----------+-------+| from_date | num   |+-----------+-------+|      1985 | 18293 ||      1986 | 19878 ||      1987 | 19987 ||      1988 | 20103 ||      1989 | 20310 ||      1990 | 20042 ||      1991 | 19817 ||      1992 | 20203 ||      1993 | 19914 ||      1994 | 19894 ||      1995 | 19875 ||      1996 | 20176 ||      1997 | 20120 ||      1998 | 19828 ||      1999 | 19848 ||      2000 |  1736 |+-----------+-------+16 rows in set (0.71 sec)# 每年离职mysql> select year(tt.to_date) as to_date, count(*) as num       from       (select emp_no, min(from_date) as from_date, max(to_date) as to_date       from dept_emp       group by emp_no) tt       group by year(tt.to_date)       order by to_date;+---------+--------+| to_date | num    |+---------+--------+|    1985 |     89 ||    1986 |    374 ||    1987 |    668 ||    1988 |    905 ||    1989 |   1288 ||    1990 |   1594 ||    1991 |   1883 ||    1992 |   2317 ||    1993 |   2742 ||    1994 |   3135 ||    1995 |   3739 ||    1996 |   4330 ||    1997 |   5069 ||    1998 |   5941 ||    1999 |   6964 ||    2000 |   7610 ||    2001 |   7241 ||    2002 |   4011 ||    9999 | 240124 | ====> 表示当前在职+---------+--------+19 rows in set (0.57 sec)

    通过上面数据,尝试计算下面两个指标:

    1. 每年在职员工数量
    2. 每年离职率
    f57fbc7beae8bb146b207c2aad0a9896.png

    是不是很容易,下面的数据,自己尝试画下图?

    当然,具体绘图不是重点,重点是数据反应背后的现状

    图只是让数据显得直观,更容易发现数据的特征

    员工价值观

    • 公司男女和年龄交叉分布
    mysql> select gender, round((to_days('2002-08-01') - to_days(birth_date))/365,0)  as ages,       count(*)       from       (select emp_no, birth_date, gender       from employees) t1       join       (select emp_no from titles where to_date='9999-01-01') t2 on t1.emp_no=t2.emp_no       group by gender, round((to_days('2002-08-01') - to_days(birth_date))/365,0);+--------+------+----------+| gender | ages | count(*) |+--------+------+----------+| M      |   38 |    10846 || M      |   39 |    11064 || M      |   40 |    11135 || M      |   41 |    11038 || M      |   42 |    10891 || M      |   43 |    11261 || M      |   44 |    11071 || M      |   45 |    11104 || M      |   46 |    11033 || M      |   47 |    11122 || M      |   48 |    11046 || M      |   49 |    11051 || M      |   50 |    11105 || M      |   51 |      347 || F      |   38 |     7139 || F      |   39 |     7311 || F      |   40 |     7329 || F      |   41 |     7381 || F      |   42 |     7513 || F      |   43 |     7465 || F      |   44 |     7469 || F      |   45 |     7149 || F      |   46 |     7342 || F      |   47 |     7428 || F      |   48 |     7515 || F      |   49 |     7325 || F      |   50 |     7415 || F      |   51 |      229 |+--------+------+----------+28 rows in set (0.86 sec)

    岗位涨薪最快

    • 总体每年收入增长
    mysql> select  round((max-min)/min/(years-1),2) as increaceByYear, count(*) as num       from       (select emp_no, count(*) as years,       max(salary) as max, min(salary) as min       from salaries       group by emp_no       having years>1) tt       group by round((max-min)/min/(years-1),2)  order by increaceByYear;+----------------+-------+| increaceByYear | num   |+----------------+-------+|           0.00 |  1705 ||           0.01 |  7925 ||           0.02 | 35345 ||           0.03 | 68993 ||           0.04 | 72082 ||           0.05 | 56231 ||           0.06 | 31329 ||           0.07 | 11807 ||           0.08 |  3868 ||           0.09 |  1502 ||           0.10 |   605 ||           0.11 |   223 |+----------------+-------+12 rows in set (1.13 sec)
    • 有岗位升迁的员工, 每年收入增长
    mysql> select round((max-min)/min/(years-1),2) as increaceByYear, count(*) as num       from       (       select t1.emp_no, max(salary) as max, min(salary) as min, count(*) years       from       (select emp_no, salary       from salaries) t1       join       (select emp_no, count(*) as tt       from titles       group by emp_no       having tt>1) t2 on t1.emp_no=t2.emp_no       group by t1.emp_no       having years>1       ) tt       group by  round((max-min)/min/(years-1),2)  order by increaceByYear;+----------------+-------+| increaceByYear | num   |+----------------+-------+|           0.00 |    22 ||           0.01 |  1295 ||           0.02 | 16156 ||           0.03 | 35924 ||           0.04 | 37833 ||           0.05 | 29389 ||           0.06 | 14890 ||           0.07 |  4040 ||           0.08 |   645 ||           0.09 |    74 ||           0.10 |     2 |+----------------+-------+11 rows in set (1.91 sec)

    各部门员工分布

    mysql> select dept_no, count(*) from dept_emp group by dept_no;+---------+----------+| dept_no | count(*) |+---------+----------+| d001    |    20211 || d002    |    17346 || d003    |    17786 || d004    |    73485 || d005    |    85707 || d006    |    20117 || d007    |    52245 || d008    |    21126 || d009    |    23580 |+---------+----------+9 rows in set (0.32 sec)

    其他:

    员工忠诚度

    • 在岗时间
    • 在岗时间与岗位收入相关性
    展开全文
  • 衡量事物之间或者变量之间线性相关程度的强弱并用适当的统计指标表现出来,这个过程是相关分析。SPSS软件是进行相关性分析的常用软件。操作方法01电脑先安装SPSS软件,并打开SPSS软件,导入你需要分析的数据,这里以...

    相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。衡量事物之间或者变量之间线性相关程度的强弱并用适当的统计指标表现出来,这个过程是相关分析。SPSS软件是进行相关性分析的常用软件。

    操作方法

    01电脑先安装SPSS软件,并打开SPSS软件,导入你需要分析的数据,这里以excel数据为例子。点击【文件】-【打开】-【数据】。选择excel数据,确认导入后,进行相关性分析。点击【分析】-【相关】-【双变量】。

    02看到双变量对话框了吗?左侧的候选对话框选择两个变量添加到列表框中,表示需要进行简单分析的两个变量。

    03然后选择系数类型。一般可以选择Pearson相关系数,也可以选择其他两个。Pearson是系统默认项,即积差相关系数。kendall和spearman都是等级相关系数。对于非等间距连续测度的连续变量,因为分布不明可以使用等级相关系数。也可以使用Pearson分析。对于完全等级的离散变量必须使用等级相关分析相关性。

    04最后点击确定按钮,操作就完成啦!SPSS软件会在结果输出窗口显示相关性分析结果。

    从上表来看,两个变量的Pearson相关系数为0.742,说明两者中度正线性相关。这就是SPSS软件的分析过程,是不是很简单?

    展开全文
  • 数据分析是指适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。 在实际工作中,数据分析可帮助企业作出判断,...
  • Word怎么表格如何运用Excel编制统计表并一般数据分析?方法/步骤1打一个excel表格表格,,简单的结存统计2要想结存统计,先在结存下面的表格中输入“=”3我们统计的就是上期结存数量 入库数量-出库数量=现在...
  • 问题:Excel中,如何快速分类统计数据?所谓Excel中的分类统计,很多情况下,其实,就是按关键字段,对数据进行分类汇总:“统计下公司各部门人数”“给我张季度产品的销售报表”“这个月各销售员的销量统计”“统计...
  • 做统计、咨询的人都知道,Excel文件经常需要对其中某些数据进行特殊处理,比如加上背景色提醒,对某些特定数据进行统计,如下图,ABC公司要对最近6个月的销售进行分析,基于销售经理的经验,需对图中蓝色和橙色背...
  • 之前跟大家一起分享了如何用EXCEL进行回归分析,现在跟大家一起来学习一下如何用EXCEL做时间序列分析。在百科里,时间序列分析分析的解释是这样的:时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间...
  • 最近几个月因为工作中大量的报表需求,用Excel处理简直让人崩溃。于是就了解了一下市面上的一些报表工具。通过使用分析,今天为大家推荐一款性价比最高的免费可视化数据软件,他就是商用web报表工具RDP,功能性和...
  • 5万多行的数据用Excel做地图经常卡死,除了换电脑还有什么好方法?这些都很常见,随着数据积攒得越多,并且由于Excel本身和你电脑配置的限制,Excel处理和分析起大数据量来就捉襟见肘了,需要很好的工具配合减负或...
  • 5万多行的数据用Excel做地图经常卡死,除了换电脑还有什么好方法?这些都很常见,随着数据积攒得越多,并且由于Excel本身和你电脑配置的限制,Excel处理和分析起大数据量来就捉襟见肘了,需要很好的工具配合减负或...
  • 报表功能是自控系统经常的一个功能,过报表功能,我们能表格的方式,查询到历史数据,也能通过报表分析统计,并根据报表调整工艺配方等等。以往组态软件,对报表支持力度上都不是很友好,数据不能自定义的...
  • EXCEL篇—时间序列分析(季节指数法)

    万次阅读 多人点赞 2019-08-13 13:35:42
    之前跟大家一起分享了如何用EXCEL进行回归分析,现在跟大家一起来学习一下如何用EXCEL做时间序列分析。 在百科里,时间序列分析分析的解释是这样的:时间序列(或称动态数列)是指将同一统计指标的数值按其发生的...
  • 如何用R分析CNKI文献关键词词频?

    千次阅读 2017-11-16 16:58:00
    如何用VOSviewer分析CNKI数据?》一文发布后,有同学问我: 王老师,我有个问题,我用cnki导出关键词后,想统计关键词的词频,我应该用什么样的工具?如果不利用citespace和python,做出excel那种的统计表格,该...
  • 小明在这家公司任数据分析师,平时都是通过 Excel数据分析的。今天老板丢给他一个任务:下班前筛选出集团公司旗下最近一年销售额前五名的品牌以及销售额。 对于 Excel 大佬来说,这不就是分分钟的
  • 昨天跟大家一起分享了如何用EXCEL进行回归分析,今天跟大家一起来学习一下如何用EXCEL做时间序列分析。在百科里,时间序列分析分析的解释是这样的:时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间...
  • 大部分人在学习数据分析时都会遇到类似的困惑,不知道该学哪个数据分析工具,对于新手入门,我首推Excel,元老级的数据分析工具,能实现的功能很强大,应付一般的数据统计分析完全没有问题,会数据透视表和vba也能...
  • 描述性统计分析是关于数据的描述和汇总。它使用两种主要方法:定量方法以数值方式描述和汇总数据。可视化方法通过图表,曲线图,直方图和其他图形来说明数据。一般在数据分析的过程中,拿到数据不会去直接去建模,...
  • 工作中,Excel做的好,也是我们升职加薪的一项软技能。Excel除了常用的表格处理和数据分析,也可以做展示。同样的一个excel, 你比别人做的更加美观和条理清晰,也是工作能力的一种体现!今天给大家介绍一下,怎么...
  • 数据透视表是作为一个数据分析师最基本,也是使用频率最高的一个功能了,我们可以把明细数据从数据库导出来,然后在 Excel 里面透视表,也可以直接在数据库里面透视表,然后将透视结果进行导出。这篇我们来看看 ...
  • 数据透视表是作为一个数据分析师最基本,也是使用频率最高的一个功能了,我们可以把明细数据从数据库导出来,然后在 Excel 里面透视表,也可以直接在数据库里面透视表,然后将透视结果进行导出。这篇我们来看看 ...
  • Excel数据处理与分析实战技巧精粹 附书源码 ISBN:9787115182326 本书在对Excel技术论坛上上百万个提问的分析与提炼的基础上,汇集了用户在使用Excel进行数据处理与分析过程中最常见的需求,通过270多个实例的演示...
  • 为什么越来越多的非程序员白领都开始学习 Python ?他们可能并不是想要学习 Python 去爬取一些网站从而...小明在这家公司任数据分析师,平时都是通过 Excel数据分析的。今天老板丢给他一个任务:下班前筛选出集团
  • 人人都可以简单入门Python、爬虫、数据分析简说Python严选来源:python数据分析之禅作者:小dull鸟Oneoldwatch,likebrief python大家好,我是老表~今天和大家分享的内容是关于Python自动化操作excel一些方法和技巧...
  • 任务83: 项目实战:小型商品进销存管理系统_员工信息查询_实现员工信息统计分析及分页查询 任务84: 项目实战:小型商品进销存管理系统_员工信息查询_实战分组、聚合、过滤与排序 任务85: 项目实战:小型商品进销...
  • 百度竞价开户前面翱翔竞价软件的小编讲解过数据异常的情况如何进行...从技术上分析的话,这就要求我们对excel这样的工具有熟练的应用了。平时我们统计账户的数据汇总之类的工作都需要用到这个工具。基本上我们需要...
  • 但是在日常工作中,Excel也有着它的局限性,以月度数据汇报为例,每月都需重新统计,其实内容还是那些内容,只不过数据要重新复制黏贴,如果要在此基础上,进一步进行数据分析,又要另费一番功夫。这样重复性的...
  • 下图是XXX公司的员工信息表:如果要快速的按照不同的需求完成信息的统计分析,该如何分去了?一、数据透视表:按“部门”、“性别”汇总人数。方法:1、单击任意数据区域。2、【插入】-【数据透视表】,打开【创建...

空空如也

空空如也

1 2 3 4 5 6
收藏数 113
精华内容 45
关键字:

如何用excel做统计分析