精华内容
下载资源
问答
  • 第 第 PAGE 1 页 共 NUMPAGES 1 页 Excel数据...下面就给大家介绍Excel数据分析怎么用? 方法步骤 1本文将以Excel2010版本为例新建并打开excel表格; 2首先添加数据分析插件点击左上角文件按钮出现菜单页面点击选项按钮
  • 用EXCEL数据分析工具进行抽样有二种方法第一种举例EXCEL表格中一列有3000多个数据我想在这3000多个数据中随机抽取200个出来3000多个都是文字的数据在一列里面要随机抽取出200个出来要怎么做呢而且要多次可以取随机的...
  • Excl做数据分析,首先我们先来看看,数据分析的步骤是哪些?1:明确问题;2:理解数据;3:数据清洗;4:构建模型;5:数据可视化。一:明确问题明确诉求是非常关键的一步,只有听清楚了对方的诉求,知道他需要解决的...

    用Excl做数据分析,首先我们先来看看,数据分析的步骤是哪些?

    1:明确问题;

    2:理解数据;

    3:数据清洗;

    4:构建模型;

    5:数据可视化。

    b52784668bca9717e403beb6ee063fe8.png

    一:明确问题

    明确诉求是非常关键的一步,只有听清楚了对方的诉求,知道他需要解决的问题,才能进行分析,

    再次明确诉求目标后,拆解成几个不同纬度的小目标来佐证。

    二:理解数据

    基本概念:

    工作区界面:在工作区最下端;

    行号:在工作区最左侧的一行;

    列号:在工作区最上一列;

    单元格:工作区内表格;

    创建新工作表:符号为+标记。

    54da98ed94d12889f7a9caaf6240dd92.png

    列名:一般有:

    公司全名、公司id、简称、大小、所在商区、职位所属、教育要求、公司所属领域、职位id、职位福利、职位名称、薪水、工作年限要求。

    如何修改列宽?

    1:点击左上角◢符号按钮,(为全选表格);

    2:点击开始里的自动换行;

    3:在列号A上右键弹出这个对话框:

    b0ff825853836e0260dfac6d1dd40dc7.png

    4:在弹出的对话框中,选列宽,修改列宽确定即可。

    8f4ef18f661ea6f45f1103f7020bfb3a.png

    三:清理数据

    就是要把数据变成我们喜欢嗯样子,便于后期的分析数据。

    其步骤为:

    1:选择子集;

    2:列名重命名;

    3:删除重复值;

    4:缺失值处理;

    5:一致化处理;

    6:数据排序;

    7:异常值处理。

    ———

    1:选择子集

    只选择一部分信息作为分析对象,把其中一些数据隐藏,方便分析,

    那么如何隐藏呢?

    在列号右键弹出来的对话框中,点隐藏即可;

    5ec97fb9219e9627a824687b468043ee.png

    如果后面发现要显示出隐藏的单元格,点取消隐藏即可;

    139bb5ff36d5aee4a418f334df59f27b.png

    2:列各重命名:指同意思的称呼隐藏其中一个即可。

    f040bc1533f67f8ef5618aaf5d2558bf.png

    3:删除重复值:(指删除重复数据)

    步骤为:

    点数据→删除重复项内的取消全选→职位ID→确定→右下角保存(必须点保存才能删除生效噢)。

    d6d3cfe43abe6825d9dafa50e6c7f500.png

    四:缺失值处理:

    缺失数量=“取位id”列总数,“城市”列总数;

    要知道缺少多少缺失值信息,就要先统计缺失值!

    点击某一列号,看最下角“计数”与其他列对比各个总数,就可以判断出缺失了多少条,如职位、城市、福利对比。

    4154c06f79587731bcac2f805ac73252.png

    咋处理缺失值?

    #1:手工补:操作:开始→查找和选择→定位条件→空值→确定,后手动补全;

    0f7a7ac32c6e2215fe85ade5fd56b88a.png

    #2:如何一次性补全缺失值?

    手动输入“上海”后,同时按快捷键:ctrl+enter后空白单元格都会变成“上海”。

    a61b5981aa47aa690e740ad105436a41.png

    五:一致化处理:

    对数据一致化处理步骤:

    1:将此列复制一份,防止源数据丢失;

    2:选择数据分列,选对应的分隔符号进行分隔。

    3403915bb8ae4b4d60ae9d25ece152e7.png

    a556504115f048e9e074c026dbd22ccf.png

    704ef59c1482c9f65daf80da0a7e41d0.png

    常见函数:

    1:left:字符串所在单元格位置,从左开始到++位置进行截取;

    2:right:字符串所在单元格位置,从走开始到++位置进行截取;

    3:mid:字符串所在单元格位置,从开始位置截取长度。

    62ea3d4c1efa84cda68551728c514d14.png

    如何自动填充数据?

    1:鼠标放在单元格右下角,自动变成十字架形状;

    2:双击十字架,将函数用到这一整列数据上。

    79e3f5c73ed24298e8bdf58817cf0ced.png

    【如何替换大K到小k?】用查找替换功能就可以啦( '▿ ' )

    目前用公式计算出的最高薪水和最低薪水都是字符串格式,希望可以把他转变为数值,咋整?

    首先,怎么判断这个数字是字符串还是数值,在用插入公式的时候,如果是数字为双引号,就代表是字符串;此时怎么做呢?

    插入空白列,点击复制、选择性粘贴,选择数值、运算为无。

    此时会发现左上角有个小三角形,代表的是字符串类型,如果常见是身份证怎么办呢?我们需要使用分列功能,将他转换为数字!

    #数据排序

    异常值处理

    【使用数据透视表的应用的顺序是什么?】——如研究飞行距离与延误时间是否有关系,有什么关系,看下图:

    f266229363a1b57c6183dd9014b42c12.png

    4b265cd3bb3a4a5931a0ebc0b7885ed6.png

    7e4106cbe82ba0545d1aca40c349acad.png

    1、数据分组(比如按照月份销量排序,按照年份销量排序)

    2、应用函数

    3、组合结果

    796514e660a097dca1f9ba145e012a1f.png

    1afccfc0b3b7f9496365c6b2a33db203.png

    7219eb0a04f625f6ac8af174e7915dbd.png

    虽然业务指标中只有飞行距离和延误时间两个,但是需要区分目的地,不同目的地影响的系数是不一致的;

    【如何使用数据透视表】

    1:建立新工作表;

    2:行选择职位名称,列选择职位名称数量;

    4fc8110c9192515bc5ddb4e9c5991992.png

    ce3414624e06255a1e988324671ae1ba.png

    如何按照职位名称中的数量从大到小进行排序?

    ——如上图所示,这里有两个降序排序方式(按照职位名称、按照计数项(职位名称)),若选择职位名称,则按照左边名称进行A-Z排序;若选择计数项,则按照数量大小排序;

    如何将和数据分析相关的职位给剔除思路:

    1:查找:找到带有“数据分析”“分析师”“数据运营”的词组——find函数,用find, 把 {"数据分析","数据运营","分析师"}这一个常量数组作为查找函数(find)的第一个参数,表示要找什么。查找函数(find)的结果是{1,#VALUE!,3},

    2:统计:三个结果中有几个数值,这里面的数字1和3会被计数函数(count)统计,有数字表示查找到1个结果,这里有两个数字(1,3),就是找到2个结果,所以计数函数(count)运行结果是2,表示找到几个满足的结果。

    3:判断:if函数:通过观察计数函数(count)运行结果,将其中数字不为0的单元格返回“是”,否则返回“否”=IF(COUNT(FIND({"数据分析","数据运营","分析师"},A3))>0,"是","否")

    f93c339b2d55bc14e9c05c3bc887bf90.png

    ce3414624e06255a1e988324671ae1ba.png

    695826280bbba3968e5b89c1da498367.png

    如何用EXCEL的代码实现无关职位的剔除呢?

    d585e9f02049e80c6a7ad915d057a600.png

    四:数据分析或构建模型:

    比如先定义一个问题:去哪个城市工作,工作数量最多——从数据层考虑,行是城市,列是工作数量:(为了后续业务呈现,可以选择加入将不同年限列);同时选择按照降序(城市数量降序);

    89a36eaf90d1be3da04ec86e3a4a94d7.png

    那如何用百分比展示数据呢?选择任意一个数字框选择值显示方式即可。

    那如何使用数据分析工具对一组数据,进行描述统计分析呢?

    需要注意对于单列数据,需要勾选(标志位于第一行),这样这一列的列名才不会影响最终统计结果!

    那如何比较不同城市的平均薪水哦?

    1:先选择城市进入行,平均薪水进入列项,此时会将所有城市的薪水加起来,得到一个数值(默认值汇总依据是求和;),需要将其调整为平均值后,得到这样的图片

    工作经验不同,薪水是怎么变化的呢?

    74ace910d27ef9b877a7091b6642054d.png

    工作经验填入行、平均薪水填入列,然后选择平均薪水里的平均值)。

    好啦,今天就说到这里啦 ,下期见。

    展开全文
  • 这一步是确保机器上的python开发环境,具体的安装过程在此就不在赘述,网上相关资料比较多2、建议安装一个Notepad++,这样写代码比较方便3、在Notepad++中进行相关的设置,因为python对行缩进符比较敏感,Tab键和...

    匿名用户

    1级

    2018-09-04 回答

    下面就详细的讲述整个实现过程。

    1、在计算机上安装python(x,y)2.6.6版本。这一步是确保机器上的python开发环境,具体的安装过程在此就不在赘述,网上相关资料比较多

    2、建议安装一个Notepad++,这样写代码比较方便

    3、在Notepad++中进行相关的设置,因为python对行缩进符比较敏感,用Tab键和space键混合使用,会导致编译错误,程序无法执行;但是一般tab键和Space键所敲出来的空格是隐藏的,为了编辑方便,就需要在Notepad中将空格符显示出来。设置如下图所示。

    4、安装相应的开发包,这里采用的开发包为xlrd-0.9.3包(读取excel)和xlwt-0.7.5包(存写excel,只支持.xls格式,不支持.xlsx格式,如果需要.xlsx格式,请下载更高版本的安装包)。具体的安装过程在此不再赘述,请详见点击打开链接http://blog.csdn.net/dxh0907070012/article/details/23967247。

    5、为所要处理的excel文件单独建立一个文件夹。

    6、具体代码如下:

    [python] view plain copy print?

    #coding=utf-8

    import xlrd

    import xlwt

    import string

    import numpy as np

    import os

    class OperExcel():

    def rExcel(self,inEfile,strfilename,outfile):

    rfile=xlrd.open_workbook(inEfile)

    table=rfile.sheet_by_index(0)

    nrows=table.nrows-1

    ncols=table.ncols

    stationsheet=xlrd.open_workbook('D://rainfall_deal//stationposition.xlsx')

    stationtable=stationsheet.sheet_by_index(0)

    nstnrows=stationtable.nrows-1

    wb=xlwt.Workbook()

    ws=wb.add_sheet('year_month')

    month=['1','2','3','4','5','6','7','8','9','10','11','12']

    for stationindex in range(1,nstnrows):

    eachday_rf=[]

    yearsum=0

    monthday_rf=[]

    eachmon_rf=0

    stncode=stationtable.cell(stationindex,0).value

    #计算每个站点的年降水总量

    for r in range(1,nrows):

    if(table.cell(r,0).value==stncode):

    展开全文
  • 对于初学者而言,有时候并不需要急于苦学R语言等专业工具(当然,学会了就是加分项),因为Excel涵盖的功能足够多,也有很多统计、分析、可视化的插件等,只不过我们平时处理数据的时候对于许多函数都不知道怎么用!...
    Excel是我们工作中经常使用的一种工具,对于数据分析来说,这也是处理数据最基础的工具。很多传统行业的数据分析师甚至只要掌握Excel和SQL即可。对于初学者而言,有时候并不需要急于苦学R语言等专业工具(当然,学会了就是加分项),因为Excel涵盖的功能足够多,也有很多统计、分析、可视化的插件等,只不过我们平时处理数据的时候对于许多函数都不知道怎么用!对于Excel的进阶学习,主要分为两块——一个是数据分析常用的Excel函数,另一个是用Excel做一个简单完整的分析。2b2f2539c842f0037defe500625fef74.png这篇文章主要介绍数据分析常用的43个Excel函数及用途,实战分析将在下一篇讲解。(本文内容为目录式的,介绍每个函数是做什么的、遇到某个问题可以用哪个函数解决等,具体使用方法各位可以自行百度学习。)

    关于函数:

    Excel的函数实际上就是一些复杂的计算公式,函数把复杂的计算步骤交由程序处理,只要按照函数格式录入相关参数,就可以得出结果。如,求一个区域(A1:C100)的和,可以直接用SUM(A1:C100)的形式。并且,对于函数,不用死记硬背,只需要知道应该选取什么类别的函数,以及需要哪些参数怎么用就行了!比如选取字段,用Left/Right/Mid函数......其他细节神马的就交给万能的百度吧!

    函数分类介绍:

    下面根据不同的运用场景,对这些常用的必备函数进行分类介绍。
    01关联匹配类经常性的,需要的数据不在同一个Excel表或同一个Excel表不同sheet中,数据太多,copy起来麻烦还容易出错,如何整合呢?下面这些函数就是用于多表关联或者行列比对时的场景,而且表格越复杂,用起来越爽!1. VLOOKUP功能:用于查找首列满足条件的元素。语法:=VLOOKUP(要查找的值,要在其中查找值的区域,区域中包含返回值的列号,精确匹配或近似匹配 – 指定为 0/FALSE 或 1/TRUE)。(举例:查询姓名是F5单元格中的员工是什么职务)39839aa1692044395383e46d7e5a7ac6.png2. HLOOKUP功能:搜索表的顶行或值的数组中的值,并在表格或数组中指定的行的同一列中返回一个值。语法:=HLOOKUP(要查找的值,要在其中查找值的区域,区域中包含返回值的行号,精确匹配或近似匹配 – 指定为 0/FALSE 或 1/TRUE)。区别:函数HLOOKUP和VLOOKUP都是用来在表格中查找数据,但是,HLOOKUP返回的值与需要查找的值在同一列上,而VLOOKUP返回的值与需要查找的值在同一行上。3. INDEX功能:返回表格或区域中的值或引用该值。语法:= INDEX(要返回值的单元格区域或数组,所在行,所在列)9114771f08933b2e98537bfde94cd2ad.png4. MATCH功能:用于返回指定内容在指定区域(某行或者某列)的位置。  语法:= MATCH (要返回值的单元格区域或数组,查找的区域,查找方式)5. RANK功能:求某一个数值在某一区域内一组数值中的排名。语法:=RANK(参与排名的数值, 排名的数值区域, 排名方式-0是降序-1是升序-默认为0)。6. Row功能:返回单元格所在的行7. Column功能:返回单元格所在的列8. Offset功能:从指定的基准位置按行列偏移量返回指定的引用语法:=Offset(指定点,偏移多少行,偏移多少列,返回多少行,返回多少列)02清洗处理类数据处理之前,需要对提取的数据进行初步清洗,如清除字符串空格,合并单元格、替换、截取字符串、查找字符串出现的位置等。
    • 清除字符串空格:使用Trim/Ltrim/Rtrim
    • 合并单元格:使用concatenate
    • 截取字符串:使用Left/Right/Mid
    • 替换单元格中内容:Replace/Substitute
    • 查找文本在单元格中的位置:Find/Search
    9. Trim功能:清除掉字符串两边的空格10. Ltrim功能:清除单元格右边的空格11. Rtrim功能:清除单元格左边的空格12. concatenate语法:=Concatenate(单元格1,单元格2……)合并单元格中的内容,还有另一种合并方式是&,需要合并的内容过多时,concatenate效率更快。13. Left功能:从左截取字符串语法:=Left(值所在单元格,截取长度)14. Right功能:从右截取字符串语法:= Right (值所在单元格,截取长度)15. Mid功能:从中间截取字符串语法:= Mid(指定字符串,开始位置,截取长度)(举例:根据身份证号码提取年月)7498ce3c5740e9ec522d674c7d00a429.png16. Replace功能:替换掉单元格的字符串语法:=Replace(指定字符串,哪个位置开始替换,替换几个字符,替换成什么)17. Substitute和replace接近,不同在于Replace根据位置实现替换,需要提供从第几位开始替换,替换几位,替换后的新的文本;而Substitute根据文本内容替换,需要提供替换的旧文本和新文本,以及替换第几个旧文本等。因此Replace实现固定位置的文本替换,Substitute实现固定文本替换。(举例:替换部分电话号码)b2e5bb65dedef1630852855228f96bc3.png18. Find功能:查找文本位置语法:=Find(要查找字符,指定字符串,第几个字符)19. Search功能:返回一个指定字符或文本字符串在字符串中第一次出现的位置,从左到右查找语法:=search(要查找的字符,字符所在的文本,从第几个字符开始查找)区别:Find和Search这两个函数功能几乎相同,实现查找字符所在的位置,区别在于Find函数精确查找,区分大小写;Search函数模糊查找,不区分大小写。20. Len功能:文本字符串的字符个数21. Lenb功能:返回文本中所包含的字符数(举例:从A列姓名电话中提取出姓名)6cd67f20a8fffa7b377d618324f7a222.png03逻辑运算类逻辑,顾名思义,不赘述,直接上函数:22. IF功能:使用逻辑函数IF 函数时,如果条件为真,该函数将返回一个值;如果条件为假,函数将返回另一个值。语法:=IF(条件, true时返回值, false返回值)958281053add9427886805a89657e266.png23. AND功能:逻辑判断,相当于“并”。语法:全部参数为True,则返回True,经常用于多条件判断。24. OR功能:逻辑判断,相当于“或”。语法:只要参数有一个True,则返回Ture,经常用于多条件判断。04计算统计类在利用Excel表格统计数据时,常常需要使用各种Excel自带的公式,也是最常使用的一类。(对于这些,Excel自带快捷功能)
    • MIN函数:找到某区域中的最小值
    • MAX函数:找到某区域中的最大值
    • AVERAGE函数:计算某区域中的平均值
    • COUNT函数:计算某区域中包含数字的单元格的数目
    • COUNTIF函数:计算某个区域中满足给定条件的单元格数目
    • COUNTIFS函数:统计一组给定条件所指定的单元格数
    • SUM函数:计算单元格区域中所有数值的和
    • SUMIF函数:对满足条件的单元格求和
    • SUMIFS函数:对一组满足条件指定的单元格求和
    • SUMPRODUCT函数:返回相应的数组或区域乘积的和
    25. MIN功能:找到某区域中的最小值26. MAX函数功能:找到某区域中的最大值27. AVERAGE功能:计算某区域中的平均值28. COUNT功能:计算含有数字的单元格的个数。29. COUNTIF功能:计算某个区域中满足给定条件的单元格数目语法:=COUNTIF(单元格1: 单元格2 ,条件)比如=COUNTIF(Table1!A1:Table1!C100, “YES” ) 计算Table1中A1到C100区域单元格中值为”YES”的单元格个数(举例:统计制定店铺的业务笔数)5a222c2be11ab4ce78edbda01e7ed9e3.png30. COUNTIFS功能:统计一组给定条件所指定的单元格数语法:=COUNTIFS(第一个条件区域,第一个对应的条件,第二个条件区域,第二个对应的条件,第N个条件区域,第N个对应的条件)比如:=COUNTIFS(Table1!A1: Table1!A100, “YES”,Table1!C1: Table1!C100, “NO” ) 计算Table1中A1到A100区域单元格中值为”YES”,而且同时C区域值为”NO”的单元格个数31. SUM计算单元格区域中所有数值的和32. SUMIF功能:求满足条件的单元格和语法:=SUMIF(单元格1: 单元格2 ,条件,单元格3: 单元格4)(举例:计算一班的总成绩)558ee6ccce6e07be9dc0d624f5c4ea39.png32. SUMIFS功能:对一组满足条件指定的单元格求和语法:=SUMIFS(实际求和区域,第一个条件区域,第一个对应的求和条件,第二个条件区域,第二个对应的求和条件,第N个条件区域,第N个对应的求和条件)。比如=SUMIFS(Table1!C1:Table1!C100,Table1!A1: Table1!A100, “YES” ,Table1!B1:Table1B100, “NO” ) 计算Table1中C1到C100区域,同时相应行A列值为”YES”,而且对应B列值为”NO”的单元格的和。33. SUMPRODUCT功能:返回相应的数组或区域乘积的和语法:=SUMPRODUCT(单元格1: 单元格2 ,单元格3: 单元格4)比如:=SUMPRODUCT(Table1!A1:Table1!A100, Table2!B1Table2!B100) 计算表格1的A1到A100与表格2的B1到B100的乘积和,即A1*B1+A2*B2+A3*B3+…34. Stdev统计型函数,求标准差。35. Substotal语法:=Substotal(引用区域,参数)汇总型函数,将平均值、计数、最大最小、相乘、标准差、求和、方差等参数化,换言之,只要会了这个函数,上面的都可以抛弃掉了。36. Int/Round取整函数,int向下取整,round按小数位取数。round(3.1415,2)=3.14 ;round(3.1415,1)=3.105时间序列类专门用于处理时间格式以及转换。37. TODAY返回今天的日期,动态函数。38. NOW返回当前的时间,动态函数。39. YEAR功能:返回日期的年份。40. MONTH功能:返回日期的月份。41. DAY功能:返回以序列数表示的某日期的天数。42. WEEKDAY功能:返回对应于某个日期的一周中的第几天。默认情况下,天数是1(星期日)到 7(星期六)范围内的整数。语法:=Weekday(指定时间,参数)43. Datedif功能:计算两个日期之间相隔的天数、月数或年数。语法:=Datedif(开始日期,结束日期,参数)文章来源于简书,版权归作者所有。·END·见微知著,数析万象!请扫码联系我们87980498d4a9fc835da657b22e22b876.png往期内容推荐:
    • 从0到1:Excel数据透视表10招轻松入门!
    • 7个Python特殊技巧,助力数据分析工作
    • 美观实用!用 Python 做交互式图形!
    展开全文
  • 有一本叫做《Excel营销数据分析宝典》,看了之后感觉真的很好,适合在企业工作的同志们,深度还可以,但是实用性很强,我根据自己的学习,然后把里面一些好用的写出来,算是对自己的考试了,发现无法分享附件,...

    b5621fa547b2db4833ed5140f60424e0.png

    有一本叫做《Excel营销数据分析宝典》,看了之后感觉真的很好,适合在企业工作的同志们用,深度还可以,但是实用性很强,我根据自己的学习,然后把里面一些好用的写出来,算是对自己的考试了,发现无法分享附件,所以需要的话再跟我联系吧。

    弄这个也是因为我也不会什么代码,而且excel的功能强大,大家都在用,所以我用可视化的功能做出来这个,希望各位看官笑纳。

    这次是通过61位专家的打分,将专家分为4类,并试着分析他们的打分行为特点。以下为此次聚类操作的流程图。w

    8ff7495c32369b1d6d4a52f14419a0b8.png

    一、数据处理

    首先是数据,数据来源是一份真实的打分表,里面包括61位专家对100余个项目的977份打分,大概一个专家十几份。我猜这时候有人要说了,这些专家打的项目都不一样,专业也不一样,怎么能一起来做比较,所以呢,我这次是从各专家的打分特点出发,然后将将他们分类,忽略掉了各组项目之间的不同,就像朴素贝叶斯一样,一个简单的假设,我们看的是最后结果嘛。

    先上数据,这个就是经过处理的源数据,0分都是没有打分的,意思是不推荐该项目通过本轮评审,所以,以后处理数据应该根据实际情况,可以将这个没打分用该项目平均分,或者其他算法来填充。

    e00e769b1ad6680cf6f04d0beeb13860.png

    接下来用数据透视表来求各位专家的大打分平均值和标准差。

    1384643ffb0bb98ea27966d408492bb8.gif

    二、对表格数据进行计算并搭建模型

    对61位专家的平均值和标准差进行标准化处理,先求出所有专家打分平均分的平均分和标准差,再求出所有专家打分标准差的平均值和标准差。对打分平均值求均值和标准差的公式为“=AVERAGE(F12:F72)”和“=STDEV.P(F12:F72)”,同理对打分标准差求均值和标准差的公式为“=AVERAGE(G12:G72)”和“=STDEV.P(G12:G72)”。

    实际这里面选的这两个维度就是:1.专家打分的高低水平,就是专家打分整体较高或较低2.专家打分的稳定性,就是专家打分稳定或波动较大

    ce1165b2acf3d46fb01cdbe2ab834a56.gif

    然后对每个专家打分平均分的数据进行标准化,即用每个专家的打分平均值与61位专家的打分的平均值相减再除以标准差,再用每个专家的打分平均值的标准差61位专家的打分标准差的平均值相减再除以标准差。H12、I12公式为:“=(F12-$F$1)/$F$2”和”=(G12-$G$1)/$G$2“,再粘贴到第72行。

    b74eeb8ff0b186af80783387790e2914.gif

    然后考虑分类的问题,暂时先拟定分为4类,将$D$11:$I72设置名称为“数据源”,用vlookup函数通过序号匹配到4个分类的信息,专家名称、Z-打分平均值、Z-标准差分别为“=VLOOKUP($I3,数据源,2,FALSE)”、“=VLOOKUP($I3,数据源,5,FALSE)”、“=VLOOKUP($I3,数据源,6,FALSE)”,并复制粘贴到第6行,此处初始随便选择4个分类的中心点(序号分别为1、2、3、4):

    7b531d4e483da696c746771808819030.gif

    在Z-标准差后添加4列数据,分别计算是数据到分类1、2、3、4点的欧氏距离,公式为“=SUMXMY2($H12:$I12,$K$3:$L$3)”,此公式是两组数据对应位置差的平方和,也就是求得欧氏距离。以此类推K12 L12、M12“公式分别为”=SUMXMY2($H12:$I12,$K$4:$L$4)“、”SUMXMY2($H12:$I12,$K$5:$L$5)“、”=SUMXMY2($H12:$I12,$K$6:$L$6)“,分别从第12行粘贴到第72行。

    912c623a34db9d3c8a9d8b2dbc855069.gif

    接下来求最小的距离,在旁边加一行,选取这4个距离中最小的一个,在N12中输入”=MIN(J12:M12)“,并在上方找一处汇总这61个专家打分点距离分类点欧氏距离的总和”=SUM(N12:N72)“

    469f1290ac89c5e1b1011c76f0d029e9.gif

    三、规划求解得到最终结果

    下面开始最终计算。打开规划求解选项,设置目标为”$N$7“,选择最小值;可改变单元格选择”$I$3:$I$6“,就是分类点的序号所在位置;约束条件,分类序号因为只有61个专家,因此肯定取值范围是[1,61],并且要求是整数否则无法匹配;计算方式选择”演化“。

    978c510ca3396927dfa8f4c46116bdd2.gif

    最终结果:原有的距离之和从29降到了15.56,分类也从1、2、3、4变成了11、57、1、50,就是四个分类中心的序号。

    1b070db0a9a440dbdfb364e1be8341d6.png

    我们将所有的专家按四个中心分类,此例子中以”一、二、三、四“为例。编好分类号后在O12中输入”=INDEX($M$3:$M$6,MATCH(N12,J12:M12,0),1)“并粘贴到O72,这样每个专家是哪一类就很清楚了。

    63eb592635d1d334f9c7b82a0e3ba7a1.gif

    四、题外话

    那再说一句题外话吧,就是分类的四类都有不太一样的特质,分别是:

    一,平均分比一般稍低、波动一般(郭56);

    二,平均分较低,波动较高(包21);

    三,平均分比一般稍高,波动也较低(赵26);

    四,平均分很高、波动很低(于28)。

    根据这4个分类来看,第一类和第三类可能比较相似,明显能分辨出来第四类是老好人,分又高又稳定,第二类我觉得是有偏见的组或者比较严格,这个前面讲过,如果不推荐就打0分,所以不推荐的项目多的会产生很大的标准。

    以下是这四位同志的对应的打分情况图

    第一类,感觉中规中举,高分比低分稍微多一些,一般分数在55-90之间;

    fa4c83f2b41fa8c5cdfea94d5c67353f.png

    第二类,上上下下的感觉,窃笑了,这个顺序我是没拍过,倒出来就这个顺序,很好玩;

    7d4573327f8ac17c792adf480269d3ed.png

    第三类,是不是很熟悉,跟第一类有点像,差不多分数在55-90之间,但是0分给的比第一组少,这也证明了应该将分类改成3组的原因把,毕竟他们还是很相似的;

    c5b6ecac4d38d7ffdae6afd76b356415.png

    第四类,最有意思的一类,我定义为”老好人“,没有0分,所有项目都在及格线以上;

    271a9a09934d5f667c27f559a2d62c47.png

    五、想说的话

    以上就是我针对手头有的数据进行的一次数据分析实验,有什么问题大家都可以提出来,这样我就好改啊。在写的时候才知道有哪些问题是需要深入发掘和认真思考的,真的是一次学习的过程。

    最后还是要谢谢《Excel营销数据分析宝典》这本书,实实在在的。全文皆为自己手敲,如果真的有人愿意转载还请注意版权哦。

    展开全文
  • 今天举例的数据继续沿用昨天做出来的结果,至于这组数据还要接着多久~~可能要混到我讲不下去为止吧~~~我们通过两个不同的拟合公式得到了两组不同的残差值,数据情况如下:有没有觉得看上面那张散点图有点糊啊?...
  • 数据分析的步骤:第一步:明确问题(1)在哪些城市找到数据分析师的机会比较大(2)数据分析师的薪水如何(3)根据工作经验不同,数据分析师的薪酬是怎么变化的2. 第二步:理解数据列名(字段):在excel表格中,可以...
  • 谁知道 正交实验数据excel处理方法?应用方式如下:正交试验的极差分析法又称直观分析法, 极差分析法又称直观分析法,它具有计 算简单、直观形象、简单易懂等优点, 算简单、直观形象、简单易懂等优点,是正交...
  • 2016-07-08 00:25赵飞虎 客户经理一、Excel分析性测试、复核中的运用注册会计师在分析审计风险确定重点审计领域、重要性水平和重大异常经济业务...如果手工操作,不但计算量大且易出错,而使用Excel则方便快捷不...
  • 这年头,怎么样才能在职场中吃香...当然,如果说专业的数据分析工具对非IT人士不友好,没关系我们还有最接地气的——Excel。 重新认识Excel同样是“精通Excel”,为什么人与人之间的差别这么大?别人的Excel高度自动...
  • 使用python3读取处理excel表的数据内容如何对内容求平均值先说下概述:平均合平的值。(a1 a2 ……an)/n为a1,a2,……,an术平均值。简单算术平均数。有这么一组数字10、20、30、40、50那么它们的算术平均值是(10 ...
  • 题记:22:08分,我决定还是写一篇,速度写一篇,赶紧睡觉。最近太忙,痛恨疫情,疫情来了之后真的变成了997工作了。好吧,看看极速下,半小时能不能发一篇原创呢~...【一般怎么做】上学时候一般SPSS等来做,常见...
  • 非要Python做数据分析?如果你对数据分析有所了解,一定听说过一些亲民的工具如Excel、Tableau、PowerBI等,都能成为数据分析的得力助手。但它们的不足也是显而易见的:操作繁琐,复用性差,功能相对局限单一。 ...
  • 数据分析师的工资水平怎么样?做数据分析师对学历专业要求怎么样?一、字段信息城市职位名称职位类型公司名称公司规模学历要求所属领域薪资工作年限要求数据预览二、数据清洗 首先插入表格,这样后续的所有操作都会...
  • EXCEL数据如何做离散性分析纠错。离散不是均值抄AVEDEV……=AVEDEV(A1:A100)算出来的是A1:A100的平均数。离散是指各项目间指标袭的离散均值(各数值的波动情况),数值较低表明项目间各指标波动幅百度小,数值高...
  • 本人零基础,希望具体操作步骤,比如说下面数据进行聚类分析 # A tibble: 13 x 9 `1` `12` `8` X__1 X__2 X__3 X__4 X__5 X__6 <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> 1 <NA> c1 c2 c3 c4 c5 c6 c7 ...
  • 一类是会爬虫但不清楚怎么进一步做数据分析,一类是平常 Excel 做分析但不太会 Python 分析的。如果你也是这样,那本文会很适合你,建议先收藏。 选择VBA还是Python取决于你的需求 如果想把 Excel 与数据库、...
  • 数据分析工具千千万,怎么又能少得了Excel~预测工作表预测工作表是Excel2016版添加的一个新功能,预测使用基于现有时间的数据和指数平滑(ETS)算法的AAA版本来预测未来值。下图中,天猫双十一从10年至今,销售额从9亿...
  • 单位里使用sharepoint来记录员工创建的知识库条目、任务记录等数据怎么样能够连接到sharepoint 自身获取这些记录,进行数目的统计和生成月报数据?PowerPivot for Excel还是PerformancePoint?
  • 对于初学者而言,因为Excel涵盖的功能足够多,有时候并不需要急于苦学R语言等专业工具,也有很多统计、分析、可视化的插件等,只不过我们平时处理数据的时候对于许多函数都不知道怎么用!如何使用EXCEL进行数
  • 对于初学者而言,有时候并不需要急于苦学R语言等专业工具(当然,学会了就是加分项),因为Excel涵盖的功能足够多,也有很多统计、分析、可视化的插件等,只不过我们平时处理数据的时候对于许多函数都不知道怎么用!...
  • 因为excel数据既不像txt那样,随意一种语言、脚本,写个函数就能把数据读出来分析。也不像JSON这种开源的数据格式,有N多的开源库来读取。就算没有,知道数据格式,自己写个库也自己不至于太难。要想读取excel的...
  • 根据每个部分需要用到的工具,Python数据分析的学习路径如下:2、利用Python读写数据Python读写数据,主要包括以下内容:我们以一小段代码来看:可见,仅需简短的两三行代码即可实现Python读入EXCEL文件。...
  • 数据可视化1、提出问题,明确数据指标及对应的计算公式:月均消费次数、月均消费金额、客单价、消费趋势2、理解数据(1)读取Excel数据fileNameStr = 'C:/数据科学/猴子数据分析学院/数据分析(高级)(Python)/第3关:...
  • 根据每个部分需要用到的工具,Python数据分析的学习路径如下:2、利用Python读写数据Python读写数据,主要包括以下内容:我们以一小段代码来看:可见,仅需简短的两三行代码即可实现Python读入EXCEL文件...
  • 数据分析工具千千万,怎么又能少得了Excel~预测工作表预测工作表是Excel2016版添加的一个新功能,预测使用基于现有时间的数据和指数平滑(ETS)算法的AAA版本来预测未来值。下图中,天猫双十一从10年至今,销售额从9...
  • python做数据分析是一件再合适不过的事情,我们举个简单的例子。例如收集数据的方法是使用问卷,实验软件(例如,PsychoPy,OpenSesame)和观察。当问卷和实验软件使用数字应用程序时,我们当然也会以数字文件格式...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 449
精华内容 179
关键字:

excel数据分析怎么用