精华内容
下载资源
问答
  • SPSS因子分析案例

    万次阅读 多人点赞 2018-01-14 20:43:40
    一、SPSS中的因子分析。 具体操作步骤: (1)定义变量:x1-财政用于农业的支出的比重,x2-第二、三产业从业人数占全社会从业人数的比重,x3-非农村人口比重,x4-乡村从业人员占农村人口的比重,x5-农业总产值占农林牧...

    PS:请见文末的打赏选项

    一、SPSS中的因子分析。

    具体操作步骤:

    (1)定义变量:x1-财政用于农业的支出的比重,x2-第二、三产业从业人数占全社会从业人数的比重,x3-非农村人口比重,x4-乡村从业人员占农村人口的比重,x5-农业总产值占农林牧总产值的比重,x6-农作物播种面积,x7—农村用电量。

     

    (2)导入数据:file-open-data

     

     

     

    (3)变量标准化Analyze-Descriptive Statistics-Descriptives

     

    勾选Save standardized values as variables保存变量,再点击ok,就完成了对变量的标准化。

    (4)因子分析

    Analyze—Dimension Reduction—Faction

     

    点击右侧的Description选项,选择Statistics选项组中的initial solution,勾选Correlation Matrix选项组中的Coefficients和KMO and Bartlelts test of sphericity,点击Continue。

     

    点击右侧Extraction选项,其中Method选Principal components,Analyze选择Correlation matrix,Display中选择Unrotated factor solution,Extract如图,点击Continue.

     

    点击右侧Rotation选项,勾选Method选项组中的Varimax,Display中的两个选项都勾选,点击Continue。

    点击右侧Scores,如图勾选,点击点击Continue。

    最后点击options,默认

     

    (5)结果分析

    1.KMO and Bartlett's的检验结果图

    KMO and Bartlett's Test

    Kaiser-Meyer-Olkin Measure of Sampling Adequacy.

    .725

    Bartlett's Test of Sphericity

    Approx. Chi-Square

    255.159

    df

    21

    Sig.

    .000

    可以从此表中看出KMO统计量为0.725,大于最低标准,说明适合做因子分析,Bartlet球形检验,p<0.001,适合做因子分析。

    2.主成分列表

    Total Variance Explained

    Component

    Initial Eigenvalues

    Extraction Sums of Squared Loadings

    Rotation Sums of Squared Loadings

    Total

    % of Variance

    Cumulative %

    Total

    % of Variance

    Cumulative %

    Total

    % of Variance

    Cumulative %

    1

    5.920

    84.572

    84.572

    5.920

    84.572

    84.572

    3.308

    47.261

    47.261

    2

    .653

    9.330

    93.902

    .653

    9.330

    93.902

    3.265

    46.641

    93.902

    3

    .249

    3.559

    97.462

     

     

     

     

     

     

    4

    .126

    1.798

    99.259

     

     

     

     

     

     

    5

    .042

    .595

    99.854

     

     

     

     

     

     

    6

    .008

    .108

    99.962

     

     

     

     

     

     

    7

    .003

    .038

    100.000

     

     

     

     

     

     

    Extraction Method: Principal Component Analysis.

    可以从此表中看出前2个主成分特征值较大,它们的累积贡献率达到了93.902%,故选择前2个公共因子。

     

    3.公因子方差比结果图

    Communalities

     

    Initial

    Extraction

    Zscore(财政用于农业的支出的比重)

    1.000

    .906

    Zscore:  第二、三产业从业人数占全社会从业人数的比重(%)

    1.000

    .940

    Zscore:  非农村人口比重(%)

    1.000

    .979

    Zscore(乡村从业人员占农村人口的比重)

    1.000

    .977

    Zscore(农业总产值占农林牧总产值的比重)

    1.000

    .943

    Zscore:  农作物播种面积(千公顷)

    1.000

    .909

    Zscore:  农村用电量(亿千瓦时)

    1.000

    .918

    Extraction Method: Principal Component Analysis.

    结果显示,每一个指标变量的共性方差都在0.9以上,说明这2个公共因子能够很好地反应原始各项指标变量的绝大部分内容。

    4.载荷散点图

    从载荷散点图可以看出,第一公共因子能很好解释变量x1-财政用于农业的支出的比重,变量x5-农业总产值占农林牧总产值的比重,第二公共因子能很好地解释变量x2-第二、三产业从业人数占全社会从业人数的比重,x3-非农村人口比重,x4-乡村从业人员占农村人口的比重,x6-农作物播种面积,x7—农村用电量。

    5.旋转后的因子载荷图

    Component Score Coefficient Matrix

     

    Component

    1

    2

    Zscore(财政用于农业的支出的比重)

    .507

    -.697

    Zscore:  第二、三产业从业人数占全社会从业人数的比重(%)

    .120

    .112

    Zscore:  非农村人口比重(%)

    .170

    .066

    Zscore(乡村从业人员占农村人口的比重)

    .072

    .164

    Zscore(农业总产值占农林牧总产值的比重)

    .026

    -.257

    Zscore:  农作物播种面积(千公顷)

    .691

    -.510

    Zscore:  农村用电量(亿千瓦时)

    .247

    -.022

    Extraction Method: Principal Component Analysis.

     Rotation Method: Varimax with Kaiser Normalization.

     Component Scores.

    经过旋转后,农作物播种面积(千公顷)、农村用电量(亿千瓦时)在因子一上有较大载荷,财政用于农业的支出的比重、农业总产值占农林牧总产值的比重咋因子二上有较大载荷。故因子一可称为农业基本发展条件,因子二可称为政府支持情况。

    6.历年农民收入总得分降序表

    其中F=f1*84.572/93.902+f2*9.330/93.902

    年份

    f1

    f2

    总分F

    2004

    1.46067

    0.23231

    1.338621494

    2005

    1.24137

    1.08005

    1.225341421

    1998

    1.44755

    -1.0258

    1.20180065

    1999

    0.88995

    -0.04301

    0.797252115

    2000

    0.83304

    0.28099

    0.778188916

    2001

    0.79886

    0.42652

    0.761864705

    2002

    0.56754

    0.85163

    0.595766872

    2003

    0.29613

    1.3662

    0.402450985

    1997

    0.35599

    0.15899

    0.336416295

    1996

    0.141

    0.023

    0.129275649

    1986

    0.0712

    -2.97824

    -0.231789023

    1991

    -0.35654

    -0.496

    -0.370396593

    1995

    -0.53681

    0.53338

    -0.430477092

    1992

    -0.46086

    -0.24669

    -0.439580303

    1994

    -0.68793

    0.39726

    -0.580106709

    1990

    -0.70907

    -0.29782

    -0.66820865

    1993

    -0.78235

    0.24344

    -0.680428628

    1987

    -0.88133

    -1.73639

    -0.966287826

    1989

    -1.23195

    0.22253

    -1.087434458

    1988

    -2.45646

    1.00764

    -2.112270813

     

    数据:

    年份

    财政用于农业的支出的比重

    第二、三产业从业人数占全社会从业人数的比重(%)

    非农村人口比重(%)

    乡村从业人员占农村人口的比重

    农业总产值占农林牧总产值的比重

    农作物播种面积(千公顷)

    农村用电量(亿千瓦时)

    1986

    13.43

    29.5

    17.92

    36.01

    79.99

    150104.07

    253.1

    1987

    12.2

    31.3

    19.39

    38.62

    75.63

    146379.53

    320.8

    1988

    7.66

    37.6

    23.71

    45.9

    69.25

    143625.87

    508.9

    1989

    9.42

    39.9

    26.21

    49.23

    62.75

    146553.93

    790.5

    1990

    9.98

    39.9

    26.41

    49.93

    64.66

    148362.27

    844.5

    1991

    10.26

    40.3

    26.94

    50.92

    63.09

    149585.8

    963.2

    1992

    10.05

    41.5

    27.46

    51.53

    61.51

    149007.1

    1106.9

    1993

    9.49

    43.6

    27.99

    51.86

    60.07

    147740.7

    1244.9

    1994

    9.2

    45.7

    28.51

    52.12

    58.22

    148240.6

    1473.9

    1995

    8.43

    47.8

    29.04

    52.41

    58.43

    149879.3

    1655.7

    1996

    8.82

    49.5

    30.48

    53.23

    60.57

    152380.6

    1812.7

    1997

    8.3

    50.1

    31.91

    54.93

    58.23

    153969.2

    1980.1

    1998

    10.69

    50.2

    33.35

    55.84

    58.03

    155705.7

    2042.2

    1999

    8.23

    49.9

    34.78

    57.16

    57.53

    156372.81

    2173.45

    2000

    7.75

    50

    36.22

    59.33

    55.68

    156299.85

    2421.3

    2001

    7.71

    50

    37.66

    60.62

    55.24

    155707.86

    2610.78

    2002

    7.17

    50

    39.09

    62.02

    54.51

    154635.51

    2993.4

    2003

    7.12

    50.9

    40.53

    63.72

    50.08

    152414.96

    3432.92

    2004

    9.67

    53.1

    41.76

    65.64

    50.05

    153552.55

    3933.03

    2005

    7.22

    55.2

    42.99

    67.59

    49.72

    155487.73

    4375.7

     

     

     

    展开全文
  • IBM SPSS数据分析与挖掘实战案例精粹_案例光盘 IBM SPSS数据分析与挖掘实战案例精粹_案例光盘 IBM SPSS数据分析与挖掘实战案例精粹_案例光盘 IBM SPSS数据分析与挖掘实战案例精粹_案例光盘
  • 《IBM SPSS数据分析与挖掘实战案例精粹》以IBM SPSS Statistics 20.0和IBM SPSS Modeler 14.1为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,...
  • 基于SPSS数据分析,人民大学,薛薇版
  • 产品运营数据分析SPSS数据分组案例 当我们的样本量过大,譬如以前讲过的,EXCEL2010最大只支持1048576行、16384列,尤其是当行数大于30万,一般的办公电脑处理都比较吃力,所以推荐数据分析师们做大数据量处理,...

    产品运营数据分析—SPSS数据分组案例

     

    当我们的样本量过大,譬如以前讲过的,EXCEL2010最大只支持1048576行、16384列,尤其是当行数大于30万,一般的办公电脑处理都比较吃力,所以推荐数据分析师们做大数据量处理,还是用SPSS。

    今天分享SPSS的数据分组,在SPSS里面,这个功能路径是:【转化——重新编码为相同变量】、【转化——重新编码为不同变量】,常用的是第二个,不会覆盖原有的变量数据。

    第一步,数据录入

    继续沿用之前的EXCEL数据文档,把数据拷贝到SPSS软件,设定好变量名称,如下图:

    数据视图:


    变量视图


    这里注意将【PV】这个变量定义为【数值型】,选择了【逗号】表示用千分位区分;

    第二步,进入编码功能


    第三步,选择编码变量

    这里选择【页面PV】,点击红圈中的箭头,选入右边的变量框;


    第四步,定义输出变量

    这里定义的新变量名是【PV_G】,标签是【PV分组】;


    第五步,设定旧值和新值

    入口是上图中的【旧值和新值】,进入后,看到下面的界面,左右两大部分,左边是原有的旧值设定,右边是编码后产生的新值;数据分析师培训

    开始编码,编码标准,按照昨天的分类,如下图:


    指定旧值范围

    第一组,是0-10万,大于等于0,小于10万,因此,旧值部分是:从最小值到99999;


    注意这里的输出变量名称是【0-10万】,下面有个勾选【输出变量为字符串】,并指定宽度,默认是8,我们定义为12,为何不是8,后面看下结果,就知道了。

    定义好之后,点击【添加】,旧值和新值就定义好了,依次定义各个分组的数值。


    最后一组,我们通常定义为【范围,从值到最高】,不至于遗漏数据,正如第一组,我们会定义为【范围,从最低值】。


    定义好旧值新值,点击【继续】,返回设定页面,这时候,【确定】按钮激活,点击后,编码完成。


    第六步,编码完成http://www.cda.cn/view/16368.html


    如图,数据分组后的界面,注意这里有两个分组变量,第一个是【PV_G】,这是字符串宽度为8的时候,第二个是【PV_GROUP】,字符串是宽度为12,区别和原因,大家自己想想就明白。想了解更多关于数据分析师方面的知识,到cda数据分析师官网

    数据分组后的变量视图

    转载于:https://www.cnblogs.com/amengduo/p/9587724.html

    展开全文
  • 资源名称:IBM SPSS数据分析与挖掘实战案例精粹内容简介:《IBM SPSS数据分析与挖掘实战案例精粹》以IBM SPSS Statistics 20.0和IBM SPSS Modeler 14.1为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究...
  • 本文件为《IBM SPSS数据分析与挖掘案例精粹》一书配套光盘资料
  • IBM+SPSS数据分析与挖掘实战案例精粹 PDF版本 本书以 IBM SPSS MODELER 为工具,提供了医疗、金融、保险、汽车、互联网等多个行业的数据分析/数据挖掘案例分析
  • 数据分析经典教材 SPSS案例和实践结合,简单易读,强推
  • 《IBM SPSS数据分析与挖掘实战案例精粹》以IBM SPSS Statistics 20.0和IBM SPSS Modeler 14.1为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,...
  • 关于某公司 474 名职工综合状况的统计分析报告 一 数据介绍 本次分析数据为某公司 474 名职工状况统计表其中共包含 十一变量 分别是id 职工编号gender( 性别 ) bdate( 出生日期 ) edcu 受教育水平程度jobcat 职务...
  • 关于某公司 474 名职工综合状况的统计分析报告 一 数据介绍 本次分析数据为某公司 474 名职工状况统计表其中共包含 十一变量 分别是id职工编号gender( 性别)bdate(出生日期) edcu受教育水平程度 jobcat 职务等级...
  • spss案例分析数据

    2008-12-18 22:31:57
    spss数据案例,可以下载使用.多一些分析的经验
  • ibm spss数据分析与挖掘实战案例精粹(张文彤),用的是spss20和model14,案例很实用!!
  • IBM SPSS数据分析与挖掘实战案例精粹 附带的光盘资源,共享给大家
  • spss和数据处理案例及其数据分析,帮你更快更好的实现数据处理
  • IBM SPSS数据分析与挖掘实战案例精粹-随书数据 案例
  • 《IBM_SPSS数据分析与挖掘实战案例精粹》豆瓣链接https://book.douban.com/subject/21477429/,因该书PDF版本超过我能上传的文件大小110M的限制,所以分享的是网盘下载链接,分享的PDF版本文字清晰,书有目录,但...
  • 张文彤、钟云飞《IBM+SPSS数据分析与挖掘实战案例精粹》随书光盘
  • spss顾客偏好分析案例数据.sav 汽车销售简单小例子
  • spss数据分析教程 包括: SPSS 22技术教学视频(视频) SPSS+22.0统计分析从入门到精通(视频+数据) SPSS统计分析大全(视频+数据+ppt) SPSS统计分析与应用(视频+数据) SPSS统计分析从零开始学(视频+数据+ppt...
  • 本光盘提供了本书中所有案例涉及到的数据及IBM SPSS Modeler数据流,由于IBM SPSS Modeler数据流一律使用绝对路径来读取和导出数据文件,为了可以重现数据流的运行,请把光盘中的“SPSS案例数据”文件夹直接拷贝到C...
  • SPSS 案例数据

    2017-03-07 10:52:14
    这是IBM SPSS 数据分析与挖掘实战案例精粹(清华大学出版社)的配套案例数据。是学习SPSS的不二之选。
  • SPSS统计分析案例:无空白列重复正交试验设计方差分析 前面有讲过 SPSS正交试验设计及其方差分析一篇文章,包含了一个典型的正交试验案例。然而在实际应用当中,主观客观条件复杂多变,在试验设计中就要求能够灵活...

    SPSS统计分析案例:无空白列重复正交试验设计方差分析

    前面有讲过 SPSS正交试验设计及其方差分析 一篇文章,包含了一个典型的正交试验案例。然而在实际应用当中,主观客观条件复杂多变,在试验设计中就要求能够灵活控制影响因素和水平的个数,以及试验的次数。

    正交设计招数虽只有一招,但却变化多端,有多重不同应用方式,无空白列重复正交设计就是其中的一个变式。

    案例数据

    某制药厂主要生产胃蛋白酶,为了提高生产效率,拟从生产工艺上进行优化改进,你被要求负责该项目。根据多年的生产经验,你认为影响生产效率的因素主要包括A水解温度,B水解时间,C加盐量,D烘房温度,根据目前现有的生产条件,这几个因素能调整的参数大概只有三个水平,以残留蛋白作为质量指标,你决定通过正交试验来解决当前的问题。

    数据来源:《SPSS13在空白列正交试验设计及其数据处理中的应用》

    选择正交表

    各因素只能调整3个水平,主要有4个因素,因此最先考虑到选用L9(34)的四因素三水平正交表,由于参数水平客观条件的限制,L16(45)正交表可以不用考虑了。

    选定L9(34)正交表,遇到一个问题:因素排满,没有空白列用于统计实验误差,怎么呢?所以必须通过重复试验来统计实验误差,你决定每个组合方案重复3次。因此,本实验最终需要27次,将得到27组数据。

    SPSS正交试验数据录入格式

    网上有不少同学提到这个问题,其实数据结果组织形式和无重复试验的格式是一样的,只需要顺次增加行即可。

    方差分析步骤

    菜单操作:

    分析→一般线性模型→单变量

    因变量:输入残留蛋白

    固定因子:输入水解温度,水解时间C加盐量,烘房温度

    模型选项卡:以上四个影响因素作为主效应进行分析

    方差分析结果:

    四个影响因素的sig值均小于0.01,表明四个因素对生产胃蛋白酶都有极显著的影响,验证了最初你的经验。但这还不是我们最终的目的,我们需要得到提高生产效率的最优化工艺组合,直白一点,就是你必须找到每个影响因素最好的那个水平参数。

    这个问题在上一篇文章中就有说明,可采用多重比较的方法就行可视化比较。

    具体做法

    多重比较选项卡:将四个具有显著影响的因素依次输入到右侧的“两两比较检验”框中,选择“duncan”法来计算。

    单从数据分析的结果来看,最优工艺组合为:A3B3C2D1。值得讨论的问题:水解时间、加盐量两个因素趋势图有些异常,可能和其他两个因素存在交互作用,留给大家讨论。

    转载于:https://www.cnblogs.com/amengduo/p/9586846.html

    展开全文
  • SPSS统计分析基础教程》第2 版案例数据
  • 本书为数据猿推出的《每周一本书》栏目丛书。欢迎大家推荐好书给我们,让更多人受益。【数据猿导读】无论你是需要提升实战能力的数据分析专业人员,还是在市场营销、金融、财务和人力...
        
    640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

    本书为数据猿推出的《每周一本书》栏目丛书。

    欢迎大家推荐好书给我们,让更多人受益。

    【数据猿导读】无论你是需要提升实战能力的数据分析专业人员,还是在市场营销、金融、财务和人力资源管理中需要应用数据分析的人士,抑或是从事咨询、科研等工作的专业人士,这本书都值得一看


    编辑 | sharon

    官网 | www.datayuan.cn

    微信公众号ID | datayuancn


    学习的时候,案例最容易被接受,它直观、生动、可借鉴性强,无论是课堂授课,还是自我学习,案例都是必不可缺的。本周,小猿君为大家推荐一本案例集锦,同时它也是一本大数据分析挖掘领域实操类的书籍,由国内两位资深的大数据分析和挖掘专家所著,豆瓣评分9.0。


    无论你是需要提升实战能力的数据分析专业人员,还是在市场营销、金融、财务和人力资源管理中需要应用数据分析的人士,抑或是从事咨询、科研等工作的专业人士,这本书都值得一看,同时这本书也适合各专业的本科和研究生作为学习数据分析应用的参考书,从初学者到专家各个级别的数据分析人员都可以通过这本书有所获益。


    640?wx_fmt=png


    内容简介


    《IBM SPSS数据分析与挖掘实战案例精粹》以IBM spss statistics 20.0和IBM spss modeler 14.1为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析、挖掘案例,基于实战需求,详细讲解整个案例的完整分析过程,并将模型和软件的介绍融于案例讲解之中,使读者在阅读时能突破方法和工具的局限,真正聚集于对数据分析精髓的领悟。  


    作者简介


    张文彤 博士,数据挖掘、市场研究、统计软件教学与应用领域专家,现任全球第八大市场研究集团INTAGE中国公司全国技术总监。曾在复旦大学任教数载,期间协助SPSS在中国建立并完善了其培训体系,是国内知名的SPSS培训师之一。


    钟云飞 资深数据分析专家,拥有超过10年的统计分析与数据挖掘在各行业的软件应用及咨询经验,历任SPSS、SAS软件公司首席咨询顾问,目前在国际商业机器(中国)有限公司软件部工作,从事SPSS软件企业应用的推广工作。


    目录


    第一部分 spss数据分析基础


    第1章 数据分析方法论简介


    第2章 数据分析方法体系简介


    第3章 ibm spss statistics操作入门


    第4章 ibm spss statistics操作进阶


    第5章 ibm spss modeler操作入门


    第二部分 影响因素发现与数值预测


    第6章 酸奶饮料新产品口味测试研究案例


    第7章 偏态分布的激素水平影响因素分析


    第8章 某车企汽车年销量预测案例


    第9章 脑外伤急救后迟发性颅脑损伤影响因素分析案例


    第10章 中国消费者信心指数影响因素分析


    第三部分 信息浓缩、分类与感知图呈现


    第11章 探讨消费者购买保健品的动机


    第12章 1988年汉城奥运会男子十项全能成绩分析


    第13章 打败sars


    第14章 住院费用影响因素挖掘


    第四部分 数据挖掘案例精选


    第15章 淘宝大卖家之营销数据分析


    第16章 超市商品购买关联分析

    第17章 电信业客户流失分析

    第18章 信用风险评分方法


    第19章 医疗保险业的欺诈发现


    第20章 电子商务中的数据挖掘应用


    读者评价


    640?wx_fmt=jpeg640?wx_fmt=jpeg

    京东:

    https://item.jd.com/11186683.html

    当当:http://product.dangdang.com/23194988.html


    640?wx_fmt=jpeg


    640?wx_fmt=jpeg
    展开全文
  • SPSS数据统计分析

    2012-02-26 22:10:56
    SPSS数据统计与分析》结合具体案例介绍了SPSS的重点功能和常用功能。全书主要包括4个方面的内容:SPSS基础,包括软件基本情况、基本操作、数据文件的使用和预处理等;SPSS基本统计,包括描述性统计、均值比较、方差...

空空如也

空空如也

1 2 3 4 5 ... 10
收藏数 200
精华内容 80
关键字:

spss数据分析案例