精华内容
下载资源
问答
  • §1.2 多元统计分析的应用 §1.3 多元统计数据的图表示法 习题一 第二章 多元正态分布及参数的估计 §2.1 随机向量 §2.2 多元正态分布的定义与基本性质 §2.3 条件分布和独立性 §2.4 随机阵的正态分布 §2.5 多元...
  • 文章目录因子分析基本理论因子载荷的求解因子旋转因子得分主成分分析与因子分析的区别因子分析的步骤与逻辑框图步骤逻辑框图 因子分析 因子分析( factor analysis)模型是主成分分析的推广。它也是利用降维的思想...

    鄙人学习笔记



    因子分析

    因子分析( factor analysis)模型是主成分分析的推广。它也是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法

    相比主成分分析,因子分析更倾向于描述原始变量之间的相关关系,因此,因子分析的出发点是原始变量的相关矩阵。

    基本理论

    • 因子分析的基本思想

    因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因子。
    对于所研究的某一具体问题,原始变量可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。
    因子分析还可用于对变量或样品的分类处理,我们在得出因子的表达式之后,可以把原始变量的数据代入表达式得出因子得分值,根据因子得分在因子所构成的空间中把变量或样品点画出来,形象直观地达到分类的目的。
    因子分析不仅可以用来研究变量之间的相关关系,还可以用来研究样品之间的相关关系,通常将前者称为 R型因子分析,后者称为 Q型因子分析。

    • 一般因子分析模型

    设有 n个样品,每个样品观测 p个指标,这 p个指标之间有较强的相关性(要求 p个指标相关性较强的理由是很明确的,只有相关性较强才能从原始变量中提取出“公共”因子)
    为了消除由于观测量纲的差异及数量级不同所造成的影响,将样本观测数据进行标准化处理,使标准化后的变量均值为0,方差为1。
    为方便,把原始变量及标准化后的变量向量均用X 表示,用F1,F2,…,Fm(m <p)表示标准化的公共因子。

    如果:

    (1)X =(X1,X2,…,Xp)′是可观测随机向量,且均值向量E(X)=0,协方差矩阵cov(X)=∑,且协方差矩阵∑ 与相关阵R 相等;

    (2)F =(F1,F2,…,Fm)′(m <p)是不可观测的变量,其均值向量E(F)=0,协方差矩阵cov(F)=I,即向量F 的各分量是相互独立的
    (3)ε =(ε1,ε2,…,εp)′与F 相互独立,且E(ε)=0,ε 的协方差阵∑ ε 是对角方阵

    ε 的各分量之间也是相互独立的.

    则模型:

    称为因子模型


    其中:

    公共因子F1,F2,…,Fm 相互独立且不可测,是在原始变量的表达式中都出现的因子。公共因子的含义,必须结合实际问题的具体意义确定。

    ε1,ε2,…,εp 叫做特殊因子,是向量X的分量Xi(i =1,2,…,p)所特有的因子。各特殊因子之间以及特殊因子与所有公共因子之间也都是相互独立的。
    矩阵A 中的元素aij 称为因子载荷,aij 的绝对值越大(∣ aij ∣ ≤ 1),表明Xi 与Fj 的相依程度越大,或称公共因子Fj 对于Xi 的载荷量越大,进行因子分析的目的之一就是要求出各个因子载荷的值。
    经过后面的分析会看到,因子载荷的概念与上一章主成分分析中的因子负荷量相对等,实际上,由于因子分析与主成分分析非常类似,在上面的因子模型中,若把εi 看做ai(m+1)F(m+1) +ai(m+2)F(m+2) +…+aipFp 的综合作用,则除了此处的因子为不可测变量这一区别,因子载荷与主成分分析中的因子负荷量是一致的。很多人对这两个概念并不加以区分而都称作因子载荷。矩阵A 称为因子载荷矩阵

    为了更好地理解因子分析方法,有必要讨论一下载荷矩阵A的统计意义以及公共因子与原始变量之间的关系。
    (1)因子载荷aij 的统计意义:

    即aij 是Xi 与Fj 的协方差,而注意到,Xi 与Fj(i =1,2,…,p;j =1,2,…,m)都是均值为0,方差为1 的变量,因此,aij 同时也是Xi 与Fj 的相关系数。

    (2)变量共同度与剩余方差:
    称ai12+ai22+ … +aim2为变量Xi 的共同度,记为hi2(i =1,2,…,p)
    由因子分析模型的假设前提,易得:

    易得记var(ε i)=σi2,则:

    上式表明共同度hi2与剩余方差σi2有互补的关系,越大表明Xi 对公共因子的依赖程度越大,公共因子能解释Xi 方差的比例越大,因子分析的效果也就越好。

    (3)考虑某一个公共因子Fj 与所有原始变量X1,X2,…,Xp 的关系。记:

    则gj2表示的是公共因子Fj 对于X 的每一分量Xi(i =1,2,…,p)所提供的方差的总和,称为公共因子Fj 对原始变量向量X 的方差贡献,它是衡量公共因子相对重要性的指标。gj2越大,表明公共因子Fj 对X 的贡献越大,或者说对X 的影响和作用就越大。
    如果将因子载荷矩阵A 的所有gj2(j =1,2,…,m)都计算出来,并按其大小排序,就可以依此提炼出最有影响的公共因子。

    因子载荷的求解

    有很多方法可以完成求解因子载荷这项工作,如主成分法、主轴因子法、最小二乘法、极大似然法、 α因子提取法等。

    • 主成分法

    用主成分法确定因子载荷是在进行因子分析之前先对数据进行一次主成分分析,然后把前几个主成分作为未旋转的公共因子。
    但是,由于用这种方法所得的特殊因子 ε1, ε2,…, εp之间并不相互独立,因此,用主成分法确定因子载荷不完全符合因子模型的假设前提,也就是说所得的因子载荷并不完全正确。
    当共同度较大时,特殊因子所起的作用较小,特殊因子之间的相关性所带来的影响几乎可以忽略。
    事实上,很多有经验的分析人员在进行因子分析时,总是先用主成分法进行分析,然后再尝试其他的方法

    • 主轴因子法

    主轴因子法也比较简单,且在实际应用中比较普遍。用主轴因子法求解因子载荷矩阵的方法,其思路与主成分法有类似的地方,两者均是从分析矩阵的结构入手,不同的地方在于,主成分法是在所有的p个主成分都能解释标准化原始变量所有方差的基础之上进行分析的,而主轴因子法中,假定 m个公共因子只能解释原始变量的部分方差,利用公共因子方差(或共同度)来代替相关矩阵主对角线上的元素 1,并以新得到的这个矩阵(称为调整相关矩阵)为出发点,对其分别求解特征根与特征向量,从而得到因子解。

    • 极大似然法

    如果假定公共因子F和特殊因子ε服从正态分布,则能够得到因子载荷和特殊因子方差的极大似然估计。

    因子旋转

    不管用何种方法确定初始因子载荷矩阵A,它们都不是唯一的。设F1,F2,…,Fm 是初始公共因子,则可以建立它们的如下线性组合得到新的一组公共因子F1′,F2′,…,Fm′,使得F1′,F2′,…,Fm′彼此相互独立,同时也能很好地解释原始变量之间的相关关系。

    这样的线性组合可以找到无数组,由此便引出了因子分析的第二个步骤——因子旋转。

    建立因子分析模型的目的不仅在于找到公共因子,更重要的是知道每一个公共因子的意义,以便对实际问题进行分析。然而,我们得到的初始因子解各主因子的典型代表变量不是很突出,容易使因子的意义含糊不清,不便于对实际问题进行分析。出于这种考虑,可以对初始公共因子进行线性组合,即进行因子旋转,以期找到意义更为明确、实际意义更明显的公共因子。
    经过旋转后,公共因子对Xi 的贡献hi2并不改变,但由于载荷矩阵发生变化,公共因子本身就可能发生很大的变化,每一个公共因子对原始变量的贡献gj2不再与原来相同,经过适当的旋转,我们就可以得到比较令人满意的公共因子。

    • 正交旋转和斜交旋转

    因子旋转分为正交旋转与斜交旋转。正交旋转由初始载荷矩阵A 右乘一正交阵而得到。经过正交旋转而得到的新的公共因子仍然保持彼此独立的性质。而斜交旋转则放弃了因子之间彼此独立这个限制,因而可能达到更为简洁的形式,其实际意义也更容易解释。但不论是正交旋转还是斜交旋转,都应当使新的因子载荷系数要么尽可能地接近于零,要么尽可能地远离零。
    对于一个具体问题要做因子旋转,有时需要进行多次才能得到满意效果。每一次旋转后,矩阵各列平方的相对方差之和总会比上一次有所增加。如此继续下去,当总方差的改变不大时,就可以停止旋转,这样就得到了新的一组公共因子及相应的因子载荷矩阵,使得其各列元素平方的相对方差之和最大。

    因子得分

    顾名思义,因子得分就是公共因子F1,F2,…,Fm在每一个样品点上的得分。

    这需要我们给出公共因子用原始变量表示的线性表达式,这样的表达式一旦能够得到,就可以很方便地把原始变量的取值代入表达式中,求出各因子的得分值。在此处,公共因子用原始变量线性表示的关系式并不易得到。

    在此处,公共因子用原始变量线性表示的关系式并不易得到。在主成分分析中,主成分是原始变量的线性组合,当取p 个主成分时,主成分与原始变量之间的变换关系是可逆的,只要知道了原始变量用主成分线性表示的表达式,就可以方便地得到用原始变量表示主成分的表达式;

    在因子模型中,公共因子的个数少于原始变量的个数,且公共因子是不可观测的隐变量,载荷矩阵A不可逆,因而不能直接求得公共因子用原始变量表示的精确线性组合。

    解决该问题的一种方法是用回归的思想求出线性组合系数的估计值,即建立如下以公共因子为因变量、原始变量为自变量的回归方程:


    此处因为原始变量与公共因子变量均为标准化变量,因此回归模型中不存在常数项。在最小二乘意义下,可以得到F的估计值:

    A 为因子载荷矩阵;R 为原始变量的相关阵;X 为原始变量

    主成分分析与因子分析的区别

    (1)因子分析把展示在我们面前的诸多变量看成由对每一个变量都有作用的一些公共因子和一些仅对某一个变量有作用的特殊因子线性组合而成。因此,我们的目的就是要从数据中探查能对变量起解释作用的公共因子和特殊因子,以及公共因子和特殊因子组合系数。主成分分析则简单一些,它只是从空间生成的角度寻找能解释诸多变量绝大部分变异的几组彼此不相关的主成分。

    (2)因子分析中,把变量表示成各因子的线性组合,而主成分分析中,把主成分表示成各变量的线性组合。

    (3)主成分分析中不需要有一些专门假设,因子分析则需要一些假设。因子分析的假设包括:各个公共因子之间不相关,特殊因子之间不相关,公共因子和特殊因子之间不相关。

    (4)提取主因子的方法不仅有主成分法,还有极大似然法等,基于这些不同算法得到的结果一般也不同。而主成分只能用主成分法提取。

    (5)主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值唯一时,主成分一般是固定的;而因子分析中,因子不是固定的,可以旋转得到不同的因子。

    (6)在因子分析中,因子个数需要分析者指定,随指定的因子数量不同而结果不同。在主成分分析中,主成分的数量是一定的,一般有几个变量就有几个主成分。

    (7)和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。

    因子分析的步骤与逻辑框图

    步骤

    进行因子分析应包括如下几步:
    (1)根据研究问题选取原始变量。
    (2)对原始变量进行标准化并求其相关阵,分析变量之间的相关性。
    (3)求解初始公共因子及因子载荷矩阵。
    (4)因子旋转。
    (5)因子得分。
    (6)根据因子得分值进行进一步分析。

    逻辑框图

    展开全文
  • 第6章 多元统计分析 教案 课程名称大数据数学基础Python语言...配套PPT 引导性提问 探究性问题 拓展性问题 教学目标与基本要求 教学目标 通过本章的学习主要掌握多元统计分析的应用主要了解多元分析方法中的回归分析聚
  • 点击蓝字关注获取更多课程答案点击文末获取完整答案《统计信号处理》是信息与通信工程学科研究生的核心课程,本课程主要学习随机过程基础、参数估计、最佳滤波和信号检测的基本理论,通过随机过程基础的学习,掌握...
    9d5da78ac75f66f7b5a415ad5f76516e.png

    点击蓝字关注获取更多课程答案

    246cb83f6390808059475ba4b1af5c41.png

     点击文末

    获取完整答案

     《统计信号处理》是信息与通信工程学科研究生的核心课程,本课程主要学习随机过程基础、参数估计、最佳滤波和信号检测的基本理论,通过随机过程基础的学习,掌握随机过程的基本概念和随机过程通过线性系统分析的基本理论,包括随机过程的定义与分类、统计描述、平稳随机过程和功率谱、线性系统分析、常用时间序列模型、匹配滤波等;通过参数估计理论的学习,掌握参数估计的一般方法、估计的基本准则和性能评估方法;通过最佳滤波理论的学习,掌握最佳滤波的基本概念、卡尔曼滤波的基本理论,熟练掌握卡尔曼滤波算法的推导方法、算法的应用和性能(仿真)评估方法,掌握非线性滤波的基本概念和方法(扩展卡尔曼滤波方法),能够根据实际问题构建信号和观测模型、建立相应的算法、并能用计算机分析(仿真)算法性能。信号检测包括假设检验的基本理论及噪声中信号检测两部分,掌握假设检验(包括复合假设检验)的概念、判决准则,能够针对实际问题构造出假设检验的统计模型、选择合适的判决准则,分析判决的性能。能够将假设检验的数学理论应用于噪声中信号的检测问题中,推导出高斯噪声环境下最佳接收机的结构,掌握高斯噪声中最佳接收机的基本形式、接收机的性能分析方法及最佳信号设计问题。掌握非高斯噪声中信号检测的方法。    通过课程的学习,系统地掌握信号的分析、检测、估计和滤波的基础理论,为今后从事电子与通信领域的科学研究打下坚实的理论基础。目  录50e303da5ced275bd20b5c134bd65ecc.gif

    第1章 随机过程的基本概念

    1.1 定义与分类

    1.2 概率分布与概率密度

    1.3 数字特征

    1.4 平稳随机过程

    1.5 功率谱

    1.6 典型随机过程

    1.7 信号处理实例-海杂波统计特性分析

    第2章 随机过程的线性变换

    2.1 线性变换的概念与定理

    2.2 随机过程通过线性系统分析

    2.3 常用时间序列模型分析

    2.4 最佳线性滤波器

    2.5 匹配滤波器

    2.6 信号处理实例-线性调频信号的匹配滤波

    第一章、第二章内容测试

    第3章 估计的基本概念与性能评估

    3.1 估计理论概述

    3.2 参数估计的CRLB

    3.3 高斯白噪声中一般信号参数的CRLB

    3.4 估计性能的蒙特卡洛仿真

    3.5 矢量参数的CRLB(*)

    3.6 变换参数的CRLB(*)

    3.7 充分统计量(*)

    第4章 最小方差无偏估计(*)

    4.1 最小方差无偏估计(*)

    4.2 线性最小方差无偏估计(*)

    4.3 信号处理实例-系统辨识(*)

    第5章 最大似然估计

    5.1 最大似然估计

    5.2 最大似然估计的渐近特性

    5.3 信号处理实例-时延估计

    5.4 变换参数的最大似然估计(*)

    第6章 贝叶斯估计

    6.1 贝叶斯估计的一般概念

    6.2 最小均方估计

    6.3 最大后验概率估计

    6.4 信号处理实例-命中概率的贝叶斯估计

    第7章 线性贝叶斯估计

    7.1 线性最小均方估计

    7.2 线性最小均方估计的几何解释

    7.3 递推线性最小均方估计

    第三至七章内容测试

    第8章 线性卡尔曼滤波

    8.1 卡尔曼滤波概述

    8.2 卡尔曼滤波算法推导-正交投影法

    8.3 卡尔曼滤波算法推导-新息法

    8.4 计算举例

    8.5 应用中的若干问题

    8.6 信号处理实例-目标跟踪

    8.7 案例研究-机动目标跟踪

    第9章 非线性卡尔曼滤波

    9.1 扩展卡尔曼滤波

    9.2 信号处理实例-目标跟踪

    第八、九章内容测试

    第10章 统计判决理论

    10.1 信号检测的基本概念

    10.2 贝叶斯准则

    10.3 奈曼-皮尔逊准则

    10.4检测性能分析

    10.5多元假设检验

    第11章 复合假设检验

    11.1 复合假设检验的基本概念

    11.2 广义似然比检验计算

    11.3 局部最大势检验

    第12章 高斯噪声中确定性信号检测

    12.1 匹配滤波器

    12.2 广义匹配滤波器

    12.3 最小距离接收机

    12.4 未知参量的确定性信号检测

    12.5 信号处理实例-正弦信号检测

    12.6 雷达CFAR检测

    第13章 高斯噪声中随机信号的检测

    13.1 随机信号的相关检测:估计器-相关器

    13.2 一般高斯信号的检测

    13.3 信号处理实例-Swerlling起伏模型的雷达检测性能分析

    13.4未知参量的随机信号检测

    13.5 线性模型检测

    第14章 未知噪声参数及非高斯噪声中信号的检测

    14.1 噪声参量未知时的信号检测

    14.2 非高斯噪声中的信号检测

    14.3 信号处理实例-辐射源个体目标识别

    14.4 信号处理实例-基于正交投影的雷达小目标检测

    ·end·

    —如果你的战友也需要这份答案—

    —快分享给他们吧—

    展开全文
  • 上一篇我们从实用性的角度对两种因子分析做了比较,这一篇稍微补充一些理论知识,帮助大家更深刻的理解两种因子分析...1. 用途探索性因子分析(EFA):寻求基本结构,解决多元统计分析的变量间强相关问题;数据化简;...

    上一篇我们从实用性的角度对两种因子分析做了比较,这一篇稍微补充一些理论知识,帮助大家更深刻的理解两种因子分析方法。

    探索性(EFA)和验证性(CFA)因子分析,二者都用于检验结构效度,如果对因子结构有事先的假设和理论基础,通常采用CFA;如果没有事先的假设,纯粹依据数据来分析结果,则采用EFA。

    1. 用途

    探索性因子分析(EFA):

    • 寻求基本结构,解决多元统计分析的变量间强相关问题;

    • 数据化简;

    • 发展测量量表

    验证性因子分析(CFA):

    • 验证量表的维度或面向性,决定最有效因子结构;

    • 验证因子的阶层关系;

    • 评估量表的信度和效度

    我们举例说明:假设现在要设计一份量表型的调查问卷,根据调研文献和前期访谈,总共设计3个潜在变量,然后为每个潜在变量设计4~8个题项组成初始问卷。

    初始问卷的这些题项并不是一定能够与设计的潜在变量对应(没有结构效度),因此可以通过探索性因子分析进行题项的筛选,看看当初设计时应该归于一个因子的题项(聚集在一起表示这些题项相关,可以被同一个潜在变量解释)是否落在同一个因子中,如果没有,那么就需要对相应的题项进行删除或修改处理。

    验证性因子分析通过AMOS将潜在变量与对应题项绘制测量模型,然后通过数据拟合,看看模型的拟合质量如何,如果模型拟合质量好,说明测量模型绘制的潜在变量与题项的关系通过数据验证。

    探索性因子分析被提出的时间早于验证性因子分析,主要的目的是在探索一组观察变项中有多少的潜在因子,其流程是先设定一群观察变项会受到同一个共同因子的影响,计算其共变程度,再来排除掉共变程度后,再寻找下一个可以解释剩下共变关系的因子,直到所有变异量被解释完为止(如下图左半部),此时所萃取因子的个数刚好就是等于观察变项的总题数,不过由于多数因子能解释共变的程度不高,因此就会有许多方式来决定因子个数,譬如说下图右半部采取特征值大于一的方式来决定,或是用陡坡图来决定适合的因子个数。

    由于探索性因子分析的每个因子都会去解释每个观察变项的共变程度,若将此结构图像化,就会像是下方的图片一样,这也是为什么探索性因子分析里会有交叉载荷(cross-loading)的问题。

    8546997ca78253820d05981ec74427c2.png

    探索性因子分析的结构无法假设一个观察变项只受到一个潜在因子的影响,直到验证性因子分析被提出才解决,而采用迭代方式来解决数学演算上的问题,其结构图如下。

    e72100e7f8b596d069a905ef78c04553.png

    2. 因子个数与命名

    在探索性因子分析中,因子个数是根据结果来决定的(如特征值(又名固有值,Eigen value)大于1、陡坡图),决定好因子个数后,再透过因子旋转(转轴法)来计算各个观察变项在每个因子中的负荷量,来决定观察变项的归类,最后再依据归类完的题目内容,对于个别因子进行命名;

    验证性因子分析因为只是验证资料与引用量表的结构是否适配,因此因子个数与命名都是延用原来量表的结构。

    3. 估计法

    在探索性因子分析中,最常使用的估计法是主成分法及主轴因子法;而在验证性因子分析中,最常使用的估计法为最大概似估计法(ML法),因此观察变项会有常态性假设的问题。

    4. 报告内容

    在探索性因子分析中,会报告每个因子的命名、特征值、解释变异量,每个因子下包含的题项有哪些,以及题项的因子负荷量;在探索性因子分析中,会报告模式配适度、题项的负荷量、个别因子的建构信度与平均变异抽取、报告区别效度。

    最后将两者的差异汇整如下:

    606542b033d41de346960222a1015500.png

    总结

    社会科学,人文科学等领域最常用的分析软件是SPSS,AMOS是后来才为学术界采用。因为使用图形好看,使用难度略高,对样本数要求高,等等因素产生了一种印象,那就是AMOS比SPSS高级。事实上并不是如此。

    AMOS软件可以做的分析并不是很多,使用条件和可导出结果的局限性都很大,在使用之前一定要充分考虑后再决定。

    其实使用哪种分析软件,归根结底只要满足你的研究内容就可以了。比如,一篇普通的硕士论文,问卷发个一二百份就够了,实在是没必要硬是使用AMOS来分析;反之,如果你的论文需要一些形式上的东西,也可以在满足研究的条件下使用AMOS分析达到研究目的。

    参考文献

    知乎. https://www.zhihu.com/question/388462332/answer/1159988907

    快报. https://kuaibao.qq.com/s/20190804AZNL1M00?refer=spider

    经管之家论坛. https://bbs.pinggu.org/

    痞客帮.https://dasanlin888.pixnet.net

    如有疑问,请在下方留言,你的问题也许也会帮助到别人哦85846e538757b006172ae793bd35a99c.png85846e538757b006172ae793bd35a99c.png85846e538757b006172ae793bd35a99c.png

    1d1a5e5bf359d7c4b321c8ee460dc602.png

    b903fc4f9aa7f1c3a5278ce5b7fe8221.png

    1c30ecaed0d2546f95fce28a5ea3390d.png

    50c48e749e0f9f3834c83f2b4be57558.png

    8e8edf78ccf4866ef161d3702991d4d9.png

    展开全文
  • 此回购协议的创建和组织旨在作为迷你指南,供没有或只有很少计算机科学背景(尤其是生物信息学)背景的学生使用,以使他们有一个总体思路并理解统计学的基本概念,从而为朝多元统计和最终的机器学习算法。...
  • 介绍了基于简单假设检验检测理论基础,包括Neyman-Pearson定理、无关数据处理、贝叶斯风险、多元假设检验,以及确定性信号和随机信号检测。最后详细分析了适合于未知信号和未知噪声参数复合假设检验。
  • 【原 书 名】 Fundamentals of Statistical Signal Processing 【作 者】(美)Steven M.Kay ...介绍了基于简单假设检验检测理论基础,包括Neyman-Pearson定理、无关数据处理、贝叶斯风险、多元假设检验,以及确
  • 介绍了基于简单假设检验检测理论基础,包括Neyman-Pearson定理、无关数据处理、贝叶斯风险、多元假设检验,以及确定性信号和随机信号检测。最后详细分析了适合于未知信号和未知噪声参数复合假设检验。.. ...
  • 介绍了基于简单假设检验检测理论基础,包括Neyman-Pearson定理、无关数据处理、贝叶斯风险、多元假设检验,以及确定性信号和随机信号检测。最后详细分析了适合于未知信号和未知噪声参数复合假设检验。.. ...
  • 介绍了基于简单假设检验检测理论基础,包括Neyman-Pearson定理、无关数据处理、贝叶斯风险、多元假设检验,以及确定性信号和随机信号检测。最后详细分析了适合于未知信号和未知噪声参数复合假设检验。.. ...
  • 【数学建模】因子分析

    千次阅读 2020-04-05 21:38:54
    因子分析的基本理论<2> 因子的基本步骤 1 因子分析 <1> 因子分析的基本理论 1 什么是因子分析? 因子分析是主成分分析的推广,也是利用降维的思想,由研究原始变量相关矩阵或协方差矩阵的内部依 赖关系...

    1 因子分析

    <1> 因子分析的基本理论

    1 什么是因子分析?
    因子分析是主成分分析的推广,也是利用降维的思想,由研究原始变量相关矩阵或协方差矩阵的内部依 赖关系出发,把一些具有错综复杂关系的多个变量归 结为少数几个综合因子的一种多元统计分析方法。


    2 因子分析的基本思想
    把每个研究变量分解为几个影响因素变量,将每个 原始变量分解成两部分因素,一部分是由所有变量共 同具有的少数几个公共因子组成的,另一部分是每个 变量独自具有的因素,即特殊因子


    3 因子分析的目的

    • 因子分析的目的之一,简化变量维数。即要使因素结 构简单化,希望以最少的共同因素(公共因子),能 对总变异量作最大的解释,因而抽取得因子愈少愈好, 但抽取因子的累积解释的变异量愈大愈好
    • 在因子分析的公共因子抽取中,应最先抽取特征值最 大的公共因子,其次是次大者,最后抽取公共因子的 特征值最小,通常会接近0。

    4主成分分析与因子分析的联系和差异:

    联系:

    • (1)因子分析是主成分分析的推广,是主成分分析的逆问题。
    • (2)二者都是以‘降维’为目的,都是从协方差矩阵或相关系数矩 阵出发。

    区别:

    • (1)主成分分析模型是原始变量的线性组合,是将原始变量加以 综合、归纳,仅仅是变量变换;而因子分析是将原始变量加以分解, 描述原始变量协方差矩阵结构的模型;只有当提取的公因子个数等于 原始变量个数时,因子分析才对应变量变换。
    • (2)主成分分析中每个主成分对应的系数是唯一确定的;因子分 析中每个因子的相应系数即因子载荷不是唯一的。
    • (3)因子分析中因子载荷的不唯一性有利于对公因子进行有效解释; 而主成分分析对提取的主成分的解释能力有限。

    5 因子分析模型

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述



    6 因子分析模型中的几个重要统计量的意义

    • (1)因子负荷量(或称因子载荷)----是指因子结构 中原始变量与因子分析时抽取出的公共因子的相关 程度
      在各公共因子不相关的前提下, (载荷矩阵中第 i行,第j列的元素)是随机变量xix_i^*与公共因子FjF_j的 相关系数,表示xix_i^*依赖于FjF_j的程度。反映了第i个 原始变量在第j个公共因子上的相对重要性。因此 绝对值越大,则公共因子Fj与原有变量xi的关系越 强。

    在这里插入图片描述

    • (2)共同度----又称共性方差或公因子方差(community或 common variance)就是变量与每个公共因子之负荷量的 平方总和(一行中所有因素负荷量的平方和)。变量 的 共同度是因子载荷矩阵的第i行的元素的平方和。记为

    hi2=j=1maij2h_i^2=\sum_{j=1}^ma_{ij}^2

    • (3)特征值----是第j个公共因子FjF_j对于XX^*的每一分量XiX_i^*所提供的 方差的总和。又称第j个公共因子的方差贡献。即每个变量与某 一共同因素之因素负荷量的平方总和(因子载荷矩阵中某一公 共因子列所有因子负荷量的平方和)。

    • (4)方差贡献率----指公共因子对实测变量的贡献,又称变异量 方差贡献率=特征值G/实测变量数p,是衡量公共因子相对重 要性的指标,GiG_i越大,表明公共因子FjF_jXX^*的贡献越大,该因 子的重要程度越高。


    例:在企业形象或品牌形象的研究中,消费者可 以通过一个有24个指标构成的评价体系,评价百 货商场的24个方面的优劣。 但消费者主要关心的是三个方面,即商店的环境、商店的服务 和商品的价格。因子分析方法可以通过24个变量,找出反映商 店环境、商店服务水平和商品价格的三个潜在的因子,对商店 进行综合评价。而这三个公共因子可以表示为:
    xi=ui+ai1F1+ai2F2+ai3F3+ϵix_i=u_i+a_{i1}F_1+a_{i2}F_2+a_{i3}F_3+\epsilon_i
    F1,F2,F3F_1,F_2,F_3 是不可观测的潜在因子,称 为公共因子,线性组合系数ai1,ai2ai3a_{i1},a_{i2},a_{i3}称为因子载荷,它分别表示第i个商品在三个公共因子的表现;uiu_i是总平均,ϵi\epsilon_i是第i个指标不能被公共因子包含的部分,称为特殊因子,常常假定ϵi\epsilon_i~N(0,σi2)N(0,\sigma^2_i)即24个变量 共享这三个因子,但是每个变量又有自己的个性
    因子分析的首要任务就是估计因子载荷aija_{ij}和方差σi2\sigma_i^2,然后给因子FIF_I一个合理的解释,若难以进行合理解释,则需要进一步作因子旋转,希望旋转后能发现比较合理的解释。


    <2> 因子的基本步骤

    1 因子分析的前提条件鉴定
    考察原始变量之间是否存在较强的相关关系,是否适合 进行因子分析。因为: 因子分析的主要任务之一就是对原有变量中信息重叠的部分提取和综合成因子,最终实现减少变量个数的目 的所以要求原有变量之间应存在较强的相关关系。否 则,如果原有变量相互独立,不存在信息重叠,也就无 需进行综合和因子分析

    影子分析前提条件——相关性分析:
    分析方法主要有:

    • (1)计算相关系数矩阵(correlation coefficients matrix) 如果相关系数矩阵中的大部分相关系数值均 小于0.3,即各变量间大多为弱相关,原则 上这些变量不适合进行因子分析

    • (2)计算反映象相关矩阵(Anti-image correlation matrix)

    • (3)巴特利特球度检验(Bartlett test of sphericity ) 该检验以原有变量的相关系数矩阵为出发点,其零假设H0H_0是:相关系数矩阵为单位矩阵,即相关系数矩阵 主对角元素均为1,非主对角元素均为0。(即原始变 量之间无相关关系)。

    • (4)KMO(Kaiser-Meyer-Olkin)检验 KMO检验的统计量是用于比较变量间简单相关系数矩阵 和偏相关系数的指标,数学定义为: KMO值越接近1,意味着变量间的相关性越强,原有变 量适合做因子分析;越接近0,意味变量间的相关性越 弱,越不适合作因子分析。Kaiser给出的KMO度量标准:0.9以上非常适合;0.8表 示适合;0.7表示一般;0.6表示不太适合;0.5以下表 示极不适合。


    2 因子提取
    研究如何在样本数据的基础上提取综合因子。

    因子载荷矩阵求解的方法
    基于主成分模型的主成分分析法
    基于因子分析模型的主轴因子法
    极大似然法
    最小二乘法
    a因子提取法
    映像分析法

    3 因子旋转
    通过正交旋转或斜交旋转使提取出的因子具有可解释性。

    为什么要旋转因子?
    建立了因子分析数学目的不仅仅要找出公共因子以及对 变量进行分组,更重要的要知道每个公共因子的意义, 以便进行进一步的分析,如果每个公共因子的含义不清, 则不便于进行实际背景的解释。由于因子载荷阵是不惟 一的,所以应该对因子载荷阵进行旋转。目的是使每个 变量在尽可能少的因子上有比较高的载荷,让某个变量 在某个因子上的载荷趋于1,而在其他因子上的载荷趋 于0。即:使载荷矩阵每列或行的元素平方值向0和1两 极分化。
    旋转的方法有:(1)正交旋转;(2)斜交旋转

    • (1)正交旋转 由初始载荷矩阵A左乘一正交矩阵得到;目的是新的载 荷系数尽可能的接近于0或尽可能的远离0;只是在旋 转后的新的公因子仍保持独立性。主要有以下方法: varimax:方差最大旋转。简化对因子的解释 quartmax:四次最大正交旋转。简化对变量的解释 equamax:等量正交旋转
      方差最大法: 方差最大法从简化因子载荷矩阵的每一列出发,使和 每个因子有关的载荷的平方的方差最大。当只有少数几 个变量在某个因子上有较高的载荷时,对因子的解释最 简单。方差最大的直观意义是希望通过因子旋转后,使 每个因子上的载荷尽量拉开距离,一部分的载荷趋于 1,另一部分趋于0。
      四次方最大旋转: 四次方最大旋转是从简化载荷矩阵的行出发,通过旋转 初始因子,使每个变量只在一个因子上有较高的载荷, 而在其它的因子上尽可能低的载荷。如果每个变量只在 一个因子上有非零的载荷,这时的因子解释是最简单的。 四次方最大法通过使因子载荷矩阵中每一行的因子载 荷平方的方差达到最大。
      等量最大法: 等量最大法把四次方最大法和方差最大法结合起来求行和列因子载荷平方的方差的加权平均最大。

    • (2)斜交旋转 目的是新的载荷系数尽可能的接近于0或尽可能的 远离0;只是在旋转时,放弃了因子之间彼此独立的限 制,旋转后的新公因子更容易解释。主要有以下的方法:
      direct oblimin:直接斜交旋转。允许因子之间具有相关性; promax:斜交旋转方法。允许因子之间具有相关性;


    4 计算因子得分
    通过各种方法求解各样本在各因子上的得分,为进 一步分析奠定基础
    因子得分的概念: 前面我们主要解决了用公共因子的线性组合来表示 一组观测变量的有关问题。如果我们要使用这些因子做 其他的研究,比如把得到的因子作为自变量来做回归分 析,对样本进行分类或评价,这就需要我们对公共因子 进行测度,即给出公共因子的值。

    展开全文
  • 有偏估计:岭估计 (2) 假设检验 预先知道服从分布, 非参数假设检验 (3) 统计分析(包括多元统计分析) n 方差分析 n 偏度分析 n 协方差分析 n 相关分析 n 主成分分析 n 聚类分析 n 回归分析,检验统计量...
  • 应用数理统计课件

    2013-08-27 20:46:55
    应用数理统计课件 ... 3.1 基本理论 3.2 重要参数检验 3.3 非参数检验 3.4 统计决策与Bayes理论 第四章 方差分析 第五章 线性回归模型 5.1 线性模型理论 5.2 一元回归与相关分析 5.3 多元回归分析

空空如也

空空如也

1 2 3 4 5 ... 8
收藏数 144
精华内容 57
关键字:

多元统计分析的基本理论