精华内容
下载资源
问答
  • 多元统计学

    2019-12-06 22:58:47
    我自己读了好几本多元统计学的教材,发现这些教材参差不齐,没有一个完美的:要么写的太难,堆了不少高深的矩阵知识上去,有一些理论做统计分析时很少用到,我觉得没啥必要都放到书里面去;要么写的太简略,一...

    安排了下学期讲《多元统计分析》,因为我学过这门课,本来不觉得多么难。然而拿到教材后,才知道理论那么深奥,这门课比高等数学都难。

    我记得硕士期间学这门课老师对理论部分讲的很简单,讲了一些操作,总体讲的很一般。我自己读了好几本多元统计学的教材,发现这些教材参差不齐,没有一个完美的:要么写的太难,堆了不少高深的矩阵知识上去,有一些理论做统计分析时很少用到,我觉得没啥必要都放到书里面去;要么写的太简略,一些主要分析的基础思想都没讲明白;还有的教材感觉像是拼凑的,一些地方写的很详细,另一部分很简略,似乎是不同人写的拼到一起。

    我虽然心里面不怎么看得起,只用数据做统计分析发论文的,然而心里面也想把统计学的知识系统性地掌握住,这样反驳他们时心里面会更有底气一点。因此,当时对讲这门课并没有推辞,讲这门课我自身也能学到不少知识,多掌握一些处理数据的技巧。

    然而,这门课的理论知识确实很有挑战。虽然给本科生将,不会涉及太多理论,然而作为老师,还是尽量把理论弄明白比较好。我从现在开始就开始备课了,这段时间觉得整天都在看数学,脑子都有点涨。最近事情似乎有点多,要分清主次!

    展开全文
  • 2 多元统计学.ppt

    2019-09-11 21:51:00
    多元统计分析,何晓群,第二版,第一章课件 多元统计学
  • 多元统计学线性回归分析, 介绍: 1、回归分析的概念和模型 2、回归分析的过程
  • 基于多元统计学方法的老面馒头特征性挥发性风味物质的确定,张楚楚,闫博文,老面馒头是一种传统发酵面制品,因其多菌种共发酵而具有独特的风味。本文采用固相微萃取/气相质谱联用技术分析了10份老面馒头样品
  • 多元统计学课程论文

    2012-12-25 16:01:43
    多元,因子分析,聚类分析,判别分析,课程论文,仅供参考。。。。。。
  • 多元统计学基础知识

    2019-12-02 16:30:23
  • 适合于自学与专业人员,涉及面广 学习SPSS时可以用的一种教材
  • 1.多元线性回归 states <- as.data.frame(state.x77[,c("Murder", "Population","Illiteracy", "Income", "Frost")]) fit <- lm(Murder ~ Population + Illiteracy + Income + Frost, data=states) summary...

    1.多元线性回归

    states <- as.data.frame(state.x77[,c("Murder", "Population","Illiteracy", "Income", "Frost")])
    fit <- lm(Murder ~ Population + Illiteracy + Income + Frost, data=states)
    summary(fit)
    coef(fit)         # 输出回归参数
    confint(fit)      # 提供模型参数的置信区间(默认 95%fitted(fit)       # 列出拟合模型的预测值
    residuals(fit)    # 列出拟合模型的残差值
    rstandard(fit)    # 标准化残差
    rstudent(fit)     # 学生化残差:SREi
    AIC(fit)          # 赤池信息

    2.基本假设检验

    • 正态性检验
    library(car)
    library(ggpubr)
    res = rstudent(fit)     #学生化残差
    ggqqplot(res,color = '#E7B800')

    在这里插入图片描述

    • 独立性检验
    durbinWatsonTest(fit)   # p>0.05 表明应变量相互独立
    • 同方差性
    ncvTest(fit)            # p>0.05 表明同方差

    3.异常值观测

    • 离群点
    outlierTest(fit)        #若不显著,则说明数据集中没有离群点,一般会去除离群点
    • 高杠杆值点,hii大于2倍或者3倍hii平均值(p+1)/n
    hii = hatvalues(fit) 
    high_leverage_point = hii[hii >= 2 * (4+1)/length(hii)]
    • 强影响点,库克距离Di > 4/(n-p-1),或者Di > 1,若有强影响点,则去除
    Di = cooks.distance(fit)
    Di[Di > 1]

    4.多重共线性

    vif(fit)   # VIF>4:存在多重共线性,VIF>10:存在严重多重共线性

    5.变量选择,逐步回归

    library(MASS)
    AIC(fit)
    stepAIC(fit, direction = 'both')

    6.确定最终函数

    states =  states[-grep('Nevada', rownames(states)),]
    final_fit = lm(Murder~Population+Illiteracy, data = states)
    summary(final_fit)

    7.在新的数据集上预测

    df = data.frame(Population = c(360,2200),
                    Illiteracy = c(1.4,1.9))
    myfunction = function(x1){
      sum(coef(fit)[2:length(coef(final_fit))] *  x1) + coef(final_fit)[1]
    } 
    apply(df, 1, myfunction) # 预测新的数据集
    展开全文
  • 多元统计学(一):主成分分析(PCA)

    千次阅读 2019-07-13 16:25:03
    PCA 主成分计算 library(FactoMineR) library(factoextra) ...- PCA(iris[,-5], graph = FALSE) ...iris.pca$var$cor # 因子载荷:变量和主成分的相关系数 ...iris.pca$var$cos2 # 变量和主成分的相关系数的平方(因子...

    PCA

    • 主成分计算
    library(FactoMineR)
    library(factoextra)
    iris.pca <- PCA(iris[,-5], graph = FALSE)
    iris.pca$var$cor # 因子载荷:变量和主成分的相关系数
    iris.pca$var$cos2 # 变量和主成分的相关系数的平方(因子载荷的平方)
    iris.pca$var$contrib #每一列是所有变量对每个主成分的贡献率(百分数),每一行是主成分对每个变量的贡献率(百分数)
    iris.pca$ind$coord # 主成分得分
    eig.val <- get_eigenvalue(iris.pca)# 一列:特征值,二列:特征值的方差贡献度,三列:累计方差贡献度
    • 主成分选择,方差累计贡献度75%以上
    fviz_eig(iris.pca, addlabels = TRUE, ylim = c(0, 100)) 

    在这里插入图片描述

    • 因子负载荷图
    fviz_pca_var(iris.pca, col.var = "cos2",
                 gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"), 
                 repel = TRUE
    )

    在这里插入图片描述

    • 带有标签的PCA图
    fviz_pca_ind(iris.pca,
                 geom.ind = "point", # show points only (nbut not "text")
                 col.ind = iris$Species, # color by groups
                 palette = "jco", 
                 addEllipses = TRUE, # Concentration ellipses
                 legend.title = "Groups"
    )
    

    在这里插入图片描述

    3D-PCA

    library(scatterplot3d)
    iris
    data_3d = iris.pca$ind$coord
    data_3d <- data.frame(data_3d)
    data_3d$type <-  iris$Species
    colnames(data_3d) = c(paste('PC',1:4,sep = ''),'type')
    table(data_3d$type)
    mycolour <- c(rep('#E7B800',50),rep("#FC4E07", 50),rep("#00AFBB",50))
    • 3D图
    scatterplot3d(data_3d$PC1,data_3d$PC2,data_3d$PC3,
                  color = mycolour, # 样本点颜色
                  pch = c(rep(15,50), rep(16,50), rep(17,50)), # 样本点类型
                  cex.symbols = 1, # 样本点的大小
                  font.lab = 2,   #标签大小
                  font.axis = 2,
                  xlab = 'PC1 (73%)', # x轴标签
                  ylab = 'PC2 (22.9%)',
                  zlab = 'PC3 (3.7%)',
                  main = '3D-PCA', # 标题
                  mar=c(3,2.5,3,1.5)+0.1) # 图片大小,距离图片边界下、左、上、右各3,2.5,3,1.5英寸
    • 图例
    legend(0.3,6,  
           pch = c(15,16,17), # 符号类型
           c("setosa","versicolor","virginica" ), # 符号名称
           col = c('#E7B800','#FC4E07','#00AFBB'), # 符号颜色
           cex =.8, # 符号大小
           ncol = 3,
           bty = 'n')  
    • 导入到PPT中进一步修改图片
    export::graph2ppt()

    在这里插入图片描述

    展开全文

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 7,616
精华内容 3,046
关键字:

多元统计学