精华内容
下载资源
问答
  • EXCEL统计分析与应用

    2019-12-04 11:19:31
    参考书 Excel统计分析与应用大全-邱文君 豆瓣链接

    参考书
    Excel统计分析与应用大全-邱文君

    滴滴数据运营实习生关于EXCEL的提问:
    你都使用过哪些EXCEL函数?
    我:(呆滞)下意识开始说一些我做过的数据透视表、OLAP等简历经历。
    面试官:(直接打断)你这说的都不是函数
    我:(毫无逻辑地说了几个能立刻想起来函数,大概有聚集函数、log、if)
    (真的感觉又凉了)

    抱着希望继续参考上述书籍系统学习EXCEL函数

    常用统计分析

    数据分布的集中趋势

    指一组数据向其中心值靠拢的倾向和程度,它反映了一组数据中心点的位置所在。
    算术平均值、几何平均值、调和平均值、众数、中位数

    分布的离散程度

    离散程度反映了各变量值远离其中心值的程度,是数据分布的另一个重要特征。
    离散程度从另一个方面说明了集中趋势测度值的代表程度。
    数据的离散程度越大,集中趋势测度值对该组数据的代表性就越差;数据的离散程度越小,集中趋势测度值的代表性就越好。
    度量离散程度的指标主要有方差、标准差和四分位差

    分布的形状

    数据分布的形状是否对称、偏斜的程度以及分布的扁平程度等等。
    偏度峰度,即为对分布形状的测度。

    偏度反映变量数列偏斜程度的指标。
    通过偏度可以反映出数据分布的对称程度:如果一组数据的分布是对称的,则偏度等于0; 如果偏度明显不等于0,表明分布是非对称的。

    峰度用来表述分布的尖扁程度,是反映变量数列曲线顶端尖峭或扁平程度的指标。
    当β=3时,变量数列的曲线为正态曲线
    β>3时,为尖顶曲线,表明变量数列的次数比较集中于众数的位置,且值越大,顶部尖峭程度越高。
    β<3时,为平顶曲线,表明变量数列的次数在众数附近比较分散,且值越小,顶部就越平坦。

    常用统计分布

    正态分布、标准正太分布
    二项分布、泊松分布
    卡方分布
    F分布

    数据库统计函数

    计数函数
    普通的计数函数COUNT和COUNTA类似,数据库计数函数也按是否计入非数字项分为 DCOUNTDCOUNTA两个函数。
    DCOUNT函数仅计入包含数字单元格且满足条件的记录的个数DCOUNTA计算满足给定条件下的非空单元格的数目(包括非数字单元格)。

    求和、乘积函数

    =DSUM(A2:G17,F2,A19:A20)
    =DPRODUCT(A2:G17,E2,A19:A20)

    最值函数

    =DMIN(A2:G17,F2,A19:A20)
    =DMAX(A2:G17,G2,A19:A20)

    展开全文
  • Excel统计分析与应用大全(精粹版)》共分15章,为读者详细介绍了Excel 2013在统计分析中的应用,内容包括Excel 2013的基础知识,Excel中的数据透视表与数据透视图,常用统计分析,统计分布,参数估计,数据库统计...
  • Excel统计分析与应用》精选62个专业案例,覆盖90%以上的统计模型,以实验教程的形式讲解如何以Excel为工具,解决各种统计分析问题。全书共11章,第1~2章介绍Excel基本操作及其统计分析常用功能;第3~10章通过37...
  • Excel统计分析与应用大全 (Office办公无忧) - 邱文君.azw3Excel统计分析与应用大全 (Office办公无忧) - 邱文君.azw3Excel统计分析与应用大全 (Office办公无忧) - 邱文君.azw3Excel统计分析与应用大全 (Office办公...
  • Excel统计分析与应用大全 为了帮助用户更深入地了解和使用VBA语言,在此介绍Excel中的VBA最基本的语法和控制语句
  • Excel统计分析[Excel统计分析与应用].张联峰
  • Excel数据统计与分析范例应用》就是基于这种思路,为大家 提供了这个平台,在深入挖掘Excel软件的巨大潜力的同时,以专家现场问答的形式,将在使用Excel过程中遇到的各种问题和解决方法罗列出来,让读者方便地查找...
  • excel统计分析与数量方法中的的应用-36附录四 Excel统计分析与数量方法中的应用.pdf excel统计分析与数量方法中的的应用
  • Excel在统计中的应用与数据统计分析.pdf
  • Office高级应用 Excel 2010 综合应用_成绩统计与分析 n c . u d e . t i u c . e c i f f o 成绩统计与分析 主要内容 成绩计算与统计 格式化 n c . u d 绘制图表 e . t i u c . e c i f 绘制动态图表 f o 2 格式化前...
  • 1. 聚类分析轮廓图 2. matlab完整代码 %*****计算例9.1的距离矩阵 x = [1, 2, 6, 8, 11]'; %例9.1中的观测数据 y = pdist(x) %计算样品间欧氏距离 D = squareform(y) %将距离向量转为距离矩阵 %**根据原始数据创建...

    1. 聚类分析轮廓图

    在这里插入图片描述

    2. matlab完整代码

    %*****计算例9.1的距离矩阵

    x = [1, 2, 6, 8, 11]';    %9.1中的观测数据
    y = pdist(x)    %计算样品间欧氏距离
    D = squareform(y)    %将距离向量转为距离矩阵
    

    %**根据原始数据创建系统聚类树

    x = [1, 2, 6, 8, 11]';    %9.1中的观测数据
    Z = linkage(x, 'single', 'cityblock')    %利用最短距离法创建系统聚类树
    

    %**分步聚类,绘制聚类树形图

    x = [1 2 6 8 11]';    %9.1中的观测数据
    y = pdist(x,'cityblock');    % 计算样品间绝对值距离
    z = linkage(y);    % 利用最短距离法创建系统聚类树
    % 设定每个观测的标签
    obslabel = {'G1 = {1}';'G2 = {2}';'G3 = {6}';'G4 = {8}';'G5 = {11}'};
    % 创建聚类树形图,方向为从右至左,叶节点标签在左边
    [H,T] = dendrogram(z,'orientation','Right','labels',obslabel);
    set(H,'LineWidth',2,'Color','k')    % 设置线宽为2,颜色为黑色
    xlabel('并类距离')      % 设定X轴标签
    text(1.1,1.65,'G6')    % 在点(1.1,1.65)处放置字符串'G6'
    text(2.1,3.65,'G7')    % 在点(2.1,3.65)处放置字符串'G7'
    text(3.1,4.4,'G8')     % 在点(3.1,4.4)处放置字符串'G8'
    text(4.1,3,'G9')       % 在点(4.1,3)处放置字符串'G9'
    

    %***计算7种系统聚类法对应的Cophenetic相关系数

    x = [1 2 6 8 11]';    %9.1中的观测数据
    y = pdist(x,'cityblock');    % 计算样品间绝对值距离
    % 定义元胞数组method,各元胞分别对应不同系统聚类法
    method={'average','centroid','complete','median','single','ward','weighted'};
    % 通过循环计算7种系统聚类法对应的Cophenetic相关系数
    for i = 1:7
        Z = linkage(y,method{i});    % 利用第i种系统聚类法创建聚类树
        c(i) = cophenet(Z,y);    % 计算第i种系统聚类法对应的Cophenetic相关系数
    end
    c    % 查看Cophenetic相关系数值
    
    Z = linkage(y, 'average');    % 利用类平均法创建聚类树
    [c, d] = cophenet(Z,y)    % 计算Cophenetic相关系数c和cophenetic距离向量d
    RHO = corr(y',d')    % 计算y和d的线性相关系数
    

    %*调用cluster函数进行系统聚类

    x = [1 2 6 8 11]';    %9.1中的观测数据
    y = pdist(x,'cityblock');    % 计算样品间绝对值距离
    z = linkage(y);    % 利用最短距离法创建聚类树
    T = cluster(z,'maxclust',3)    % 将原始样品聚为3

    %*调用clusterdata函数进行系统聚类

    x = [1 2 6 8 11]';    %9.1中的观测数据
    T = clusterdata(x,'maxclust',3)    % 将原始样品聚为3
    x = [1 2 6 8 11]';    %9.1中的观测数据
    opts = statset('Display','final');    % 显示每次聚类的最终结果
    % 将原始的5个点聚为3类,距离采用绝对值距离,重复聚类5次,显示每次聚类的最终结果
    idx = kmeans(x,3,'Distance','city','Replicates',5,'Options',opts)
    

    %绘制聚类轮廓图*****

    x = [1 2 6 8 11]';    %9.1中的观测数据
    % 将原始的5个点聚为3类,距离采用绝对值距离,重复聚类5次
    idx = kmeans(x,3,'Distance','city','Replicates',5);   
    [S, H] = silhouette(x,idx)    % 绘制轮廓图,并返回轮廓值向量S和图形句柄H
    
    展开全文
  • 1. 聚类分析结果 2. matlab完整代码 (1)读取数据,并进行标准化 [X,textdata] = xlsread('examp09_02.xls'); % 从Excel文件中读取数据 X = zscore(X); % 数据标准化(减去均值,除以标准差) (2)调用cluster...

    1. 聚类分析结果

    在这里插入图片描述

    2. matlab完整代码

    (1)读取数据,并进行标准化

    [X,textdata] = xlsread('examp09_02.xls');    % 从Excel文件中读取数据
    X = zscore(X);    % 数据标准化(减去均值,除以标准差)
    

    (2)调用clusterdata函数进行一步聚类

    obslabel = textdata(2:end,1); % 提取城市名称,为后面聚类做准备
    % 样品间距离采用欧氏距离,利用类平均法将原始样品聚为3类,Taverage为各观测的类编号
    Taverage = clusterdata(X,‘linkage’,‘average’,‘maxclust’,3);
    obslabel(Taverage == 1) % 查看第1类所包含的城市

    obslabel(Taverage == 2) % 查看第2类所包含的城市

    obslabel(Taverage == 3) % 查看第3类所包含的城市

    (3)分步聚类

    y = pdist(X);    % 计算样品间欧氏距离,y为距离向量
    Z = linkage(y,'average')    % 利用类平均法创建系统聚类树
    
    obslabel = textdata(2:end,1);    % 提取城市名称,为后面聚类做准备
    % 绘制聚类树形图,方向从右至左,显示所有叶节点,用城市名作为叶节点标签,叶节点标签在左侧
    H = dendrogram(Z,0,'orientation','right','labels',obslabel); % 返回线条句柄H
    set(H,'LineWidth',2,'Color','k');    % 设置线条宽度为2,颜色为黑色
    xlabel('标准化距离(类平均法)')    % 为X轴加标签
    
    inconsistent0 = inconsistent(Z,40)    % 计算不一致系数,计算深度为40
    
    展开全文
  • 1. 变量系统聚类分析结果 2. matlab完整代码 (1)读取数据,并转为距离向量 [X,textdata] = xlsread('examp09_03.xls'); % 从Excel文件中读取数据 y = 1 - X(X~=1 & ~isnan(X))' % 提取X矩阵的不等于1和NaN的...

    1. 变量系统聚类分析结果

    在这里插入图片描述

    2. matlab完整代码

    (1)读取数据,并转为距离向量

    [X,textdata] = xlsread('examp09_03.xls');    % 从Excel文件中读取数据
    y = 1 - X(X~=1 & ~isnan(X))'  % 提取X矩阵的不等于1和NaN的元素,并转为距离向量
    

    (2)调用linkage函数创建系统聚类树

    Z = linkage(y,'average')    % 利用类平均法创建系统聚类树
    

    (3)绘制聚类树形图

    varlabel = textdata(2:end,1);    % 提取变量名称,为后面聚类做准备
    % 作出聚类树形图,方向从右至左,显示所有叶节点,用变量名作为叶节点标签,叶节点标签在左侧
    H = dendrogram(Z,0,'orientation','right','labels',varlabel);  % 返回线条句柄H
    set(H,'LineWidth',2,'Color','k');    % 设置线条宽度为2,颜色为黑色
    xlabel('并类距离(类平均法)')    % 为X轴加标签
    
    展开全文
  • 没有系统学习过统计学,看到《Excel统计分析中的应用》这本书,感觉值得一读。 从今天开始,快速学习一下这本书。 1. 总体和样本 总体:对一组数据中的每一个元素进行观察 样本:只对一部分元素进行观察 ...
  • 文章目录1. K均值聚类分析结果2. matlab完整代码(1)读取数据,并... % 从Excel文件中读取数据 row = ~any(isnan(X), 2); % 返回一个逻辑向量,非缺失观测对应元素1,缺失观测对应元素0 X = X(row, :); % 剔除缺失数
  • K均值聚类分析结果 1. 读取数据,并进行标准化变换 % 从文件examp09_05.xls中读取数据 [xdata,textdata] = xlsread('examp09_05.xls'); % 提取元胞数组textdata第1列的第4行至最后一行,即城市名称数据 city = ...
  • 利用MATLAB生成Word和Excel文档、数据的导入导出、数据的预处理、参数估计假设检验、Copula理论及应用实例、方差分析、数据拟合、聚类分析、 判别分析、主成分分析、 因子分析、 图像处理中的统计应用案例
  • 读取文件excel表中单元格A2:H4中的数据2. 读取excel第1个工作表中单元格A2:C3中的数据,将数据分别加1后返回3. 读取excel第1个工作表中单元格A2:H2中的数据,将读取到的数据分别加1,返回数值矩阵num,文本矩阵txt...
  • Excel统计中的应用 实验1. 用Excel作数据整理 实验2. Excel在比较分析中的应用 实验3. Excel在描述统计中的应用 实验4. Excel在时间序列分析中的应用 实验5. 用Excel计算总指数 ... 用Excel作相关回归分析
  • 数据拟合效果预览: 文章目录1. 读取数据,绘制散点图2.... % 从Excel文件读取数据 x = ClimateData(:, 1); % 提取ClimateData的第1列,即年平均气温数据 y = ClimateData(:, 5); % 提取ClimateData的第5列,即全年日
  • 稳健回归效果预览: 文章目录1. 读取数据2. 调用robustfit函数作稳健回归3 .... % 从Excel文件读取数据 x = ClimateData(:, 1); % 提取ClimateData的第1列,即年平均气温数据 y = ClimateData(:, 5); % 提取Clima
  • “回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 446
精华内容 178
关键字:

excel统计分析与应用