精华内容
下载资源
问答
  • MATLAB 统计数据并画出统计直方图

    万次阅读 2019-02-24 20:33:00
    统计FilmTrust(0.5-4.0分)、CiaoDVD(1-5分)、MovieLens(1-5分) 等 rating 数据集分值的分布: 以统计FilmTrust(0.5-4.0分) 为例: MATLAB 代码如下: load('filmTrust_u_i_r.mat') % 载入数据 ...

    统计FilmTrust(0.5-4.0分)、CiaoDVD(1-5分)、MovieLens(1-5分) 等 rating 数据集分值的分布:

     

     以 统计FilmTrust(0.5-4.0分) 为例:

    MATLAB 代码如下:

    load('filmTrust_u_i_r.mat')   % 载入数据
    fprintf('This is filmTrust (0.5-4.0)......')
    
    FilmTrustD=D;
    % count1=count(D(:,3),"0.5")
    % count2=count(D(:,3),"1")--no
    
    num1=length(find(D(:,3)==0.5)); 
    
    x=0.5:0.5:4.0
    y = zeros(1,length(x));
    for z = 1:length(x)
        y(z) = length(find(D(:,3)==x(z)));  % 关键     统计个数用 find !
    end
    y
    
     bar(x,y)  % 根据x轴和y轴,画图

     

    结果截图:

        

     

     

     

     

    【Reference】

    1、  bar 条形图: https://ww2.mathworks.cn/help/matlab/ref/bar.html?s_tid=doc_ta

    2、

    转载于:https://www.cnblogs.com/shenxiaolin/p/10427761.html

    展开全文
  • MATLAB统计数据的密度

    千次阅读 2020-04-27 13:53:20
    设y是一个n维的向量 [f,xi]=ksdensity(y); plot(xi,f);

    设y是一个n维的向量

    [f,xi]=ksdensity(y);
    plot(xi,f);
    
    展开全文
  • 这是一份关于数据统计与分析描述的ppt,之前学习是用到的资源,现在贡献给大家参考。
  • MATLAB-数据统计分析

    万次阅读 2019-08-17 15:39:12
    一、统计量 表示位置的统计量—平均值和中位数. 平均值(或均值,数学期望): 中位数:将数据由小到大排序后位于中间位置的那个数值. 2. 表示变异程度的统计量—标准差、方差和极差. 标准差: 它是各个...

    一、统计量

     

    1. 表示位置的统计量—平均值和中位数.

       平均值(或均值,数学期望):

     中位数:将数据由小到大排序后位于中间位置的那个数值.

    2. 表示变异程度的统计量—标准差、方差和极差.

       标准差

             它是各个数据与均值偏离程度的度量.

       方差:标准差的平方.

           极差:样本中最大值与最小值之差.

    对随机变量x,计算其基本统计量的命令:

    mean(x)均值
    std(x)标准差
    median(x)中位数
    var(x)方差
    

    下文转载:https://www.cnblogs.com/leezx/p/7340045.html

    离散型随机变量分布

    1.两点分布/伯努利分布

    伯努利分布是二项分布在n=1时的特例。一次随机试验,成功概率为p,失败概率为q=1-p。

    伯努利分布

    2.二项分布

    1502348320(1)

    二项分布(Binomial distribution)是n重伯努利试验成功次数的离散概率分布。

    二项分布的典型例子是扔硬币,硬币正面朝上概率为p, 重复扔n次硬币,k次为正面的概率即为一个二项分布概率。

    二项分布

    3.超几何分布

    对N件产品(其中M件次品)进行不放回抽样,在n次抽样种抽到次品数X,服从超几何分布。

    超几何分布

    4.几何分布

    X记首次成功的概率,服从几何分布。

    5.负二项分布

    X记第k次成功时总的实验次数,当k=1时,为几何分布。

    “二项分布”是固定试验总次数N的独立试验中,成功次数k的分布;而“负二项分布”是所有到成功r次时即终止的独立试验中,失败次数k的分布。

    image

    负二项分布

    Negative binomial distribution

    负二项回归模型的统计推断

    例子:

    Pat is required to sell candy bars to raise money for the 6th grade field trip. There are thirty houses in the neighborhood, and Pat is not supposed to return home until five candy bars have been sold. So the child goes door to door, selling candy bars. At each house, there is a 0.4 probability of selling one candy bar and a 0.6 probability of selling nothing.

    What's the probability of selling the last candy bar at the nth house?

    6.泊松分布

    有些事件,我们可以预估这些事件的总数,但是没法知道具体的发生时间。

    如:已知平均每小时出生3个婴儿,请问下一个小时,会出生几个?

    如:已知所有cell中reads的总数,相当于知道均值,问下一个细胞的reads数是多少。

    这些从常理上看,我们会归为均匀分布,但现实就是泊松分布。

    泊松分布和指数分布:10分钟教程

    如何理解泊松分布和泊松过程

     

    连续型随机变量分布

    1.均匀分布

     

    2.指数分布

    指数分布是事件的时间间隔的概率。

    3.正态分布

    反应误差的最重要的分布,确定了均值和标准差就能确定一种正态分布。

     

    参考:

    伯努利分布、二项分布、多项分布、Beta分布、Dirichlet分布

    负二项分布为什么叫这个名字?“负”从何而来?

     

    数字特征

    1.期望

    相当于平均值

    2.方差

    就是方差

    3.协方差

    所以,我们可以定义一个表示X, Y 相互关系的数字特征,也就是协方差

    cov(X, Y) = E(X-EX)(Y-EY)。

    当 cov(X, Y)>0时,表明 X与Y 正相关;

    当 cov(X, Y)<0时,表明X与Y负相关;

    当 cov(X, Y)=0时,表明X与Y不相关。

    这就是协方差的意义。

    终于明白协方差的意义了

    4.相关系数

    image

    翻译一下:就是用X、Y的协方差除以X的标准差和Y的标准差。

    所以,相关系数也可以看成协方差:一种剔除了两个变量量纲影响、标准化后的特殊协方差。

    如何通俗易懂地解释「协方差」与「相关系数」的概念?

    5.矩

    原点矩

    中心矩

     

    其他数字特征

    中位数

    分位数

    众数

    变异系数:将离散程度标准化,等于均值除以方差

    偏态系数

    峰态系数

     

    大数定律

    如果实验次数足够大,样本均值就会趋近于总体的期望

    好吧,学概率的时候,我们总有一种潜在的潜在的观念   

    ——当数很大的时候平均值,就是期望值。   

    比如,我们投骰子,如果我们投100次,求出现的数的平均,我们觉得会差不多是(1+6)/2=3.5 因为我们按照期望计算,算出来就是3.5。   

    但是,这是我们一个假定,我们还需要论证,为什么当数很大的时候,平均值就是期望值呢?  这就是大数定理证明了的了。   

    中心极限定理

    大量相互独立的随机变量,其均值(或者和)的分布以正态分布为极限(意思就是当满足某些条件的时候,比如Sample Size比较大,采样次数区域无穷大的时候,就越接近正态分布)。而这个定理amazing的地方在于,无论是什么分布的随机变量,都满足这个定理。

     

    展开全文
  • 基于数理统计相关基础知识进行MATLAB编程和数据处理方法介绍的相关教程。
  • 1) Dataframes - 一个简洁的统计数据包装器(列中的变量,行中的案例) 2)模型对象的想法 - 运行回归或其他什么,然后取回一个对象来操纵它 所以我已经(部分地)在 MATLAB 中实现了这两个功能。 文档很少,功能...
  • MATLAB统计分析与应用:40个案例分析 程序与数据,这里面有很多算法。比如:数据处理,分类,聚类,回归等等
  • 在概率和统计方法中,经常需要绘制图表从而直观地展现数据。下面简介几种常用统计图表绘图函数.

    绘制统计图表

    在概率和统计方法中,经常需要绘制图表从而直观地展现数据。下面简介几种常用统计图表绘图函数.



    1. 正整数频率表

    绘制正整数频率表的函数为 t a b u l a t e tabulate tabulate.

    table = tabulate(X)
    

    X X X 为正整数构成的向量,返回三列:
    首列包含 X X X 的值,第二列为这些值的个数,第三列为这些值的频率。

    [例]

    >> A = [1 1 4 5 1 4 1 9 1 9 8 1 0];
    >> tabulate(A)
      Value    Count   Percent
          0        1      7.69%
          1        6     46.15%
          4        2     15.38%
          5        1      7.69%
          8        1      7.69%
          9        2     15.38%
    >> 
    

    2. 经验累积分布函数图形

    绘制经验累积分布函数图形的函数为 c d f p l o t cdfplot cdfplot.

    1. cdfplot(X)
    2. h = cdfplot(X)
    3. [h,stats] = cdfplot(X)
    
    1. 作样本 X X X 的累积分布函数图形
    2. h h h 表示曲线的环柄。
    3. s t a t s stats stats 表示样本的一些特征。

    [例]

    >> X = normrnd(0,1,114,1);
    >> [h,stats] = cdfplot(X)
    
    h = 
    
      Line with properties:
    
                  Color: [0 0.4470 0.7410]
              LineStyle: '-'
              LineWidth: 0.5000
                 Marker: 'none'
             MarkerSize: 6
        MarkerFaceColor: 'none'
                  XData: [1×230 double]
                  YData: [1×230 double]
                  ZData: [1×0 double]
    
      Show all properties
    
    
    stats = 
    
      struct with fields:
    
           min: -2.9443                 %样本最小值
           max: 3.5784                  %样本最大值
          mean: 0.1015                  %样本均值
        median: 0.0930                  %样本中间值
           std: 1.1459                  %样本标准差
    

    经验累积分布函数图像如下图所示:
    Fig.0


    3. 最小二乘拟合曲线

    绘制最小二乘拟合曲线的函数为 l s l i n e lsline lsline.

    h = lsline
    

    h h h 为直线的句柄。

    [例]

    >> x=linspace(0,10);
    >> y=x+rand(size(x));
    >> scatter(x,y)
    >> h=lsline;
    >> set(h,'LineWidth',3,'LineStyle','--','Color',[1 0 1])
    

    运行后得到最小二乘拟合直线如下图所示:
    Fig.1


    4. 正态分布概率图形

    绘制正态分布概率图形的函数是 n o r m p l o t normplot normplot.

    1. normplot(X)
    2. h = normplot(X)
    
    1. X X X 为向量,则显示正态分布概率图形;若 X X X 为矩阵,则显示每一列的正态分布概率图形。
    2. 返回绘图直线的句柄。

    [例]

    >> X = [1,1,4;5,1,4;1,9,1;9,8,1]
    
    X =
    
         1     1     4
         5     1     4
         1     9     1
         9     8     1
    
    
    >> h = normplot(X)
    
    h = 
    
      9×1 Line array:
    
      Line
      Line
      Line
      Line
      Line
      Line
      Line
      Line
      Line
    
    >> normplot(X)
    

    所得正态分布概率图形如下图所示:
    Fig.2


    5. Weibull概率图形

    绘制 Weibull 概率图形的函数为 w e i b p l o t weibplot weibplot .

    1. weibplot(X)
    2. h = weibplot(X)
    
    1. X X X 为向量,则显示 Weibull 概率图形;若 X X X 为矩阵,则显示每一列的 Weibull 概率图形。
    2. 返回绘图直线的句柄。

    [例]

    >> X = [1,1,4;5,1,4;1,9,1;9,8,1]
    
    X =
    
         1     1     4
         5     1     4
         1     9     1
         9     8     1
    
    weibplot(X)
    

    运行后得到 Weibull 概率图形如下图所示:

    (然而本飞舞的MATLAB上并没有这个函数,哭哭,,,)


    6. 样本数据盒图

    绘制样本数据盒图的函数是 b o x p l o t boxplot boxplot.

    1. boxplot(X)
    2. boxplot(X,notch)
    3. boxplot(X,notch,'sym')
    4. boxplot(X,notch,'sym',vert)
    5. boxplot(X,notch,'sym',vert,whis)
    
    1. 产生矩阵 X X X 的每一列的盒图和“须”图.
    2. n o t c h = 1 notch = 1 notch=1 时产生凹盒图, n o t c h = 0 notch = 0 notch=0 时产生矩箱图.
    3. s y m sym sym 表示图形符号,默认为 “+”.
    4. v e r t = 0 vert = 0 vert=0 时生成水平盒图, v e r t = 1 vert = 1 vert=1 时生成竖直盒图,默认值为1.
    5. w h i s whis whis 定义“须”图的长度,默认值为1.5.

    [例]

    >> x1 = normrnd(5,1,100,1);
    >> x2 = normrnd(6,1,100,1);
    >> x = [x1,x2];
    >> boxplot(x,1,'g--',1,0)
    

    运行后所得盒图如下图所示:
    Fig.4


    7. 为图形增加参考线

    为当前图形增加一条参考线需调用函数 r e f l i n e refline refline.

    1. refline(slope,intercept)
    2. refline(slope)
    
    1. s l o p e slope slope 表示直线斜率, i n t e r c e p t intercept intercept 表示直线截距.
    2. s l o p e = [ a , b ] slope = [a,b] slope=[a,b]:在图中绘制一条直线: y = a x + b y = ax + b y=ax+b.

    [例]

    >> y = [1.1 4.5 1.4 1.9 1.9 8.1 0.3 6.4 8.9 3.1 ]';
    >> plot(y,'+')
    >> refline(0,3.64)
    

    运行后所得图形如下图所示:
    Fig.5


    8. 为图形增加多项式曲线

    在当前图形上绘制一条多项式曲线的函数是 r e f c u r v e refcurve refcurve.

    h = refcurve(p)
    

    在图中加入一条多项式曲线: h h h 为曲线的环柄, p p p 为多项式系数向量: p = [ p 1 , p 2 , ⋯   , p n ] p = [p_{1},p_{2},\cdots,p_{n}] p=[p1,p2,,pn],其中 p 1 p_{1} p1 为最高幂次项系数。

    [例]

    >> h = [114 514 191 981 036 436 419 191 981 145 141 919 810];
    >> plot(h,'--')
    >> refcurve([-5.14 114 0])
    

    运行后所得多项式曲线图形如下图所示:
    Fig.6


    9. 绘制样本概率图形

    绘制样本概率图形的函数为 c a p a p l o t capaplot capaplot.

    p = capaplot(data,specs)
    

    返回来自于估计分布的随机变量落在指定范围内的概率。 d a t a data data 为所给的样本数据, s p e c s specs specs 指定范围, p p p 表示在指定范围内的概率。

    [例]

    >> h = [114 514 191 981 036 436 419 191 981 145 141 919 810];
    >> s = [364,514];
    >> p = capaplot(h,s)
    
    p =
    
        0.1665
    
    >> 
    

    运行后所得图形如下图所示.
    Fig.7


    10. 绘制附加有正态密度曲线的直方图

    绘制附加有正态密度分布曲线的直方图的函数是 h i s f i t hisfit hisfit.

    1. hisfit(data)
    2. hisfit(data,nbins)
    
    1. d a t a data data 为向量,函数返回直方图和正态曲线。
    2. n b i n s nbins nbins 为指定 b a r bar bar 个数的量。

    [例]

    >> r = normrnd(10,1,100,1);
    >> histfit(r)
    

    运行后所得附有正态密度分布曲线直方图如下图所示.
    Fig.8


    11. 在指定的界线间绘制正态密度曲线

    在指定界线间绘制正态密度曲线的函数是 n o r m s p e c normspec normspec.

    p = normspec(specs,mu,sigma)
    

    s p e c s specs specs 指定界线, m u mu mu s i g m a sigma sigma 为正态分布的参数, p p p 为样本落在上、下界之间的概率.

    [例]

    >> normspec([10 Inf],11.4,5.14)
    
    ans =
    
        0.6073
    
    >> 
    

    运行后所得在指定界限间绘制正态密度曲线如下图所示.
    Fig.9

    展开全文
  • MATLAB统计分析-数据预处理

    千人学习 2019-09-04 20:35:32
    MATLAB数据分析之数据预处理,包括缺失值的处理、异常值的处理、数据平滑和数据变换。
  • MATLAB统计分析与应用:40个案例分析 源代码和数据合集
  • MATLAB统计分析与应用:40个案例分析》程序与数据.rar
  • matlab统计降级代码当地 该存储库由 NCL 和 MATLAB 代码组成,用于处理、分析和绘制局部构造模拟(LOCA;Pierce et al. 2014)统计缩小的网格气候数据。 网格化气候数据包括 29 耦合模型比对项目 5 (CMIP5) 的美国...
  • MATLAB统计应用

    2018-06-21 10:19:57
    本书从实际应用的角度出发,以大量的案例详细介绍了MATLAB环境下的统计分析与应用。内容包括:利用MATLAB制作统计报告或报表;从文件中读取数据MATLAB;从MATLB中导出数据到文件;数据的平滑处理、标准化变换和极...
  • matlab数据统计方法

    2018-12-25 21:06:49
    本书介绍数据分析的基本内容与方法,应用 MATLAB软件既面向对象又面向过程地编写实际数据分析程序。全书共分7章,主要内容包括:MATLAB基础、数据描述性分析、回归分析、判别分析、主 成分分析与典型相关分析、聚类...
  • MATLAB数据分析和统计ppt-MATLAB-数据分析和统计.ppt 极好的数据分析与处理的课件
  • MATLAB数据分析

    2020-07-10 08:05:06
    MATLAB数据处理• “导入和导出数据” (第 1-2 页) • “绘制数据” (第 1-3 页) • “MATLAB 中的缺失数据” (第 1-6 页) • “数据平滑和离群值检测” (第 1-11 页) • “不一致的数据” (第 1-24 页) ...
  • matlab直接提供了产生随机数的通用函数,但针对不同的分布,函数形式会有所不同,但通用公式如下: 命令:namernd(A,B,m,n) y = random(‘name’,A1,A2,A3, m, n) 说明:对于namernd(A,B,m,n)函数,m和n表示产生...
  • MATLAB统计分析与应用:40个案例分析》内容及各章节程序与数据
  • MATLAB-数据分析和统计

    2011-08-12 23:19:30
    MATLAB-数据分析和统计MATLAB-数据分析和统计MATLAB-数据分析和统计MATLAB-数据分析和统计
  • 基于Matlab语言的统计数据异常值检验.pdf
  • MATLAB各种概率分布统计分析画图

    万次阅读 多人点赞 2019-09-25 10:27:09
    4.6 统计作图 4.6.1 正整数的频率表 命令 正整数的频率表 函数 tabulate 格式 table = tabulate(X) %X为正整数构成的向量,返回3列:第1列中包含X的值第2列为这些值的个数,第3列为这些值的频率。 例4-49 >...
  • matlab读取表格,并统计成绩,得出最高分,平均分,和中间的成绩
  • cloudPlot 将有助于可视化二维数据集的分布。 在查看非常大的数据集时,它特别有用,其中红色图 (x,y,'.') 只会用纯色填充图,因为测量点彼此... cloudPlot 使用内置的 matlab 例程来设置适合数据的轴限制和网格点。
  • Matlab 统计数组中各元素出现的频数、频率

    万次阅读 多人点赞 2019-02-27 15:58:13
    第一种方法:调用MATLAB自带的函数tabulate统计一个数组中各数字(元素)出现的频数、频率 【例1】统计数值型数组中各元素出现的频数、频率。 &gt;&gt; x = [2 2 6 5 2 3 2 4 3 4 3 4 4 4 4 2 2 6 0 4 7 .....
  • 数据统计与分析的基础理论讲解以及基于matlab的相关例题代码实现
  • 如何利用MATLAB数据统计分析?

    千次阅读 多人点赞 2020-04-15 18:53:02
    本文是科学计算与MATLAB语言的专题6的第1小节总结笔记,并结合了自己一点的理解,看完本文,可以轻松借助MATLAB数据进行分析,如求矩阵或向量的最大元素、最小元素、平均值、中值等等。 1 求最大元素与最小元素 ...
  • MATLAB统计分析与应用40个案例分析程序与数据-《MATLAB统计分析与应用:40个案例分析》程序与数据(2).zip 《MATLAB统计分析与应用:40个案例分析》程序与数据
  • 数组的MODE统计模式MODE(X) 返回数组 X 中出现频率最高的元素。 X 可以是字符数组或字符串元胞数组。 示例:mode([3 9 4 2 3 2]) 返回 [2;3]
  • 基于Matlab数据统计.pdf

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 33,754
精华内容 13,501
关键字:

matlab统计数据

matlab 订阅