精华内容
下载资源
问答
  • R语言数据框实现分类汇总

    千次阅读 2019-03-21 15:00:24
    然而R语言没有直接的数据框方法来统计每种情况出现的次数。可以用table方法先统计数据框的因子(factor)水平数(levels),然后再将其转为数据框即可。方法如下: #先取到“方案执行情况”的一维频数表 > b<-...

    我们经常需要数据的分类统计功能,如下图中方案执行情况的统计:数据框示例
    然而R语言没有直接的数据框方法来统计每种情况出现的次数。可以用table方法先统计数据框的因子(factor)水平数(levels),然后再将其转为数据框即可。方法如下:

    > b<-table(a$方案执行情况) 
    > b
    
          方案未实施  没有方案   需要彻底整改    需要彻底整改观察      正常 
             9          3             4                1            16 
    > c<-data.frame(b)  
    > names(c)=c("方案执行情况","数量")
    > c
          方案执行情况 数量
    1       方案未实施    9
    2         没有方案    3
    3     需要彻底整改    4
    4 需要彻底整改观察    1
    5             正常   16
    
    

    数据框C中就是方案执行的分类统计情况,是不是超简单。

    展开全文
  • R语言分类汇总

    2020-04-16 14:43:23
    R语言分类汇总 ##加载包 library(dplyr) ##函数 group_by 制定数据集 data 中针对 type 变量进行分类汇总 grou <- group_by(data,type) ##summarise函数计算分类结果——sd 标准差,还可计算其他类,分类汇总 ...

    R语言分类汇总

    ##加载包
    library(dplyr)
    ##函数 group_by 制定数据集 data 中针对 type 变量进行分类汇总
    grou <- group_by(data,type)
    ##summarise函数计算分类结果——sd 标准差,还可计算其他类,分类汇总
    type_sd <- summarise(grou ,sd(range ,na.rm = T))
    

    data数据集
    在这里插入图片描述
    grou <- group_by(data,type)
    在这里插入图片描述
    type_sd <- summarise(grou ,sd(range ,na.rm = T))计算标准差结果
    在这里插入图片描述

    展开全文
  • R数据分类汇总

    2020-07-04 17:14:36
    数据分类汇总

    数据的分类汇总

    数据的分类汇总是数据过滤、重组的重要内容,有时候我们需要将某些属性值计算到一类中,如果数据量非常大,R提供了快捷的计算方法,在处理工业企业数据库的过程中遇到一些问题,本文将数据改为鸢尾花数据,实际处理数据过程中遇到的问题罗列下来,并提出了解决方案。主要问题如下:

    • 将花萼长度求和汇总到不同类型鸢尾花之中
    • 求不同类型鸢尾花花萼长度的最大值
    • 求不同类型鸢尾花花萼长度的平均值
    • 每种类型的鸢尾花返回出一行数据(求唯一值)
    • 对单个变量进行升序排列
    • 对单个变量进行降序排列
    • 对两个变量或多个变量进行排序
    • 通过排序求出不同类型鸢尾花数据花萼长度的最大值
    • 将不同类型的鸢尾花花萼长度值汇总并放在一行

    解决方案如下
    本文研究数据为iris数据集,如果想对数据集进行进一步了解,可参考:iris数据集介绍

     #extract data
    > da <- iris[c(1:10,51:60,101:110),]
    > da
        Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
    1            5.1         3.5          1.4         0.2     setosa
    2            4.9         3.0          1.4         0.2     setosa
    3            4.7         3.2          1.3         0.2     setosa
    4            4.6         3.1          1.5         0.2     setosa
    5            5.0         3.6          1.4         0.2     setosa
    6            5.4         3.9          1.7         0.4     setosa
    7            4.6         3.4          1.4         0.3     setosa
    8            5.0         3.4          1.5         0.2     setosa
    9            4.4         2.9          1.4         0.2     setosa
    10           4.9         3.1          1.5         0.1     setosa
    51           7.0         3.2          4.7         1.4 versicolor
    52           6.4         3.2          4.5         1.5 versicolor
    53           6.9         3.1          4.9         1.5 versicolor
    54           5.5         2.3          4.0         1.3 versicolor
    55           6.5         2.8          4.6         1.5 versicolor
    56           5.7         2.8          4.5         1.3 versicolor
    57           6.3         3.3          4.7         1.6 versicolor
    58           4.9         2.4          3.3         1.0 versicolor
    59           6.6         2.9          4.6         1.3 versicolor
    60           5.2         2.7          3.9         1.4 versicolor
    101          6.3         3.3          6.0         2.5  virginica
    102          5.8         2.7          5.1         1.9  virginica
    103          7.1         3.0          5.9         2.1  virginica
    104          6.3         2.9          5.6         1.8  virginica
    105          6.5         3.0          5.8         2.2  virginica
    106          7.6         3.0          6.6         2.1  virginica
    107          4.9         2.5          4.5         1.7  virginica
    108          7.3         2.9          6.3         1.8  virginica
    109          6.7         2.5          5.8         1.8  virginica
    110          7.2         3.6          6.1         2.5  virginica
    
    #aggregate data
    #Calculate the sum value
    > data_sum <- aggregate(Sepal.Length~Species,data=da,sum)
    > names(data_sum)[2] <- "Sepal.Length_sum"
    > data_sum
         Species Sepal.Length_sum
    1     setosa             48.6
    2 versicolor             61.0
    3  virginica             65.7
     #calculate the max value
    > data_max <- aggregate(Sepal.Width~Species,data = da,max)
    > names(data_max)[2] <- "Sepal.Length_max"
    > data_max
         Species Sepal.Length_max
    1     setosa              3.9
    2 versicolor              3.3
    3  virginica              3.6
     #Calculate the average value
    > data_mean<- aggregate(Petal.Length~Species,data = da,mean)
    > names(data_mean)[2] <- "Sepal.Length_mean"
    > data_mean
         Species Sepal.Length_mean
    1     setosa              1.45
    2 versicolor              4.37
    3  virginica              5.77
    > #perserve the unique value of "Species"
    > Species_unique <- da[!duplicated(da$Species),]
    > Species_unique
        Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
    1            5.1         3.5          1.4         0.2     setosa
    51           7.0         3.2          4.7         1.4 versicolor
    101          6.3         3.3          6.0         2.5  virginica
    #order the value of Speal.Length
    > da[order(da$Sepal.Length,decreasing = FALSE),] #ascending
        Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
    9            4.4         2.9          1.4         0.2     setosa
    4            4.6         3.1          1.5         0.2     setosa
    7            4.6         3.4          1.4         0.3     setosa
    3            4.7         3.2          1.3         0.2     setosa
    2            4.9         3.0          1.4         0.2     setosa
    10           4.9         3.1          1.5         0.1     setosa
    58           4.9         2.4          3.3         1.0 versicolor
    107          4.9         2.5          4.5         1.7  virginica
    5            5.0         3.6          1.4         0.2     setosa
    8            5.0         3.4          1.5         0.2     setosa
    1            5.1         3.5          1.4         0.2     setosa
    60           5.2         2.7          3.9         1.4 versicolor
    6            5.4         3.9          1.7         0.4     setosa
    54           5.5         2.3          4.0         1.3 versicolor
    56           5.7         2.8          4.5         1.3 versicolor
    102          5.8         2.7          5.1         1.9  virginica
    57           6.3         3.3          4.7         1.6 versicolor
    101          6.3         3.3          6.0         2.5  virginica
    104          6.3         2.9          5.6         1.8  virginica
    52           6.4         3.2          4.5         1.5 versicolor
    55           6.5         2.8          4.6         1.5 versicolor
    105          6.5         3.0          5.8         2.2  virginica
    59           6.6         2.9          4.6         1.3 versicolor
    109          6.7         2.5          5.8         1.8  virginica
    53           6.9         3.1          4.9         1.5 versicolor
    51           7.0         3.2          4.7         1.4 versicolor
    103          7.1         3.0          5.9         2.1  virginica
    110          7.2         3.6          6.1         2.5  virginica
    108          7.3         2.9          6.3         1.8  virginica
    106          7.6         3.0          6.6         2.1  virginica
    > da[order(da$Sepal.Length,decreasing = TRUE),] #decresing
        Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
    106          7.6         3.0          6.6         2.1  virginica
    108          7.3         2.9          6.3         1.8  virginica
    110          7.2         3.6          6.1         2.5  virginica
    103          7.1         3.0          5.9         2.1  virginica
    51           7.0         3.2          4.7         1.4 versicolor
    53           6.9         3.1          4.9         1.5 versicolor
    109          6.7         2.5          5.8         1.8  virginica
    59           6.6         2.9          4.6         1.3 versicolor
    55           6.5         2.8          4.6         1.5 versicolor
    105          6.5         3.0          5.8         2.2  virginica
    52           6.4         3.2          4.5         1.5 versicolor
    57           6.3         3.3          4.7         1.6 versicolor
    101          6.3         3.3          6.0         2.5  virginica
    104          6.3         2.9          5.6         1.8  virginica
    102          5.8         2.7          5.1         1.9  virginica
    56           5.7         2.8          4.5         1.3 versicolor
    54           5.5         2.3          4.0         1.3 versicolor
    6            5.4         3.9          1.7         0.4     setosa
    60           5.2         2.7          3.9         1.4 versicolor
    1            5.1         3.5          1.4         0.2     setosa
    5            5.0         3.6          1.4         0.2     setosa
    8            5.0         3.4          1.5         0.2     setosa
    2            4.9         3.0          1.4         0.2     setosa
    10           4.9         3.1          1.5         0.1     setosa
    58           4.9         2.4          3.3         1.0 versicolor
    107          4.9         2.5          4.5         1.7  virginica
    3            4.7         3.2          1.3         0.2     setosa
    4            4.6         3.1          1.5         0.2     setosa
    7            4.6         3.4          1.4         0.3     setosa
    9            4.4         2.9          1.4         0.2     setosa
    > da[order(-da$Sepal.Length,decreasing = FALSE),] #decresing
        Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
    106          7.6         3.0          6.6         2.1  virginica
    108          7.3         2.9          6.3         1.8  virginica
    110          7.2         3.6          6.1         2.5  virginica
    103          7.1         3.0          5.9         2.1  virginica
    51           7.0         3.2          4.7         1.4 versicolor
    53           6.9         3.1          4.9         1.5 versicolor
    109          6.7         2.5          5.8         1.8  virginica
    59           6.6         2.9          4.6         1.3 versicolor
    55           6.5         2.8          4.6         1.5 versicolor
    105          6.5         3.0          5.8         2.2  virginica
    52           6.4         3.2          4.5         1.5 versicolor
    57           6.3         3.3          4.7         1.6 versicolor
    101          6.3         3.3          6.0         2.5  virginica
    104          6.3         2.9          5.6         1.8  virginica
    102          5.8         2.7          5.1         1.9  virginica
    56           5.7         2.8          4.5         1.3 versicolor
    54           5.5         2.3          4.0         1.3 versicolor
    6            5.4         3.9          1.7         0.4     setosa
    60           5.2         2.7          3.9         1.4 versicolor
    1            5.1         3.5          1.4         0.2     setosa
    5            5.0         3.6          1.4         0.2     setosa
    8            5.0         3.4          1.5         0.2     setosa
    2            4.9         3.0          1.4         0.2     setosa
    10           4.9         3.1          1.5         0.1     setosa
    58           4.9         2.4          3.3         1.0 versicolor
    107          4.9         2.5          4.5         1.7  virginica
    3            4.7         3.2          1.3         0.2     setosa
    4            4.6         3.1          1.5         0.2     setosa
    7            4.6         3.4          1.4         0.3     setosa
    9            4.4         2.9          1.4         0.2     setosa
     #order two values(Speal.Length and Species,Species is important)
    > da[order(da$Species,da$Sepal.Length,decreasing = FALSE),] 
        Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
    9            4.4         2.9          1.4         0.2     setosa
    4            4.6         3.1          1.5         0.2     setosa
    7            4.6         3.4          1.4         0.3     setosa
    3            4.7         3.2          1.3         0.2     setosa
    2            4.9         3.0          1.4         0.2     setosa
    10           4.9         3.1          1.5         0.1     setosa
    5            5.0         3.6          1.4         0.2     setosa
    8            5.0         3.4          1.5         0.2     setosa
    1            5.1         3.5          1.4         0.2     setosa
    6            5.4         3.9          1.7         0.4     setosa
    58           4.9         2.4          3.3         1.0 versicolor
    60           5.2         2.7          3.9         1.4 versicolor
    54           5.5         2.3          4.0         1.3 versicolor
    56           5.7         2.8          4.5         1.3 versicolor
    57           6.3         3.3          4.7         1.6 versicolor
    52           6.4         3.2          4.5         1.5 versicolor
    55           6.5         2.8          4.6         1.5 versicolor
    59           6.6         2.9          4.6         1.3 versicolor
    53           6.9         3.1          4.9         1.5 versicolor
    51           7.0         3.2          4.7         1.4 versicolor
    107          4.9         2.5          4.5         1.7  virginica
    102          5.8         2.7          5.1         1.9  virginica
    101          6.3         3.3          6.0         2.5  virginica
    104          6.3         2.9          5.6         1.8  virginica
    105          6.5         3.0          5.8         2.2  virginica
    109          6.7         2.5          5.8         1.8  virginica
    103          7.1         3.0          5.9         2.1  virginica
    110          7.2         3.6          6.1         2.5  virginica
    108          7.3         2.9          6.3         1.8  virginica
    106          7.6         3.0          6.6         2.1  virginica
    #calculate the max of "Speal.Length" in different Species
    > da_dec <- da[order(da$Species,-da$Sepal.Length,decreasing = FALSE),] #First, order the value
    > da_uni <- da_dec[!duplicated(da_dec$Species),] #Second, extact the unique value of "Species"
    > da_uni #results
        Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
    6            5.4         3.9          1.7         0.4     setosa
    51           7.0         3.2          4.7         1.4 versicolor
    106          7.6         3.0          6.6         2.1  virginica
    
    #let Sepal.Length according to Species in a row 
    > library(dplyr)
    > Species_summary <- da %>% group_by(Species) %>% summarise(su = paste(Sepal.Length,collapse = ","))
    > Species_summary
    # A tibble: 3 x 2
      Species    su                                     
      <fct>      <chr>                                  
    1 setosa     5.1,4.9,4.7,4.6,5,5.4,4.6,5,4.4,4.9    
    2 versicolor 7,6.4,6.9,5.5,6.5,5.7,6.3,4.9,6.6,5.2  
    3 virginica  6.3,5.8,7.1,6.3,6.5,7.6,4.9,7.3,6.7,7.2
    
    展开全文
  • R语言:排序、筛选以及分类汇总操作

    万次阅读 多人点赞 2018-02-26 21:25:54
    在Excel中我们可以很方便的对数据进行排序、筛选、分类汇总等基本操作,R语言中没有这种傻瓜式的一键操作,如何才能完成这种操作?一、排序1、单变量序列排序 单变量序列的排序常用到rank、sort和order函数。 给一...

      在Excel中我们可以很方便的对数据进行排序、筛选、分类汇总等基本操作,R语言中没有这种傻瓜式的一键操作,如何才能完成这种操作?

    一、排序

    1、单变量序列排序

      单变量序列的排序常用到rank、sort和order函数。

      给一个例子:

    > a <- c(3, 1, 5)
    > rank(a)
    [1] 2 1 3
    > sort(a)
    [1] 1 3 5
    > order(a)
    [1] 2 1 3

      

      下面简单解释一下:rank用来计算序列中每个元素的秩,这里的“秩”可以理解为该元素在序列中由小到大排列的次序,上面例子给出的序列[3, 1, 5]中,1最小,5最大,3居中,于是1的秩为1,3的秩为2,5的秩为3,[3, 1, 5]对应的秩的结果就是[2,1, 3];sort函数给出的是排序后的结果,比方说序列[3,1, 5]使用sort按升序规则排序后的结果是[1, 3, 5];而order函数给出的是排序后的序列中各元素在原始序列中的位置,序列[3, 1, 5]按升序规则排序后的结果是[1, 3, 5] ,其中[1, 3, 5]在原始序列中的位置是[2, 1, 3]。

      接下来介绍一下这三个函数的参数:

      rank(x,na.last = TRUE,

            ties.method = c("average","first", "last", "random", "max","min"))

      order(...,na.last = TRUE, decreasing = FALSE,

             method = c("auto","shell", "radix"))

      sort(x,decreasing = FALSE, na.last = NA, ...)

      x或... :要进行排序的序列;

      na.last:表示对缺失值的处理办法,若为TRUE则将缺失值排在最后,若为FALSE则排在最前,若为NA则排序时先将缺失值剔除;

      ties.method:表示对序列有“结”(即序列中存在相同的元素)时的处理方法,可以有"average","first", "last", "random", "max","min"等选择;

      decreasing : 默认为FALSE表示按升序排列,若为TRUE则按降序排列;

      method:表示排序使用的算法,可以有"auto","shell", "radix"等选择。

    2、数据表(矩阵)排序

        如何像Excel中那样将数据表按某列升序或降序排列?我们可以使用order函数巧妙的完成这个操作,以R语言自带的鸢尾花(iris)数据集为例:

    > head(iris)
     Sepal.Length Sepal.Width Petal.Length Petal.Width Species
    1          5.1         3.5          1.4         0.2 setosa
    2          4.9         3.0          1.4         0.2 setosa
    3          4.7         3.2          1.3        0.2  setosa
    4          4.6         3.1          1.5         0.2 setosa
    5          5.0         3.6          1.4         0.2 setosa
    6          5.4         3.9          1.7         0.4 setosa

      可以看到,该数据集有Sepal.Length、Sepal.Width、Petal.Length、Petal.Width和Species五个变量,下面我们按照花萼宽度(Sepal.Width)进行升降序排列:

    ## 升序
    iris[order(iris$Sepal.Width), ]
    ## 降序
    iris[order(iris$Sepal.Width, decreasing= T), ]

      升序:

      降序:


      除此之外,升降序排列还可以使用dplyr包的arrange函数。arrange函数用法简单,使用形式为arrange(数据表名,变量名),如果是降序排列则可以arrange(数据表名,-变量名)或arrange(数据表名,desc(变量名))。特别值得一提的是,arrange函数还有arrange(数据表名,变量名1,变量名2,...)这种形式的用法,表示如果数据在“变量1”的值相同时按照“变量2”排序。

    library(dplyr)
    ## Sepal.Width升序
    arrange(iris, Sepal.Width)
    ## Sepal.Width降序
    arrange(iris, desc(Sepal.Width))
    ## Sepal.Width升序,当Sepal.Width相同时按Petal.Length降序
    arrange(iris, Sepal.Width,-Petal.Length)

      通过对比可以看到,使用arrange进行排序后,数据表的行号重新从1开始排列了,而使用order的方式中排序后的数据表的行号仍然使用原始数据表的行号。

     

    二、筛选

      许多筛选工作都可以使用which函数完成,例如:

      挑选出iris数据集中Sepal.Width为2的数据:

    >iris[which(iris$Sepal.Width == 2), ]
       Sepal.Length Sepal.Width Petal.LengthPetal.Width    Species
    61            5           2          3.5           1 versicolor

      挑选出iris数据集中Sepal.Width大于4的数据:

    >iris[which(iris$Sepal.Width > 4), ]
       Sepal.Length Sepal.Width Petal.LengthPetal.Width Species
    16          5.7         4.4          1.5         0.4 setosa
    33          5.2         4.1          1.5         0.1 setosa
    34          5.5         4.2          1.4         0.2 setosa

      挑选出iris数据集中Species为setosa的数据:

    iris[which(iris$Species== 'setosa'), ]

      如果挑选Species为setosa或virginica的数据呢,当然我们可以用“或”的运算符“|”来构建:

    iris[which((iris$Species== 'setosa') | (iris$Species == 'virginica')), ]

      但是我们推荐使用 %in% 操作符,a %in% b 将生成一个与a长度相同的logical序列,依次判断a中的元素是否被包含在b中。因此,上面的筛选问题可以使用 %in% 操作符解决:

    iris[which(iris$Species%in% c('setosa', 'virginica')), ]

      当然,不使用which,直接使用which内的判别式作为索引因也可以达到相同的筛选目的:

    iris[iris$Sepal.Width== 2, ]
    iris[iris$Sepal.Width> 4, ]
    iris[iris$Species== 'setosa', ]
    iris[(iris$Species== 'setosa') | (iris$Species == 'virginica'), ]
    iris[iris$Species%in% c('setosa', 'virginica'), ]

     

      同样,dplyr包也可以进行筛选操作,需使用filter函数。

    filter(iris,Sepal.Width == 2)
    filter(iris,Sepal.Width > 4)
    filter(iris,Species == 'setosa')
    filter(iris,Species %in% c('setosa', 'virginica'))

     

    三、分类汇总

      假如我们要对iris数据集进行分类汇总,比方说计算不同Species中Sepal.Width的平均值。

      第一种思路是使用split函数和sapply函数,首先将序列Sepal.Width按照Species划分成子集,然后对每个子集求平均:

    >a <- split(iris$Sepal.Width, iris$Species)
    >sapply(a, mean)
        setosa versicolor  virginica
         3.428     2.770      2.974

      split(x, f,drop = FALSE, ...)

      x      要进行划分的数据

      f      划分的依据,可以是list,表示按list中各变量的Level组合来划分

      drop   默认为FALSE,若为TRUE,当f为list时,各变量的Level组合为空时自动舍弃这一分组


      第二种思路是使用aggregate函数:

      aggregate(x,by, FUN, ..., simplify = TRUE, drop = TRUE)

      x          要分类汇总的数据,可以是各种形式,包括公式形式

      by         分类依据,必须是list形式

      FUN        汇总使用的函数

      simplify  默认为TRUE,表示汇总结果以简化形式表现

      drop      默认为TRUE,表示不存在的Level组合自动舍弃

    > aggregate(x = iris$Sepal.Width, by= list(iris$Species), FUN = mean)
        Group.1     x
    1    setosa 3.428
    2 versicolor 2.770
    3 virginica 2.974
    > aggregate(x = iris[, 1:2], by =list(iris$Species), FUN = mean)
        Group.1 Sepal.Length Sepal.Width
    1    setosa        5.006       3.428
    2 versicolor        5.936       2.770
    3 virginica        6.588       2.974

    展开全文
  • R语言数据集常用操作汇总

    千次阅读 2020-05-12 23:01:32
    在做数据挖掘时,拿来的数据集一般不能直接用,要进行一些操作比如总览、重命名、合并、删除等等,现在本人把这些操作总结出来,以备后用。 下面我们以一个美国出租车的数据集taxi.csv(以下简称dataset)为例进行...
  • library(dplyr) ###加载dplyr模块 ...-read.csv("f:\\TEST\\TDD.csv") ####加载数据 D=data.frame(A) ##### A1<-group_by(D,Date_ID) ####分组项 A2<-summarise(A1,cells=n(), ####统计个数 RRC_ch...
  • R语言ggplot包之数据分布汇总

    万次阅读 2015-07-20 22:19:41
    引言我们经常想观察一批数据的分布形态,...条形图主要用于展示分类数据,即名义数据,各组分开而立。而直方图多用于展示数值型数据,各组相依。单组直方图最基本的语句就是在ggplot语句后再加geom_histogram()即可。l
  • 给了一组股票的数据 股票代码一共8位 前6位代表不同的industry 求问怎么样能按照前六位分成不同的industry呢? 部分数据如下 ![图片说明](https://img-ask.csdn.net/upload/202009/09/1599622971_197718.png) ...
  • 文本分类数据汇总名词解释一、“达观杯”文本智能处理挑战赛数据集1、数据格式2、测试集:test_set.csv数据集二数据集三参考文献 名词解释 (1)脱敏处理 一、“达观杯”文本智能处理挑战赛数据集 “达观杯”文本...
  • 用各种工具对数据进行分类汇总

    千次阅读 2018-06-04 15:10:19
    数据分类汇总的方法有很多种,工具也有很多,这次为大家一一介绍,各种工具如何进行分类汇总,大家自行判断,觉得哪种最好用,就用哪种,毕竟工具不重要,高效出结果才最重要。为了方便举例,所用的数据集就是鸾尾花...
  • 如何对数据进行汇总统计(R语言)

    万次阅读 2018-10-30 21:10:48
    这里模拟了4个因子,5个观测值的数据框, 主要介绍了一下几种方法的汇总统计: 1, 单变量~单因子,单个个统计量, 这里使用平均数mean 2 单变量~单因子,多个个统计量, 这里使用自定义的函数func 3 单变量 ~ 多因子, ...
  • R语言资源汇总

    千次阅读 2018-12-03 12:29:59
    Nomogram的教程:Logistic、Cox回归之图形化呈现(R语言中绘制Nomogram)、教你用R画列线图,形象展示预测模型的结果、基于R的生存资料预测模型构建与Nomogram绘制 ggplot绘图细节汇总:ggplot2中如何设置坐标轴...
  • 文件级别的数据处理,包括合并数据框、分类汇总(整合)、数据框的转置与重组。 ###合并数据框 合并数据框就是把多个数据框合并成一个。又分为按列合并的横向、合并按行合并的纵向合并。 ####横向(按列)合并 横向合并...
  • 汇总、透视、提炼、凝炼,对数据处理来说这些词的意思都差不多,R语言提供了很多函数处理这些事情,还有一些软件包也提供了非常方便的数据汇总功能,方法不胜枚举。summary是获取数据概要最常用的函数,应该很熟悉了...
  • 第三讲HTML语言全面介绍汇总,c语言语句汇总,2016网络语言汇总,r语言数据分类汇总,c语言面试题大汇总,r语言分类汇总,励志语言汇总,编程语言汇总,c语言简答题目汇总,r语言分组汇总授课主要内容 一、HTML文件的架构 ...
  • 汇总、透视、提炼、凝炼,对数据处理来说这些词的意思都差不多,R语言提供了很多函数处理这些事情,还有一些软件包也提供了非常方便的数据汇总功能,方法不胜枚举。summary是获取数据概要最常用的函数,应该很熟悉了...
  • · 具体流程· 数据:个体(+ 时间)*变量结构· 信息:学习安排· 总体框架· 课程纲要R语言基础知识R语言数据处理R语言数据分析R语言数据可视化 数据分析与可视化流程 · 数据分析与可视化是与从数据中提取信息...
  • 前一阵子完成了一个约90w条json数据的大数据新闻分析作业,发现对于类似数据格式的以R语言为分析工具的数据分析博客不是很全,相关信息十分零散。因此我整理了一些处理超大文本的方法和技巧,其中借鉴了一些博主的...
  • R语言数据挖掘

    千次阅读 2017-05-02 11:42:00
    R语言数据挖掘 Learning Data Mining with R [哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel) 著 李洪成 许金炜 段力辉 译 图书在版编目(CIP)数据 R语言数据挖掘 / (哈)贝特·麦克哈贝尔(Bater ...
  • # 15 数据塑型# 在将数据转化为图形之前,需要对数据进行清理然后重新组织数据的结构# R中的数据集常以数据框的形式存在。它们都是点形的二维数据结构,每行代表一个具体对象(case),每列代表一个描述对象的变量。#...
  • R语言数据类型转化

    万次阅读 2016-11-29 10:10:06
    R语言数据类型转化 转自:http://www.wangluqing.com/2014/09/10/r-share34/ 有时候,对于一些问题,需要进行数据类型之间的转换。R提供了基本类型转换函数以解决数据类型转换这个问题。常用的基本数据类型...
  • R语言数据分析入门

    2019-04-20 18:17:37
    #通过组合使用summarize()函数和用因子型的列对数据框进行分组的group_by函数,可以按组汇总 > ws.customer.g (ws.customer,Channel,Region) > summerize(ws.customer.g,n=n(),Fresh.m=mean(Fresh), + Milk.m=mean...
  • Þ就是对一组数据的各种特征进行分析,用少量数字概括大量数据,以便于描述测量样本的各种特征及其所代表的总体的特征。 ß推断性统计 Þ对已取得的观测值进行整理、分析,作出推断、决策,从而找出所研究的对象的...
  • 医疗图像更多的是小样本学习,那么如何选择一个小样本数据集来针对各个算法进行比较,从而选择最好的算法,故整理了小样本学习相关的数据,也就是常用的细粒度分类数据 本文内容主要来自于:...
  • R语言dplyr包的数据整理、分析函数用法文章连载NO.01 在日常数据处理过程中难免会遇到些难处理的,选取更适合的函数分割、筛选、合并等实在是大快人心! 利用dplyr包中的函数更高效的数据清洗、数据分析,及为后续...
  • 4.3分组数据汇总统计量 attach(red.cell.folate) tapply(folate,ventilation,mean)#提取folate变量,根据ventilation分组,然后对每一组计算均值 N2O+O2,24h N2O+O2,op O2,24h 316.6250 256.4444 278.000...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 11,144
精华内容 4,457
关键字:

r语言数据分类汇总