精华内容
下载资源
问答
  • 这在R语言中使用rowMeans取多行平均值,或colMeans取多列平均值 示例如下: #create data frame data <- data.frame(var1 = c(0, NA, 2, 2, 5), var2 = c(5, 5, 7, 8, 9), var3 = c(2, 7, 9, 9, 7)

    在Excel 使用average先求取两格子的平均值,然后可以进一步拉两个格子求取整行/整列的平均值。

    这在R语言中使用rowMeans求取多行平均值,或colMeans求取多列平均值

    示例如下:

    #create data frame
    data <- data.frame(var1 = c(0, NA, 2, 2, 5),
                       var2 = c(5, 5, 7, 8, 9),
                       var3 = c(2, 7, 9, 9, 7))
    
    #view data frame
    data
    
      var1 var2 var3
    1    0    5    2
    2   NA    5    7
    3    2    7    9
    4    2    8    9
    5    5    9    7
    
    #find average value in each row
    rowMeans(data, na.rm=TRUE)
    
    [1] 2.333333 6.000000 6.000000 6.333333 7.000000

     

    展开全文
  • 可使用aggregate函数,如: aggregate(.~ID,data=这个数据框名字,mean)

    可使用aggregate函数,如:

    aggregate(.~ID,data=这个数据框名字,mean) 

    如果是对数据框分组,组内有重复的项,对于重复项保留最后一行数据用:

    pcm_df$duplicated <- duplicated(paste(pcm_df$OUT_MAT_NO, pcm_df$Posit, sep = "_"), fromLast = TRUE)
    pcm_df <- subset(pcm_df, !duplicated)
    pcm_df$duplicated <- NULL
    展开全文
  • R语言-数据框分组求平均值

    万次阅读 2018-05-04 10:31:06
    【技术关键】1、从excel把数据读到数据框2、算法实现将数据框的一些数据...但收集到的有效数据有30000+(当然对于R而言这算很小意思的了);由于环境温湿度在一小段时间内基本保持稳定;所以在分析几日内的温湿度变...

    【技术关键】

    1、从excel把数据读到数据框

    2、算法实现将数据框的一些数据合为新的数据并组成新的数据框

    3、将处理结果,即新的数据框保存到excel文件(或.csv)

    4、将绘图结果输出到PDF文件保存


    最近在尝试分析近日的环境温湿度变化;

    虽然设备只运行了48小时左右;

    但收集到的有效数据有30000+(当然对于R而言这算很小意思的了);

    由于环境温湿度在一小段时间内基本保持稳定;

    所以在分析几日内的温湿度变化情况时可以以每10min为单位记录数据;

    这就需要一个脚本,能将数据有效划分为单位后求均值再保存到表;

    ###################################################
    # - Filename : washData.R
    # - Author : Johan   Version : 1.0   Date : 2018/5/3
    # - Discription : 将excel表中的数据分10min计算平均值
    #                 并保存到excel
    # - Function list : 
    # 1.
    # - Others : 
    # 1.本程序可分析.xls或.csv文件
    ###################################################
    
    # 引用包
    library(RODBC)
    
    # 设置工作目录
    setwd("H:/mySoftware/R/myData")
    
    # 导入数据到myDataFrame,文件名根据需要改变
    # 打开th_record2.xls,并读取表Sheet1
    channel <- odbcConnectExcel2007("th_record2.xls")
    myDataFrame <- sqlFetch(channel, "Sheet1")
    odbcClose(channel)
    
    # 为myDataFrame增加列名
    dataColName <- c("temp","humi","time","year","month","day","hour","minute","second")
    names(myDataFrame) <- dataColName
    
    # 初始化缓存向量
    # 时分秒为起始量,可修改
    NUM <- c()           # 编号
    TEMP <- c()          # 温度
    HUMI <- c()          # 湿度
    t <- 0               # 温度缓存
    h <- 0               # 湿度缓存
    num <- 0             # 编号缓存
    dn <- 0              # 计数器
    flag <- FALSE        # 保存指示
    
    # 循环处理数据
    for(i in 1 : 31600){
      
      # 当前分钟是否为10的倍数
      if(myDataFrame$minute[i] %% 10 == 0){
        
        # 计算上一组数据的均值并保存
        if(flag){
          t <- t / dn
          h <- h / dn
          TEMP <- c(TEMP, t)
          HUMI <- c(HUMI, h)
          num <- num + 1
          NUM <- c(NUM, num)
          flag <- FALSE
        }
        
        # 缓存复位
        dn <- 0
        t <- 0
        h <- 0
        
        # 添加记录
        t <- t + myDataFrame$temp[i]
        h <- h + myDataFrame$humi[i]
        dn <- dn + 1
        
      }
      
      else{
        
        # 添加记录
        t <- t + myDataFrame$temp[i]
        h <- h + myDataFrame$humi[i]
        dn <- dn + 1
        flag <- TRUE
        
      }
    }
    
    # 构建新数据框
    newFrame <- data.frame(NUM, TEMP, HUMI)
    newName <- c("number","temp","humi")
    names(newFrame) <- newName
    
    # 写入.csv文件
    write.csv(newFrame, "new_th_record.csv")
    
    # 绘图
    plot(newFrame$number, newFrame$temp, pch=20, lty=3, col="red")
    lines(newFrame$number, newFrame$humi, pch=20, lty=3, col="blue")
    
    
    
    
    

    把处理结果保存到新的.csv或者.xls文件即是整个脚本的目的所在,方便后面的数据分析。

    运行后得到的效果如下:(由于温湿度的数值不在一个层次所以反映得不太直观,可尝试调换plot和lines的顺序,通过绘图方面的学习可以画出更好看的图)


    如果想要输出为PDF保存该图片,可以运行另一个脚本:

    pdf("new_th_record.pdf")
    plot(newFrame$number, newFrame$humi, pch=20, lty=3, col="blue")
    lines(newFrame$number, newFrame$temp, pch=20, lty=3, col="red")
    dev.off()
    PDF文件的一个好处就是它里面的图片是矢量的,也就是说放大图片不会改变图片的原样,原本看上去粘在一块儿的点放大以后能看出来是分开的。

    展开全文
  • R语言里面,aggregate函数就可以办到。 ## S3 method for class 'data.frame' aggregate(x, by, FUN, ..., simplify = TRUE, drop = TRUE) 我们常用到的参数是:x, by, FUN。 x, 你想要计算的属性或者。 by, 是...

    我们经常可能需要把一个数据按照某一属性分组,然后计算一些统计值。在R语言里面,aggregate函数就可以办到。

    ## S3 method for class 'data.frame'
    aggregate(x, by, FUN, ..., simplify = TRUE, drop = TRUE)
    

    我们常用到的参数是:x, by, FUN。
    x, 你想要计算的属性或者列。
    by, 是一个list,可以指定一个或者多个列作为分组的基础。
    FUN, 指定一个函数,用来计算,可以作用在所有分组的数据上面。

    假如这个是我们的数据。

    type<-c("a","b","c","a","c","d","b","a","c","b")
    value<-c(53,15,8,99,76,22,46,56,34,54)
    df<-data.frame(type,value)
    df
       type value
    1     a    53
    2     b    15
    3     c     8
    4     a    99
    5     c    76
    6     d    22
    7     b    46
    8     a    56
    9     c    34
    10    b    54
    

    分组求和

     aggregate(df$value, by=list(type=df$type),sum)
      type   x
    1    a 208
    2    b 115
    3    c 118
    4    d  22
    

    分组求平均值
    分组求平均很简单,只要将上面的sum改成mean就可以了。

    aggregate(df$value, by=list(type=df$type),mean)
      type        x
    1    a 69.33333
    2    b 38.33333
    3    c 39.33333
    4    d 22.00000
    

    分组计数,分组计数就是在分组的情况下统计rows的数目。

    aggregate(df$value, by=list(type=df$type),length)
      type x
    1    a 3
    2    b 3
    3    c 3
    4    d 1
    

    基于多个属性分组求和。
    我们在原有的数据上加上一列,可以看看多属性分组。

    type_2 <-c("F","M","M","F","F","M","M","F","M","M")
    df <- data.frame(df, type_2)
    df
       type value type_2
    1     a    53      F
    2     b    15      M
    3     c     8      M
    4     a    99      F
    5     c    76      F
    6     d    22      M
    7     b    46      M
    8     a    56      F
    9     c    34      M
    10    b    54      M
    
    
    aggregate(x=df$value, by=list(df$type,df$type_2),sum)
      Group.1 Group.2   x
    1       a       F 208
    2       c       F  76
    3       b       M 115
    4       c       M  42
    5       d       M  22
    
    
    展开全文
  • 本篇文章的数据框x和向量x1,x2,x3是根据上一篇文章中的哦 函数mean &amp;amp;gt; mean(x) ...此时对编号也平均值,不过往往我们只想对后面的数据求平均值。而且此时会出现一个警告。因...
  • 有一个长度为n(n)的数列,该数列定义为从2开始的递增有序偶数,现在要求你按照顺序每m个数出一个平均值,如果最后不足m个,则以实际数量求平均值。编程输出该平均值序列。 Input 输入数据有多组,每组占一...
  • R语言求一个列表的平均数可以使用mean() : mean英文意思有平均数的含义 x=c(1,3,5,7,9) max(x) #这样即可求得平均数为 : 5 假如读取过一个csv文件之后,要求其中一行数据中指定某个区间内的平均数可以使用...
  • 1.R语言中求解数据中每行/平均值不能直接用mean,否则会出现错误,需要用到apply data &lt;- read.csv("test.csv") row_mean = apply(data,1,mean)#1代表显示行的平均值 col_mean = apply(data,...
  • R语言 处理缺失数据

    万次阅读 多人点赞 2016-05-18 11:34:55
    R语言 处理缺失数据 VIM包 mice包
  • R语言分组计算平均数、SE、SD等等

    万次阅读 2018-12-10 13:59:13
    1提出问题 数据处理时经常遇到这么一个问题...R语言实战二里面p131-136都是在讲基础统计,有兴趣自己去敲一遍。 这里说下一自我感觉用的随意方便的其中一种可以很好的解决分组计算的问题。 举例 1,像这样的数据...
  • 想要达到的目的是对rhu每100行均值,即第1:100行,2:101行,3:102行,均值,然后数据返回至rhu后一,即rhu100=mean。不知道这个该如何实现,麻烦大佬帮我想想办法,如果可以请直接上代码,小弟感激不尽!date...
  • 我一直在研究R中的一些时间序列数据,由于连续点之间存在一些差异,因此我想通过计算移动平均值来平滑数据。 我很难找到一个内置函数来执行此操作,但是遇到了迪迪尔·鲁丁(Didier Ruedin)的博客文章 ,其中...
  • R语言按某一分类均值+绘图总结

    千次阅读 2020-10-16 22:18:04
    -aggregate(.~K,data=data1,mean) #数据集data1按照K分类后所有的均值 rm(list=ls()) #删除所有对象 attach() #锁定某个对象 with(mtcars,{print(summary(mpg)),plot(mpg,disp)} #with作用等同attach grades&...
  • R语言 缺失处理

    千次阅读 2016-05-17 19:10:25
    R语言 缺失处理
  • R语言按分组均值

    千次阅读 2020-05-08 16:00:19
    根据数据框的某一对数据进行分组,按照分组对所有列求均值 用到的库 dplyr 代码如下 // R语言脚本 library(dplyr) datamean=group_by(mydata, group) %>% summarize_each(funs(mean)) // mydata 为要处理的数据...
  • ![图片说明](https://img-ask.csdn.net/upload/202011/03/1604412455_135011.jpg)
  • R语言数据缺失处理

    千次阅读 2019-11-01 17:34:52
    微信公众号:[R语言小白速通] 主要分享一些R语言和统计学知识,提升自己,帮助他人。 [如果你觉得本文章对你有帮助,欢迎赞赏] ...R语言中用NA代表缺失。使用is.na函数可以检测缺失,并返回...
  • R语言 去除重复

    2017-12-06 10:33:29
    当面对大量数据需要去除重复时,运用代码来处理不仅节省时间,更节省体力。
  • 超详细:R语言缺失及异常处理

    万次阅读 多人点赞 2018-01-26 18:09:48
    缺失缺失是指粗糙数据中由于缺少信息而造成的数据的聚类,分组,删失或截断。它指的是现有数据集中某个或某些属性的是不完全的。缺失的处理方法:对于缺失的处理,从总体上来说分为删除存在缺失的个案和...
  • 主要介绍tapply函数:每次只能 aggregate函数:每次按组可以 tapply(shuju[shuju[,3],shuju$year,mean)#以年份为组,shuju表第三的均值 aggregate(shuju[,3:4],list(shuju[,2]),mean)#以年份为...
  • 缺失值处理方法——基于R语言 缺失值处理方法有很多,除了删除、利用平均值或中位数等插补外,本文简要介绍一些基于模型的插补方法。 判别 如果因变量可以由若干个非缺失变量解释的话,选择非缺失变量为自变量,含...
  • R语言:缺失的处理

    千次阅读 2016-06-29 10:35:43
    R语言缺失的处理
  • R语言求概率分布_R语言学习笔记5

    万次阅读 2012-03-08 16:53:46
    R语言求概率分布 R一个很方便的用处是提供了一套完整的统计表集合。函数可以对累积分布函数P(X≤x),概率密度函数,分位函数(对给定的q,满足P(X≤x) > q的最小x)求值,并根据分布进行模拟。 在R中,根据...
  • 首先,你需要安装一个包:plyr包 安装方法:点 工具栏上的 程序包--安装程序包-选择plyr,点确定 自己会安装好的 或者是命令:install.packages("plyr") 安装好之后,载入包 ...就可以了,试试吧
  • R:计算滚动或移动平均值

    千次阅读 2020-04-21 09:08:05
    我一直在研究R中的一些时间序列数据,由于连续点之间存在一些差异,因此我想通过计算移动平均值来平滑数据。 我很难找到一个内置函数来执行此操作,但是遇到了迪迪埃·鲁丁(Didier Ruedin)的博客文章 ,其中描述...
  • 首先我们出处理缺失的一般步骤,对整个流程有一个大致的了解。 识别缺失数据; 检查导致数据缺失的原因; 删除包含缺失的实例或用合理的数值插补缺失。 数据缺失的种类 完全随机缺失(MCAR) 随机缺失...
  • 我们继续来总结一下R语言数据处理的第二部分——维度处理。在R语言中,常见的多维数据的存储形式有矩阵、数据框、列表和数组等,其中向量是特殊的矩阵,矩阵是特殊的数据框,数据框又是特殊的数组。对于不同的数据...
  • R语言数理统计之对某列值进行描述性分析 导入相关包 导入文件 选择所需 对指定行进行筛选 分组计数:修改合计列名 分组摘要:最大最小平均分位数 合并连接各表 导出文件 library(tidyverse) library...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 32,350
精华内容 12,940
关键字:

r语言求列平均值