精华内容
下载资源
问答
  • 今天小编就为大家分享一篇Python Pandas实现数据分组平均值并填充nan的示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • 依靠gridcontrol强大的属性功能实现分组,并依据分组总计,平均统计等。本实例根据班级分组计算班级总分与平均分。
  • 在某些科学著作中,一旦从感兴趣的人群中收集数据,通常很难了解数据以无组织方式呈现时的含义。 将原始数据组合成有意义... 除了被科学家和生物学家使用外,几何平均值还用于许多其他领域,显着的是财务报告。 这是
  • 效果如图所示:测试sql语句如下: 代码如下: declare @tab table(Class varchar(20),Student varchar(20),Course varchar(50),Quantity decimal(7,2)); insert into @tab(Class,Student,Course,Quantity) values(‘A班...
  • Mysql分组平均

    千次阅读 2021-03-08 17:39:47
    -------±-----------+ | groupId | avg(value) | ±--------±-----------+ | 1 | 1.5000 | | 2 | 3.0000 | | 3 | 2.0000 | | 5 | 6.0000 | ±--------±-----------+ 这样就求出了每个组前2个最大的value的平均
    select * from group_avg_test;
    

    在这里插入图片描述

    select groupId,avg(value) from (
    	select groupId,value from (
    		select groupId, value,@num := if(@currGroupId = groupId, @num + 1, 1) as row_number,
    		@currGroupId := groupId from(select @num := 0, @currGroupId := '') as i,
    		group_avg_test order by groupId, value desc
    	) as r where r.row_number <= 2
    ) as t group by groupId;
    

    在这里插入图片描述

    这样就求出了每个组前2个最大的value的平均值

    展开全文
  • sql 分组求和 、分组平均

    千次阅读 2020-08-21 14:57:13
    SELECT device_type_name, AVG(rate) FROM tb_device_rate GROUP BY device_type_name SELECT device_type_name, SUM(rate) FROM tb_device_rate GROUP BY device_type_name
    SELECT device_type_name, AVG(rate)  FROM tb_device_rate GROUP BY device_type_name  
    
    SELECT device_type_name, SUM(rate)  FROM tb_device_rate GROUP BY device_type_name  
    
    SELECT device_type_name, AVG(rate) AS rate  FROM tb_device_rate GROUP BY device_type_name  
    
    
    
    展开全文
  • R语言分组求和,分组平均值,分组计数

    万次阅读 多人点赞 2021-02-20 14:50:17
    我们经常可能需要把一个数据按照某一属性分组,然后计算一些统计值。在R语言里面,aggregate函数就可以办到。 ## S3 method for class 'data.frame' aggregate(x, by, FUN, ..., simplify = TRUE, drop = TRUE) ...

    我们经常可能需要把一个数据按照某一属性分组,然后计算一些统计值。在R语言里面,aggregate函数就可以办到。

    ## S3 method for class 'data.frame'
    aggregate(x, by, FUN, ..., simplify = TRUE, drop = TRUE)
    

    我们常用到的参数是:x, by, FUN。
    x, 你想要计算的属性或者列。
    by, 是一个list,可以指定一个或者多个列作为分组的基础。
    FUN, 指定一个函数,用来计算,可以作用在所有分组的数据上面。

    假如这个是我们的数据。

    type<-c("a","b","c","a","c","d","b","a","c","b")
    value<-c(53,15,8,99,76,22,46,56,34,54)
    df<-data.frame(type,value)
    df
       type value
    1     a    53
    2     b    15
    3     c     8
    4     a    99
    5     c    76
    6     d    22
    7     b    46
    8     a    56
    9     c    34
    10    b    54
    

    分组求和

     aggregate(df$value, by=list(type=df$type),sum)
      type   x
    1    a 208
    2    b 115
    3    c 118
    4    d  22
    

    分组求平均值
    分组求平均很简单,只要将上面的sum改成mean就可以了。

    aggregate(df$value, by=list(type=df$type),mean)
      type        x
    1    a 69.33333
    2    b 38.33333
    3    c 39.33333
    4    d 22.00000
    

    分组计数,分组计数就是在分组的情况下统计rows的数目。

    aggregate(df$value, by=list(type=df$type),length)
      type x
    1    a 3
    2    b 3
    3    c 3
    4    d 1
    

    基于多个属性分组求和。
    我们在原有的数据上加上一列,可以看看多属性分组。

    type_2 <-c("F","M","M","F","F","M","M","F","M","M")
    df <- data.frame(df, type_2)
    df
       type value type_2
    1     a    53      F
    2     b    15      M
    3     c     8      M
    4     a    99      F
    5     c    76      F
    6     d    22      M
    7     b    46      M
    8     a    56      F
    9     c    34      M
    10    b    54      M
    
    
    aggregate(x=df$value, by=list(df$type,df$type_2),sum)
      Group.1 Group.2   x
    1       a       F 208
    2       c       F  76
    3       b       M 115
    4       c       M  42
    5       d       M  22
    
    
    展开全文
  • R语言-数据框分组平均

    万次阅读 2018-05-04 10:31:06
    # - Discription : 将excel表中的数据分10min计算平均值 # 并保存到excel # - Function list : # 1. # - Others : # 1.本程序可分析.xls或.csv文件 ################################################### # 引用...

    【技术关键】

    1、从excel把数据读到数据框

    2、算法实现将数据框的一些数据合为新的数据并组成新的数据框

    3、将处理结果,即新的数据框保存到excel文件(或.csv)

    4、将绘图结果输出到PDF文件保存


    最近在尝试分析近日的环境温湿度变化;

    虽然设备只运行了48小时左右;

    但收集到的有效数据有30000+(当然对于R而言这算很小意思的了);

    由于环境温湿度在一小段时间内基本保持稳定;

    所以在分析几日内的温湿度变化情况时可以以每10min为单位记录数据;

    这就需要一个脚本,能将数据有效划分为单位后求均值再保存到表;

    ###################################################
    # - Filename : washData.R
    # - Author : Johan   Version : 1.0   Date : 2018/5/3
    # - Discription : 将excel表中的数据分10min计算平均值
    #                 并保存到excel
    # - Function list : 
    # 1.
    # - Others : 
    # 1.本程序可分析.xls或.csv文件
    ###################################################
    
    # 引用包
    library(RODBC)
    
    # 设置工作目录
    setwd("H:/mySoftware/R/myData")
    
    # 导入数据到myDataFrame,文件名根据需要改变
    # 打开th_record2.xls,并读取表Sheet1
    channel <- odbcConnectExcel2007("th_record2.xls")
    myDataFrame <- sqlFetch(channel, "Sheet1")
    odbcClose(channel)
    
    # 为myDataFrame增加列名
    dataColName <- c("temp","humi","time","year","month","day","hour","minute","second")
    names(myDataFrame) <- dataColName
    
    # 初始化缓存向量
    # 时分秒为起始量,可修改
    NUM <- c()           # 编号
    TEMP <- c()          # 温度
    HUMI <- c()          # 湿度
    t <- 0               # 温度缓存
    h <- 0               # 湿度缓存
    num <- 0             # 编号缓存
    dn <- 0              # 计数器
    flag <- FALSE        # 保存指示
    
    # 循环处理数据
    for(i in 1 : 31600){
      
      # 当前分钟是否为10的倍数
      if(myDataFrame$minute[i] %% 10 == 0){
        
        # 计算上一组数据的均值并保存
        if(flag){
          t <- t / dn
          h <- h / dn
          TEMP <- c(TEMP, t)
          HUMI <- c(HUMI, h)
          num <- num + 1
          NUM <- c(NUM, num)
          flag <- FALSE
        }
        
        # 缓存复位
        dn <- 0
        t <- 0
        h <- 0
        
        # 添加记录
        t <- t + myDataFrame$temp[i]
        h <- h + myDataFrame$humi[i]
        dn <- dn + 1
        
      }
      
      else{
        
        # 添加记录
        t <- t + myDataFrame$temp[i]
        h <- h + myDataFrame$humi[i]
        dn <- dn + 1
        flag <- TRUE
        
      }
    }
    
    # 构建新数据框
    newFrame <- data.frame(NUM, TEMP, HUMI)
    newName <- c("number","temp","humi")
    names(newFrame) <- newName
    
    # 写入.csv文件
    write.csv(newFrame, "new_th_record.csv")
    
    # 绘图
    plot(newFrame$number, newFrame$temp, pch=20, lty=3, col="red")
    lines(newFrame$number, newFrame$humi, pch=20, lty=3, col="blue")
    
    
    
    
    

    把处理结果保存到新的.csv或者.xls文件即是整个脚本的目的所在,方便后面的数据分析。

    运行后得到的效果如下:(由于温湿度的数值不在一个层次所以反映得不太直观,可尝试调换plot和lines的顺序,通过绘图方面的学习可以画出更好看的图)


    如果想要输出为PDF保存该图片,可以运行另一个脚本:

    pdf("new_th_record.pdf")
    plot(newFrame$number, newFrame$humi, pch=20, lty=3, col="blue")
    lines(newFrame$number, newFrame$temp, pch=20, lty=3, col="red")
    dev.off()
    PDF文件的一个好处就是它里面的图片是矢量的,也就是说放大图片不会改变图片的原样,原本看上去粘在一块儿的点放大以后能看出来是分开的。

    展开全文
  •  averagingDouble 平均值 // 求平均年龄 Double averageAge = list.stream().collect(Collectors.averagingInt(item -> item.getAge() == null ? 0 : item.getAge())); count 求个数 // 求年龄为18的人数 long ...
  • 先观察一下要处理的数据是怎样的,原始文件是有五组分隔开的数据,第一行是表示组名,第二行是列标签,第三行开始才是真正的数据。很容易就会想到使用pandas来处理这个文件了。 首先读取文件并创建一个dataframe...
  • Python实现按某一列关键字分组,并计算各列的平均值,并用该值填充该分类该列的nan值。 DataFrame数据格式 fillna方式实现 groupby方式实现 DataFrame数据格式以下是数据存储形式: fillna方式实现 按照...
  • pandas: groupby()分组平均

    万次阅读 2018-07-01 15:47:00
    两种方式都可以data.groupby('Pclass')['Fare'].mean() data.groupby('Pclass').mean()['Fare']
  • 调和平均适用于总体中存在极端异常值的情况。 由于谐波均值是不直观的,因此很难在实际情况下看到如何应用它。 绝对需要谐波均值的两个示例是变速处理器和负载平衡服务器。 根据 Jensen (1998),可以定义幂...
  • --创建一个学生表 create table Stu ( ID int primary key identity, Name varchar(50), ...--分组查询平均成绩 select Name 姓名,Course 科目,Avg(Score) 平均成绩 from Stu Group By Name,Course ...
  • id是主键,time是索引,在不影响索引的情况下查询 floor(now())返回的是当前时间格式的数字,如20181218130000 floor(time/500)*500去掉秒数并五分钟显示 select DATE_FORMAT(FLOOR(time/500)*500,'%Y-%m-%d %H:...
  • python 简单地实现平均分组问题

    千次阅读 2020-02-15 16:18:18
    举个栗子。 现在从我们班选了6个人,分成两组,...为了跟本文内容有关系所以 大家暂定为用一个python程序来实现分组。nice√ 那么,思路如下: 首先统计6个人的姓名(或者编号),把它们都放在列表lovelive里面。 ...
  • 第一种:按照‘分组的名字’进行分组, 然后求‘求的列名’列各组的平均值&最大值: 求平均值: df.groupby('分组的名字')['求的列名'].mean() 求最大值: df.groupby('分组的名字')['求的列名'].max() 第二...
  • pandas在dataframe中提供了丰富的统计、合并、分组、缺失值等操作函数。 1.统计函数 df.count() #非空元素计算 df.min() #最小值 df.max() #最大值 df.idxmin() #最小值的位置,类似于R中的which.min函数 df....
  • java8 实现分组聚合,平均等数据统计写在前面一、分组实现1.1、简单分组1.2、集合分组1.3、分组求和1.4、分组平均 写在前面 一、分组实现 1.1、简单分组 Map<String, Long> departmentNames = departmentDbs...
  • 平均分组问题,类似装箱问题,php

    千次阅读 2017-04-23 00:12:59
     * 按分数对选手进行平均分组,可分多组。  *  *   * 注意:  * 1. 输入的选手名单players为集合形式,player表示选手名称,score表示选手的分数  * 2. 选手的分数体现选手的实力,分数有可能是负数  * 3. ...
  • SPSS分组统计求平均

    万次阅读 2018-10-14 10:47:27
    1.从文件中打开数据集、复制粘贴也行,并删除多余的空行 删除不符合样式的数据行 2.调整相关的数据集表格列变量属性为数字 调整数据集属性 ...3.将数据依据指定列,按范围...4.按cjdj分组统计成绩的平均值 设置...
  • 平均分组

    千次阅读 2013-07-09 11:41:12
    #将列表进行平均分组,如果不能整除,则将后面的元素全部放入最后一组 ''' n 指定列表元素个数 group 指定将列表分成的组数 per 每一组包括的元素个数 ''' def put(n,group):  l2 = []  num=0  l ...
  • ![图片说明](https://img-ask.csdn.net/upload/201507/02/1435827054_657897.png) 图: 主键-地区-销售人员-销售金额 问题是: 查询出所有超过本地区销售金额平均值 的销售金额
  • 前段时间公司一个哥们为了偷懒,不愿意用程序去处理统计信息,让我写一个按照时间段分组并计算分组内某个字段平均值与求和,一开始我没怎么注意,觉得很简单,就答应帮他写,没想到写的时候无从下手,于是在网上找了...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 138,516
精华内容 55,406
关键字:

怎样分组最平均