精华内容
下载资源
问答
  • R语言分组计算平均数、SE、SD等等

    万次阅读 2018-12-10 13:59:13
    1提出问题 数据处理时经常遇到这么一个问题:自变量(处理)分组group1,2,3.变量(x1.x2,x3,x4,x5…)一系列的...这里说下一自我感觉用的随意方便的其中一种可以很好的解决分组计算的问题。 举例 1,像这样的数据...

    1.提出问题

    数据处理时经常遇到这么一个问题:自变量(处理)分组group1,2,3.变量(x1.x2,x3,x4,x5…)一系列的变量。我只想计算group1、group3分组的情况下的x2,x4,x5的mean等等。

    2.解决办法

    R语言实战二里面p131-136都是在讲基础统计,有兴趣自己去敲一遍。
    这里说下一自我感觉用的随意方便的其中一种可以很好的解决分组计算的问题。

    3. 举例

    1,像这样的数据排列有plot,Site,site,V,N,D,R,而因变量TCMI、TCM6,。。。也可以很多。

    像这样的数据排列有plot,Site,site,V,N,D,R

    整个cmi数据库有108*9,
    #数据一定要检查类型(factor、num、int)
    在这里插入图片描述
    2,写个要计算的方程(实战p132有详解)
    此处copy
    (只要确保自己的数据没有空值,这个n没什么用,可以不输出)
    在这里插入图片描述
    3,引用包doby(名字起得好 ,“逗~”)
    详细公式实战p135 7.1.4有详解

    summaryBy(formula,data,FUN=function)
    ##formula格式x1+x2+x3...~group1+group2+....(formula挺有意思,后续写方差分析时再补充)
    ##data 数据data
    ##FUN就是计算方程
    

    如果计算变量名长且多手敲麻烦不如敲段代码多变量formula生成
    4,运算结果

    #注意因变量+自变量
    

    在这里插入图片描述
    在这里插入图片描述

    5,添加自变量V,添加重复R,如何?
    在这里插入图片描述
    在这里插入图片描述
    欢迎关注评论

    看完如果对你有帮助,感谢点赞支持!

    如果你是电脑端,看到右下角的 “一键三连” 了吗,没错点它[哈哈]

    在这里插入图片描述

    展开全文
  • PYTHON数据分析之分组计算

    千次阅读 2017-07-10 00:37:54
    分组计算 #导入pandas包 import pandas as pd #打开csv文件 df = pd.read_csv("E:\\Pokemon.csv") #一列分组 g1 = df.groupby(["Type 1"]) #分组后,显示每组的第一条数据 g1.first()#分组后,每个组有多少条数据g1....

    分组计算

    #导入pandas包
    import pandas as pd
    #打开csv文件
    df = pd.read_csv("E:\\Pokemon.csv")
    #一类分组
    g1 = df.groupby(["Type 1"])
    #分组后,显示每组的第一条数据
    g1.first()
    #分组后,每个组有多少条数据
    g1.size()
    #分组后对每组进行描述性统计
    g1.describe()
    #分组后,每组对应哪些样本
    g1.groups()
    #分组后,选取某个分组的所以数据
    g1.get_group("ROCK")

    #循环输出所有组名及对应大小
    for name,group in g1: print(name) print(group.shape) print("------------")

    #两列分组
    g2 = df.groupby(["Type 1","Type 2"])
    #查看两列分组大小
    g2.size()
    #查看某列数据
    g2["HP"]
    #查看某列数据平均值
    g2["HP"].mean()
    #或者
    g2.mean()["HP"]

    groupby的三个主要函数

    aggregate函数
    #aggregate函数#求所有列的总和g1.agg(np.sum)
    #每一列求不同的值
    g1.agg({"HP":np.sum,"Attack":np.mean,"Defense":np.std})
    #重新命名每列名称使更直观
    g1.agg({"HP":np.sum,"Attack":np.mean,"Defense":np.std}).rename(columns = {"HP":"HP_sum","Attack":"Attack_mean","Defense":"Defense_std"})
    
    #导入numpy包
    import numpy as np
    #求所有列值的总和
    g1.agg(np.sum)
    #每一列求不同的值
    g1.agg({"HP":np.sum,"Attack":np.mean,"Defense":np.std})
    #重新命名每列名称使更直观
    g1.agg({"HP":np.sum,"Attack":np.mean,"Defense":np.std}).rename(columns = {"HP":"HP_sum","Attack":"Attack_mean","Defense":"Defense_std"})

    transform函数
    #transform函数 转换函数 返回新的数据集 不会对原有数据集改变 
    #数据集标准化
    f = lambda x : (x-x.mean()) / x.std()
    #数据集转换
    g1.transform(f)

    filter函数
    #filter函数 选择筛选函数
    #选择多于80条记录的组
    df1 = g1.filter(lambda x : len(x)>=80)
    #选择HP平均值大于等于60的组
    df2 = g1.filter(lambda x : np.mean(x["HP"])>=60
    #新的数据集进行分组
    g3 = df1.groupby(["Type 1"])
    #查看新的数据集分组的大小
    g3.size()
    #检查HP数据是否都是大于等于60的组
    g3["HP"].mean()

    展开全文
  • spark 例子groupByKey分组计算 例子描述: 【分组、计算】 主要为两部分,将同类的数据分组归纳到一起,并将分组后的数据进行简单数学计算。 难点在于怎么去理解groupBy和groupByKey 原始数据 2010-05-04 12:50,10,...

    spark 例子groupByKey分组计算


    例子描述:

    【分组、计算】

    主要为两部分,将同类的数据分组归纳到一起,并将分组后的数据进行简单数学计算。
    难点在于怎么去理解groupBy和groupByKey

    原始数据
    2010-05-04 12:50,10,10,10
    2010-05-05 13:50,20,20,20
    2010-05-06 14:50,30,30,30
    2010-05-05 13:50,20,20,20
    2010-05-06 14:50,30,30,30
    2010-05-04 12:50,10,10,10
    2010-05-04 11:50,10,10,10

    结果数据
    2010-05-05 13:50,40,40,40
    2010-05-04 12:50,20,20,20
    2010-05-06 14:50,60,60,60
    2010-05-04 11:50,10,10,10


    代码片段:

    /* 同类合并、计算 */
    
    val source = Source.fromFile("E:test.txt").getLines.toArray
    val sourceRDD = sc.parallelize(source)                                  /* spark单机读取数据 */
    sourceRDD
      .map {
        line =>
          val lines = line.split(",")                                         /* 拆分数据 */
          (s"${lines(0)}", s"${lines(1)},${lines(2)},${lines(3)}")            /* 找出同样的数据为K,需要进行计算的为V,拼成map */
      }
      .groupByKey
      .map {                                                      /* 分组,最重要的就是这,同类的数据分组到一起,后面只需要计算V了 */
        case (k, v) =>
          var a, b, c = 0                                                     /* 定义几个存数据的变量,恩,这很java,一般scala中很少见到var */
          v.foreach {                                                         /* 遍历需要计算的V  */
            x =>
              val r = x.split(",")                                            /* 将V拆分 */
              a += r(0).toInt                                                 /* 计算 */
              b += r(1).toInt
              c += r(2).toInt
          }
        s"$k,$a,$b,$c"                                                      /* 拼字符串,返回数据 */
      }
      .foreach(println)

    转载于:https://www.cnblogs.com/chendapao/p/9180991.html

    展开全文
  • 文章目录分组计算根据列表进行分组根据字典进行分组使用函数进行分组根据多级索引分组 分组计算 根据列表进行分组 根据索引、双层索引进行分组 根据索引直接分组 迭代分组 按列分组 根据字典进行分组 按行...

    分组计算

    在这里插入图片描述

    根据列表进行分组

    在这里插入图片描述
    根据索引、双层索引进行分组
    在这里插入图片描述
    根据索引直接分组
    在这里插入图片描述
    迭代分组
    在这里插入图片描述
    按列分组
    在这里插入图片描述

    根据字典进行分组

    在这里插入图片描述
    在这里插入图片描述
    按行分组
    在这里插入图片描述
    **按行分组**
    计数
    在这里插入图片描述

    使用函数进行分组

    在这里插入图片描述
    根据索引长度分组
    在这里插入图片描述
    直接分组
    在这里插入图片描述

    根据多级索引分组

    在这里插入图片描述
    根据索引分组
    在这里插入图片描述

    展开全文
  • R语言分组计算描述性统计量

    千次阅读 2020-02-19 12:20:52
    R语言分组计算描述性统计量 在上一篇博客中介绍了如何计算数据整体的描述性统计量,点击查看。这里将注重介绍如何分组计算描述性统计量,介绍两个函数:aggregate()、dexcribe.by() 1、aggregate 这个函数的功能比较...
  • Numpy&pandas(四)--分组计算

    千次阅读 2020-02-25 16:25:39
    分组计算 分组计算三步曲:拆分 -> 应用 -> 合并 拆分:根据什么进行分组? 应用:每个分组进行什么样的计算? 合并:把每个分组的计算结果合并起来。 df = pd.DataFrame({'key1': ['a', 'a', 'b', 'b'...
  • 1、devexpress表格控件gridcontrol提供了强大的分组功能,你几乎不用写什么代码就可以实现一个分组功能,并且可根据分组计算总计和平均值。这里我例举了一个实现根据班级分组计算班级总人数,总分,平均分的案例。...
  • R语言 分组计算,不止group_by

    千次阅读 2020-05-04 15:32:21
    R自带数据集比较多,今天就选择一个我想对了解的mtcars数据集带大家学习一下R语言中的分组计算(操作)。 目录 1 dplyr包中的group_by联合summarize 1.1 group_by语法 1.2 summarise语法 1.3 group_by和...
  • * 分组计算各组个数 */ @Test public void aggregation(){ SearchResponse response = client.prepareSearch("twitter").setTypes("tweet") .addAggregation(AggregationBuil...
  • java8 分组计算数量和计算总数

    千次阅读 2019-12-26 17:55:13
    package com.pig4cloud.pigx.admin.api.vo; import lombok.Builder; import lombok.Data; import lombok.experimental.Tolerate; import java.util.*;...import java.util.stream.Collectors;... *Create by ...
  • SQL 分组计算 topN

    千次阅读 2020-07-14 15:08:38
    分组 topN -- 语法形式: ROW_NUMBER() OVER (PARTITION BY COL1 ORDER BY COL2) -- 解释: 根据COL1分组,在分组内部根据 COL2排序,而此函数计算的值就表示每组内部排序后的顺序编号(组内连续的唯一的) -- 常用...
  • 最近处理数据需要分组计算,又用到了groupby函数,温故而知新。  分组运算的第一阶段,pandas 对象(无论是 Series、DataFrame 还是其他的)中的数据会根据你所提供的一个或多个键被拆分(split)为多组。拆分操作...
  • 固定分组计算的sql简化

    千次阅读 2015-08-25 08:52:15
    在数据库应用开发中,我们经常需要面对复杂的SQL式计算,固定分组就是其中一种。固定分组分组依据不在待分组的数据中,而是来自于外部,比如另一张表、外部参数、条件列表。对于特定类型的固定分组,用SQL实现还算...
  • SQL 按时间段分组计算 SPT_VALUES 使用

    千次阅读 2011-02-23 14:59:00
    SQL 按时间段分组计算 SPT_VALUES 使用
  • 查询分组计算[按时间分组计算][SQL]

    千次阅读 2011-12-01 16:39:15
    select convert(char(10),RECORDDT,120) as RECORDDT , sum(GAMECOUNT)as GAMECOUNT_sum ,sum(GAMETIME_H) as GAMETIME_H_sum  from tb_PlatformBaseData  where RECORDDT >='2011-11-28' and RECORDDT ...
  • Stata:runby - 一切皆可分组计算

    万次阅读 2018-09-18 17:16:10
    背景: 在 Stata 提供了一个高效实用的副指令 —— byable,可以让我快捷地计算分组统计量,如各行业的均值、标准差等。例如,by industry: egen invest_mean = mean(invest),可以快速计算出每个行业的平均投资支出...
  • Pandas - 数据的聚合与分组计算

    千次阅读 2018-08-08 17:07:56
    1 数据分组 - groupby() 1.1 按照多列进行分组的两种方法 1.2 对分组进行迭代 1.3 将列数据按照数据类型进行分组 1.4 通过字典或者Series对DataFrame数据进行分组 2 数据聚合 2.1 分组结果的内置聚合函数 2.2 ...
  • 1.对数据进行分组,groupby() (1)指定分组列 (2)size(),count(),count获取更详细 (3)对数据进行迭代输出 for….in循环输出分组后的结果 (4)将groupby分类结果转化成字典 (5)按照列的数据...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 314,111
精华内容 125,644
关键字:

分组计算