精华内容
下载资源
问答
  • 赞赞童鞋鼓励我一定要勤更勤更勤更,好的那就更一个。虽然真的好累…… 任务是酱紫的,有两个CSV文件,要解决4个问题: ...Q4:2014年12月,25号商店的日销量的柱状图,并求方差 OK,let's go. impor...

    赞赞童鞋鼓励我一定要勤更勤更勤更,好的那就更一个。虽然真的好累……

    任务是酱紫的,有两个CSV文件,要解决4个问题:

    Q1:2014年9月哪个店铺的总revenue最高?

    Q2:2014年夏天哪个item_category的revenue最高?

    Q3:有多少item的价格一直没变过?

    Q4:2014年12月,25号商店的日销量的柱状图,并求方差

    OK,let's go.

    import pandas as pd
    import numpy as np
    import os
    import time,datetime
    import matplotlib.pyplot as plt
    
    DATA_FOLDER = 'D:/LFTK/W1/'
    
    transactions    = pd.read_csv(os.path.join(DATA_FOLDER, 'sales_train.csv.gz'))
    items           = pd.read_csv(os.path.join(DATA_FOLDER, 'items.csv'))
    #看看transactions长啥样#
    transactions.head()
     datedate_block_numshop_iditem_iditem_priceitem_cnt_day
    002.01.201305922154999.001.0
    103.01.20130252552899.001.0
    205.01.20130252552899.00-1.0
    306.01.201302525541709.051.0
    415.01.201302525551099.001.0

     

    transactions['date']=transactions['date'].apply(lambda x:pd.to_datetime(x,dayfirst=True))  #date列数据类型是string,转成timestamp时间戳的形式
    
    def gy(s):
        return s.year
    def gm(s):
        return s.month
    transactions['year']=transactions['date'].apply(lambda x:gy(x))
    transactions['month']=transactions['date'].apply(lambda x:gm(x))    #加两个新列:年,月
    
    transactions['revenue']=transactions['item_price']*transactions['item_cnt_day']    #加revenue列
    transactions[transactions.year==2014][transactions.month==9]['revenue'].groupby(transactions['shop_id']).max()    
    ##Q1:2014年9月哪个店铺的revenue最高
    items.head()  #items数据框前5行
     item_nameitem_iditem_category_id
    0! ВО ВЛАСТИ НАВАЖДЕНИЯ (ПЛАСТ.) D040
    1!ABBYY FineReader 12 Professional Edition Full...176
    2***В ЛУЧАХ СЛАВЫ (UNV) D240
    3***ГОЛУБАЯ ВОЛНА (Univ) D340
    4***КОРОБКА (СТЕКЛО) D440
    ic=pd.merge(items,transactions)   #合并数据框,相当于join
    ic1 = ic[:1500000][ic['month'].isin([6,7,8])][ic.year==2014]     #选符合条件的子集(内存不够只能分段)
    rev_each_cat1 = ic1['revenue'].groupby(ic1['item_category_id']).sum()    #每种item category的revenue分别是多少
    del ic1                    #及时删除占内存的对象
    ic2 = ic[1500000:][ic['month'].isin([6,7,8])][ic.year==2014]     #第二段
    rev_each_cat2 = ic2['revenue'].groupby(ic2['item_category_id']).sum()
    del ic2
    rev = rev_each_cat1 + rev_each_cat2           #序列相加(不在两序列同时出现的category_id相加会是nan,所以不是个完美的解决方法)
    category_id_with_max_revenue = rev.idxmax()     #返回max值对应的索引号 
    ##Q2:2014年夏天哪个item_category的revenue最高
    
    pricenum = transactions.groupby(transactions['item_id']).item_price.nunique()   #每个item有多少个不同的price
    num_items_constant_price = pricenum[pricenum==1].count()   #返回只有一种价格的item的数量
    ##Q3:有多少item的价格一直没变过
    
    trans2 = transactions[transactions.month==12][transactions.year==2014][transactions.shop_id==25][transactions.item_cnt_day>0]  
    #选符合条件的子集
    var = np.var(trans2['item_cnt_day'])             
    ##Q4:‘item_cnt_day’列的方差
    
    gbd = trans2['item_cnt_day'].groupby(trans2['date']).sum()   
    plt.bar(gbd.index,gbd.values) 
    plt.ylabel('Num items')
    plt.xlabel('Day')
    plt.title("Daily revenue for shop_id = 25")
    plt.show()
    ##Q4:日销量柱状图

    很奇妙的是29号没有销量,30号销量猛增!原因至今还是个谜……

    展开全文
  • 对dataframe进行groupby之后得到的是一个groupby对象,不能直接打印输出,但可以对这个对象进行各种计算 df = pd.DataFrame({'key1':['a','a','b','b','a'], 'key2':['one','two','one','two','one'], 'data1':...

    对dataframe进行groupby之后得到的是一个groupby对象,不能直接打印输出,但可以对这个对象进行各种计算

    df = pd.DataFrame({'key1':['a','a','b','b','a'],
                       'key2':['one','two','one','two','one'],
                       'data1':np.random.randn(5),
                       'data2':np.random.randn(5)})
    df

     1.1 根据A列的标签取值,分组计算B列的均值、和、方差、标准差等

    df['data1'].groupby(df['key1']).mean()
    
    # 其中
    df['data1'].groupby(df['key1'])
    # 等价于
    df.groupby(df['key1'])['data1']

    1.1.1 需要区分以下两种用法,踩过坑。。。 

    1.1.1-1 如果传入的是series或者是1维的ndarray,一般不会出现什么错

    df['data1'].groupby([df['key1'], df['key2']]).mean()

     1.1.1-2 如果传入的是字符串列表,列表的取值必须是df的字段名,就是说'key1', 'key2'必须在.groupby之前这个dataframe中

    df.groupby(['key1', 'key2']).mean()

    1.2 size方法

    返回一个包含组大小信息的Series

    df.groupby(['key1', 'key2']).size()

    1.3 支持迭代遍历

    groupby对象支持遍历,生成一个组名和数据块组成的元组(组名,数据块),有点类似于enumerate,单层组名为字符串,如果组名有多层的形式,组名将会以元组的形式展示。

    for name,group in df.groupby(['key1', 'key2']):
        print(name)
        print(group, end='\n\n')

    1.4 按照dataframe字段的数据类型对数据进行分块

     groupby 的axis参数默认为axis=0,也可以设置为任意轴,设为1就是对列进行操作

    如按照数据类型对数据进行分块

    for name,group in df.groupby(df.dtypes, axis=1):
        print(name)
        print(group, end='\n\n')

    1.5 使用字典或Serise进行分组

    people = pd.DataFrame(np.random.randn(5,5),
                      columns = ['a','b','c','d','e'],
                      index = ['joe','steve','wes','jim','travis'])
    # 把一些值设为空值
    people.iloc[2:3, [1,2]] = np.nan
    people

    1.5-1 以字典作为分组规则

    mapping = {'a':'red', 'b':'red', 'c':'blue',
               'd':'blue', 'e':'red', 'f':'orange'}
    by_column = people.groupby(mapping, axis=1).sum()
    by_column

     

    1.5-2 以Series作为分组规则

    map_series = pd.Series(mapping)
    map_series

    people.groupby(mapping, axis=1).count()

    1.6 使用函数进行分组

    people.groupby(len, axis=1).count()
    Out[67]: 
            1
    joe     5
    steve   5
    wes     3
    jim     5
    travis  5
    
    people.groupby(len, axis=0).count()
    Out[68]: 
       a  b  c  d  e
    3  3  2  2  3  3
    5  1  1  1  1  1
    6  1  1  1  1  1

    1.7 使用索引层级进行分组

    columns = pd.MultiIndex.from_arrays([['us','us','us','jp','jp'],
                                         [1,3,5,1,3]],
                                        names=['city', 'tenor'])
    
    hier_df = pd.DataFrame(np.random.randn(4,5), columns=columns)
    hier_df

    hier_df.groupby(level='city', axis=1).count()

     groupby对象常用方法

    groupby高阶应用

    groupby.apply()  和 groupby.agg()

    先分组然后对每个单独的组进行apply函数的操作,然后尝试将每一块拼接到一起

    df = pd.DataFrame({'Q':['LI','ZHANG','ZHANG','LI','WANG'], 
                       'A' : [1,1,1,2,2], 
                       'B' : [1,-1,0,1,2], 
                       'C' : [3,4,5,6,7]})

    df.groupby('Q').apply(lambda x: print(x, end='\n\n'))

    df.groupby('Q').agg(lambda x: print(x, end='\n\n'))
    
    out:
    0    1
    3    2
    Name: A, dtype: int64
    
    4    2
    Name: A, dtype: int64
    
    1    1
    2    1
    Name: A, dtype: int64
    
    0    1
    3    1
    Name: B, dtype: int64
    
    4    2
    Name: B, dtype: int64
    
    1   -1
    2    0
    Name: B, dtype: int64
    
    0    3
    3    6
    Name: C, dtype: int64
    
    4    7
    Name: C, dtype: int64
    
    1    4
    2    5
    Name: C, dtype: int64

    可以看出,使用apply()处理的对象是一个个的类如DataFrame的数据表,然而agg()则每次只传入一列。

    有趣的是,agg()可以同时传入多个函数:

    df.groupby('Q').agg(['mean','std','count','max'])

    df.groupby('Q').agg(['mean','std','count','max']).plot(kind='bar')
    

    df.groupby('Q').apply(np.mean)

    在使用apply的过程中,如果还需要传递其他参数或关键字的话,可以把这些放在函数后进行传递

    transform方法

    .transform 可以产生一个标量值,并广播到各分组的尺寸数据中

    .transform 可以产生一个与输入尺寸相同的对象

    .transform 不可以改变它的输入

    df = pd.DataFrame({'key': ['a', 'b', 'c'] * 4,
                       'value': np.arange(12)})
    df

    df.groupby('key').value.mean()

    如果想要产生一个Series,它的尺寸和df['value']一样,但值都被‘key’分组后计算的值替代。可以向transform传递一个匿名函数

    df.groupby('key').transform(lambda x: x.mean()) # 替换成均值

    如果传递的函数是python的内建函数,可以像groupby中的agg方法一样传递一个字符串别名:

    与apply相似,transform可以与返回Series的函数一起使用,但结果必须和输入有相同的大小。如使用lambda函数给每个组乘以2

    还可以按照每个组降序排序

    定义一个标准化的函数

    def normallize(x):
        return (x - x.mean()) / x.std()
    
    df.groupby('key').transform(normallize)

     

     

    展开全文
  • Group By

    2020-09-08 11:28:11
    一、group by 的意思为分组汇总。 使用了group by 后,要求Select出的结果字段都是可汇总的,否则就会出错。 group by 有一个原则,就是 select 后面的所有列中,没有使用聚合函数的列,必须出现在 group by 后面。 ...

    一、group by 的意思为分组汇总。
    使用了group by 后,要求Select出的结果字段都是可汇总的,否则就会出错。

    group by 有一个原则,就是 select 后面的所有列中,没有使用聚合函数的列,必须出现在 group by 后面。

    比如,有:{学号,姓名,性别,年龄,成绩}字段

    这样写:
    SELECT 学号,姓名,性别,年龄,sum(成绩)
    FROM 学生表
    GROUP BY 学号
    就是错的,因为 “姓名、性别、年龄”未被汇总,且不一定是单一。

    这样写:
    SELECT MAX(学号),MAX(姓名),MAX(性别),MAX(年龄),sum(成绩)
    FROM 学生表
    GROUP BY 学号
    是对的,汇总出每一同学号学生的总成绩。注意的是,只要学号相同,别的如果有不同,取它们值最大的一条作为显示输出。

    这样写:
    SELECT 学号,姓名,性别,年龄,sum(成绩)
    FROM 学生表
    GROUP BY 学号,姓名,性别,年龄
    这样写也是对的,但注意的是,学号,姓名,性别,年龄中,只要有一个不同,就会当成另一条记录来汇总。

    二、什么是聚合函数?

    什么是聚合函数(aggregate function)?
    聚合函数对一组值执行计算并返回单一的值。

    SQL中的聚合函数介绍

    聚合函数有什么特点?
    除了 COUNT 以外,聚合函数忽略空值。
    聚合函数经常与 SELECT 语句的 GROUP BY 子句一同使用。
    所有聚合函数都具有确定性。任何时候用一组给定的输入值调用它们时,都返回相同的值。
    标量函数:只能对单个的数字或值进行计算。主要包括字符函数、日期/时间函数、数值函数和转换函数这四类。
    SQL中的聚合函数介绍

    常见的聚合函数有哪些?
    1、求个数/记录数/项目数等:count()

    例如: 统计员工个数?

    select count( ) from Company --包括空值
    select count(*) from Company --不包括空值
    2、求某一列平均数 :avg()

    例如:求某个班平均成绩 ?求某个公司员工的平均工资?

    select avg(score) from Scores —平均成绩
    select avg(salary) from Company --平均工资
    注意:

    若某行的score值为null时,计算平均值时会忽略带有null值得那一行。

    如果想要把null当做0,那么可以使用IsNull函数把null转换成0,语法如下:

    avg(IsNull(score,0)) as ’Average Score‘
    3、求总和,总分等:sum() --必须为数字列

    例如:求某个班的总成绩?求公司总薪资支出?

    select sum(score) from Scores
    select sum(salary) from Company
    4、求最大值,最高分,最高工资等:max()

    例如:求班里最高分,公司员工最高工资?

    select max(Score) from Scores
    select max(salary) from Company
    5、求最小值,最低分,最低工资等:max()

    例如:求班里最低分,公司员工最低工资?

    select min(Score) from Scores
    select min(salary) from Company
    SQL中的聚合函数介绍

    聚合函数怎么正确的使用?
    1、 select 语句的选择列表(子查询或外部查询);
    2、having 子句;
    3、compute 或 compute by 子句中等;
    注意: 在实际应用中,聚合函数常和分组函数group by结合使用,用来查询.where 子句的作用对象一般只是行,用来作为过滤数据的条件。

    SQL中的聚合函数介绍

    其他聚合函数(aggregate function)
    6、 count_big()返回指定组中的项目数量。

    与count()函数区别:count_big()返回bigint值,而count()返回的是int值。

    数据类型详见:

    SQL Server 数据类型的详细介绍及应用实例1

    SQL Server 数据类型的详细介绍及应用实例2

    SQL Server 数据类型的详细介绍及应用实例3

    例如:

    select count_big(prd_no) from sales
    7、 grouping()产生一个附加的列。

    当用cube或rollup运算符添加行时,输出值为1;

    当所添加的行不是由cube或rollup产生时,输出值为0.

    例如:

    select prd_no,sum(qty),grouping(prd_no) from sales group by prd_no with rollup
    8、binary_checksum() 返回对表中的行或表达式列表计算的二进制校验值,用于检测表中行的更改。

    例如:

    select prd_no,binary_checksum(qty) from sales group by prd_no
    9、checksum_agg() 返回指定数据的校验值,空值被忽略。

    例如:

    select prd_no,checksum_agg(binary_checksum(*)) from sales group by prd_no
    10、checksum() 返回在表的行上或在表达式列表上计算的校验值,用于生成哈希索引。

    11、stdev()返回给定表达式中所有值的统计标准偏差。

    例如:

    select stdev(prd_no) from sales
    12、stdevp() 返回给定表达式中的所有值的填充统计标准偏差。

    例如:

    select stdevp(prd_no) from sales
    13、 var() 返回给定表达式中所有值的统计方差。

    例如:

    select var(prd_no) from sales
    14、 varp()返回给定表达式中所有值的填充的统计方差。

    例如:

    select varp(prd_no) from sales

    展开全文
  • GROUP BY语句详解

    万次阅读 多人点赞 2019-07-15 23:40:04
    一、group by 的意思为分组汇总。 使用了group by 后,要求Select出的结果字段都是可汇总的,否则就会出错。 group by 有一个原则,就是 select 后面的所有列中,没有使用聚合函数的列,必须出现在 group by 后面。 ...

    一、group by 的意思为分组汇总。
    使用了group by 后,要求Select出的结果字段都是可汇总的,否则就会出错。

    group by 有一个原则,就是 select 后面的所有列中,没有使用聚合函数的列,必须出现在 group by 后面。

    比如,有:{学号,姓名,性别,年龄,成绩}字段

    这样写:
    SELECT 学号,姓名,性别,年龄,sum(成绩)
    FROM 学生表
    GROUP BY 学号
    就是错的,因为 “姓名、性别、年龄”未被汇总,且不一定是单一。

    这样写:
    SELECT MAX(学号),MAX(姓名),MAX(性别),MAX(年龄),sum(成绩)
    FROM 学生表
    GROUP BY 学号
    是对的,汇总出每一同学号学生的总成绩。注意的是,只要学号相同,别的如果有不同,取它们值最大的一条作为显示输出。

    这样写:
    SELECT 学号,姓名,性别,年龄,sum(成绩)
    FROM 学生表
    GROUP BY 学号,姓名,性别,年龄
    这样写也是对的,但注意的是,学号,姓名,性别,年龄中,只要有一个不同,就会当成另一条记录来汇总。

    二、什么是聚合函数?

    什么是聚合函数(aggregate function)?

    聚合函数对一组值执行计算并返回单一的值。

    SQL中的聚合函数介绍

     

    聚合函数有什么特点?

    1. 除了 COUNT 以外,聚合函数忽略空值。
    2. 聚合函数经常与 SELECT 语句的 GROUP BY 子句一同使用。
    3. 所有聚合函数都具有确定性。任何时候用一组给定的输入值调用它们时,都返回相同的值。
    4. 标量函数:只能对单个的数字或值进行计算。主要包括字符函数、日期/时间函数、数值函数和转换函数这四类。

    SQL中的聚合函数介绍

     

    常见的聚合函数有哪些?

    1、求个数/记录数/项目数等:count()

    例如: 统计员工个数?

    select count( ) from Company --包括空值
    select count(*) from Company --不包括空值
    

    2、求某一列平均数 :avg()

    例如:求某个班平均成绩 ?求某个公司员工的平均工资?

    select avg(score) from Scores ---平均成绩
    select avg(salary) from Company --平均工资
    

    注意:

    若某行的score值为null时,计算平均值时会忽略带有null值得那一行。

    如果想要把null当做0,那么可以使用IsNull函数把null转换成0,语法如下:

     avg(IsNull(score,0)) as ’Average Score‘
    

    3、求总和,总分等:sum() --必须为数字列

    例如:求某个班的总成绩?求公司总薪资支出?

    select sum(score) from Scores
    select sum(salary) from Company
    

    4、求最大值,最高分,最高工资等:max()

    例如:求班里最高分,公司员工最高工资?

    select max(Score) from Scores
    select max(salary) from Company
    

    5、求最小值,最低分,最低工资等:max()

    例如:求班里最低分,公司员工最低工资?

    select min(Score) from Scores
    select min(salary) from Company
    

    SQL中的聚合函数介绍

     

    聚合函数怎么正确的使用?

    • 1、 select 语句的选择列表(子查询或外部查询);
    • 2、having 子句;
    • 3、compute 或 compute by 子句中等;

    注意: 在实际应用中,聚合函数常和分组函数group by结合使用,用来查询.where 子句的作用对象一般只是行,用来作为过滤数据的条件。

    SQL中的聚合函数介绍

     

    其他聚合函数(aggregate function)

    6、 count_big()返回指定组中的项目数量。

    与count()函数区别:count_big()返回bigint值,而count()返回的是int值。

    数据类型详见:

    SQL Server 数据类型的详细介绍及应用实例1

    SQL Server 数据类型的详细介绍及应用实例2

    SQL Server 数据类型的详细介绍及应用实例3

    例如:

    select count_big(prd_no) from sales
    

    7、 grouping()产生一个附加的列。

    当用cube或rollup运算符添加行时,输出值为1;

    当所添加的行不是由cube或rollup产生时,输出值为0.

    例如:

    select prd_no,sum(qty),grouping(prd_no) from sales group by prd_no with rollup
    

    8、binary_checksum() 返回对表中的行或表达式列表计算的二进制校验值,用于检测表中行的更改。

    例如:

    select prd_no,binary_checksum(qty) from sales group by prd_no
    

    9、checksum_agg() 返回指定数据的校验值,空值被忽略。

    例如:

    select prd_no,checksum_agg(binary_checksum(*)) from sales group by prd_no
    

    10、checksum() 返回在表的行上或在表达式列表上计算的校验值,用于生成哈希索引。

    11、stdev()返回给定表达式中所有值的统计标准偏差。

    例如:

    select stdev(prd_no) from sales
    

    12、stdevp() 返回给定表达式中的所有值的填充统计标准偏差。

    例如:

    select stdevp(prd_no) from sales
    

    13、 var() 返回给定表达式中所有值的统计方差。

    例如:

    select var(prd_no) from sales
    

    14、 varp()返回给定表达式中所有值的填充的统计方差。

    例如:

    select varp(prd_no) from sales
    展开全文
  • pandas+groupby+std

    千次阅读 2018-07-16 08:53:01
    我们对groupby后的数据的某一列或者某几列求方差,代码如下:>>> df = pd.DataFrame({'a':range(10), 'b':range(10,20), 'c':list('abcdefghij'), 'g':[1]*3 + [2]*3 + [3]*4}) >&...
  • pandas的groupby

    2018-11-28 20:07:53
    groupby操作的是所有操作标签相同的数 比如data.groupby(‘col1’)操作的是所有col1标签相同的行他们列相加 例如下面一个dataframe A B C 0 a 2 102 1 b 8 98 2 a 1 107 3 c 4 104 4 a 3 115 5 c 2 87 6 b 5 92 7 c...
  • 直接举例子+分析例子+总结来说,我先给几个表: 学生表:student(学号,姓名,年龄,...首先定位到sc表上,“各个”很明显就是要按课程分组,group by出场了,分组后对每组去统计选课人数,聚集函数出场了。 聚集...
  • 方差分析

    千次阅读 2019-04-17 10:04:55
    方差分析关注的是三个或更多总体的均值是否相等的问题 基本假设:1.正态假设(W检验),因素每个水平的观测值样本都来自正态总体;2.方差齐性假设(多样本bartlett检验),各个总体分布的方差相同;3.独立假设,观测值...
  • 10. 分组groupby操作 仍然上面的代码作为例子:(但是由于没有设置随机数种子,所以以下面的数据作为参考) 单层分组运算: data . groupby ( "Direction" ) . a . min ( ) data.a.min()的结果...
  • pandas分组统计 - groupby功能

    万次阅读 多人点赞 2019-01-05 11:11:16
    分组统计 - groupby功能 ① 根据某些条件将数据拆分成组 ② 对每个组独立应用函数 ③ 将结果合并到一个数据结构中 Dataframe在行(axis=0)或列(axis=1)上进行分组,将一个函数应用到各个分组并产生一个新值,然后...
  • 方差分析(1) ——单因素方差分析及Excel示例

    万次阅读 多人点赞 2019-06-27 14:23:12
    文章目录什么是方差分析建立假设[^mcp]检验统计量偏差平方和均方F检验统计量...Analysis of variance (ANOVA) is a collection of statistical models used to analyze the differences among group means and th...
  • Patents_groupby机制

    2019-01-22 22:02:59
    1.使用列名分组 df = pd.DataFrame({'key1':['a', 'a', 'b', 'b', 'a'], 'key2':['one', 'two', 'one', 'two', 'one'], 'data1':np.random.randn(5), 'data2':np.random.randn(5)}) group_1=df.groupby...
  • python学习笔记--groupby

    2017-05-20 14:21:23
    groupby简介 1)groupby主要用户数据描述性统计分析,包括: 按一列或多列分组求平均数,计数,标准差等。 2) 经过优化的GroupBy的方法 count 分组中非NA值的数量 sum 非NA值的和 mean 非NA值的平均值 ...
  • ts = pd.Series(np.random.normal(0, 2, 1100), index=index) # 均值为0,方差为4,1100个点
  • ts = pd.Series(np.random.normal(0, 2, 1100), index=index) # 均值为0,方差为4,1100个点
  • pandas之groupby分组与pivot_table透视表

    万次阅读 2018-01-04 17:17:10
    pandas之groupby分组与pivot_table透视表在使用pandas进行数据分析时,避免不了使用groupby来对数据进行分组运算。groupby的参数groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, ...
  • group by

    2013-03-06 16:17:08
    select后面跟的字段必须在group by 后面出现,聚集函数除外 问题:老师 我这么跟你说吧 我想查出来福建分公司 今年一月份的保单数据 不要重复的 答案:Select distinct i.mainindex,t.netname From imageindexnew...
  • pandas groupby运算

    2019-07-24 21:31:44
    #GroupBy 分组运算有时也被称为 “split-apply-combine” 操作。其中的 “split” 便是借由obj.groupby()方法来实现的。 .groupby(by=None, axis=0, level=None, as_index=True, sort=True, g...
  • pandas groupby

    2020-08-17 20:55:27
    import pandas as pd df = pd.DataFrame({"name": ["wang","wei","zhao","li","uw"], "gender": ["boy","girl","girl","boy","girl"], "score": [56,67,47,87,None] ...df.groupby("gender").sum() # 分

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 8,703
精华内容 3,481
关键字:

groupby方差