精华内容
下载资源
问答
  • 需求:当我们处理行数据时,要求这行中不同的最值、最大、最小值、均值等数据。 如例:  name Chinese Math English  PE tom 88 87 89 90 tony 98 97 99 90 ...

    需求:当我们处理一行数据时,要求这一行中不同列的最值、最大值、最小值、均值等数据。

    如例: 

    name Chinese Math English  PE
    tom 88 87 89 90
    tony 98 97 99 90
    leo 67 78 89 91
    bob 90 89 91 97

     

    统计每位学生的成绩最大值,最小值,平均值。

    以最大值为例:

    #定义获取各科成绩最大值的函数
    def getMax(row):
        return max(row["Chinese"],row["Math"],row["English"],row["PE"])
    
    
    df["max"]=df.apply(lambda row:getMax(row),axis=1)

    其他类似,

    展开全文
  • 我有个从csv导入的数据帧,它(经过大量简化)如下所示:date = ['2013-08-10','2013-08-10','2013-08-10','2013-08-10','2013-08-10','2013-08-10','2013-08-10','2013-08-10','2013-08-10','2013-08-10']event = ...

    我对熊猫不太熟悉,有点不知所措。我有一个从csv导入的数据帧,它(经过大量简化)如下所示:date = ['2013-08-10','2013-08-10','2013-08-10','2013-08-10','2013-08-10',

    '2013-08-10','2013-08-10','2013-08-10','2013-08-10','2013-08-10']

    event = ['213','213','213','213','214','214','214','215','215','215']

    side = ['A','B','B','B','A','B','A','B','A','B',]

    value = [0.193,0.193,0.092,0.027,0.027,0.058,0.027,0.079,0.193,0.159]

    df = pd.DataFrame(zip(event,date,side,value),

    columns=['event','date','side','value'])

    event date side value

    0 213 2013-08-10 A 0.193

    1 213 2013-08-10 B 0.193

    2 213 2013-08-10 B 0.092

    3 213 2013-08-10 B 0.027

    4 214 2013-08-10 A 0.027

    5 214 2013-08-10 B 0.058

    6 214 2013-08-10 A 0.027

    7 215 2013-08-10 B 0.079

    8 215 2013-08-10 A 0.193

    9 215 2013-08-10 B 0.159

    我想要的是对每个事件的每一个边对应的值求和。我用groupby实现了这一点:

    ^{pr2}$

    但我还想添加一个新的列,每边的平均值都在扩大,如下所示:value

    event side roll_mean

    213 A 0.193 0

    B 0.312 0

    214 A 0.054 0.193

    B 0.058 0.312

    215 A 0.193 0.124

    B 0.238 0.185

    请注意,每个事件都有两面性,但并不总是A和B。我想要的是类似excel的东西平均值。如果函数,该函数计算当前边的所有值的扩展平均值,并应用于前面的所有行。如有任何帮助,我们将不胜感激。在

    展开全文
  • pandas根据日期一列的年平均值

    千次阅读 2020-03-11 18:58:16
    对于这种,读进来日期不是日期格式,并且有时候天有很多条数据,天没有数据的情况,根据年份合并star_rating这栏的平均值。 读入数据并删除无关 pcfr = pd.read_excel('microwave.xlsx') df = pcfr[['...

    对于这种,读进来日期不是日期格式,并且有时候一天有很多条数据,一天没有数据的情况,根据年份合并求star_rating这一栏的平均值。
    在这里插入图片描述

    读入数据并删除无关列

    pcfr = pd.read_excel('microwave.xlsx')
    df = pcfr[['review_date','star_rating']]
    df.head(3)
    

    会警告,无视之。

    df['review_date'] = pd.to_datetime(df['review_date'])
    

    日期格式的转化

    # df.set_index('review_date')
    # df.reset_index()
    t = df.set_index('review_date')
    t.head(3)
    

    这一步结束后可以看到日期已经转换成功。
    在这里插入图片描述
    利用groupby分组求年平均值

    m = t.groupby(pd.Grouper(freq='Y')).mean()
    print(m)
    

    在这里插入图片描述

    展开全文
  • /前言/前几天群里有个小伙伴问了一个问题,关于Python读取文件夹下多个CSV文件中的第一列数据并其最大和最小值,大家讨论的甚为激烈,在此总结了两个方法,希望后面有遇到该问题的小伙伴可以少走弯路。...

    /前言/

        前几天群里有个小伙伴问了一个问题,关于Python读取文件夹下多个CSV文件中的第一列数据并求其最大值和最小值,大家讨论的甚为激烈,在此总结了两个方法,希望后面有遇到该问题的小伙伴可以少走弯路。

    /一、问题描述/

       如果想求CSV或者Excel中的最大值或者最小值,我们一般借助Excel中的自带函数max()和min()就可以求出来。如果只是一两个文件,处理起来肯定是小菜一碟了,当文件的个数达到上百个,如果再按照该方法进行的话,那可就费时费力了,事倍功半。

        不过白慌,针对下图中的多个CSV文件,我们可以利用Python来一次性遍历读取多个文件,然后分别对文件进行处理,事半功倍。

    a47b28b71906663c47bcc03e4c57e191.png

    /二、解决方法/

    1、首先来看看文件内容,这里取其中一个文件的内容,如下图所示。

    45b9c11b38e7df3e2959446f7fedda78.png

        当然这只是文件内容中的一小部分,真实的数据量绝对不是21个。

    2、现在我们想对第一列或者第二列等数据进行操作,以最大值和最小值的求取为例,这里以第一列为目标数据,来进行求值。

    a75ebe38f368f0d430e986ea2d0990b8.png

        通常我们通过Python来处理数据,用的比较多的两个库就是numpy和pandas,在本篇文章中,将分别利用两个库来进行操作。

    3、其中使用pandas库来实现读取文件夹下多个CSV文件中的第一列数据并求其最大值和最小值的代码如下图所示。

    7be97edf92682c8eb7d2d835eba7913c.png

    4、通过pandas库求取的结果如下图所示。

    617788571697cd965ce4ee6398fee58c.png

        通过该方法,便可以快速的取到文件夹下所有文件的第一列的最大值和最小值。

    5、下面使用numpy库来实现读取文件夹下多个CSV文件中的第一列数据并求其最大值和最小值的代码如下图所示。

    79424e7247695cf23d0daa1faf8f9b4d.png

    6、通过numpy库求取的结果如下图所示。

    e0d4e0af53bcf1286f15f01da7b4bb2e.png

    通过该方法,也可以快速的取到文件夹下所有文件的第一列的最大值和最小值。

    /小结/

        本文基于Python,使用numpy库和pandas库实现了读取文件夹下多个CSV文件,并求取文件中第一列数据的最大值和最小值,当然除了这两种方法之外,肯定还有其他的方法也可以做得到的,欢迎大家积极探讨。


    Python学习交流群 

    为了让大家更加即时地沟通学习,我们建了一个Python学习交流群,有想入群的同学,可以添加下面小助手微信,他会拉大家入群哈~

    65fe8eaecb3026606c5c75b8e6b05c29.png

    展开全文
  • 我有下个DataFrame:data=pd.read_csv('anual.csv', parse_dates='Fecha', index_col=0)dataDatetimeIndex: 290 entries, 2011-01-01 00:00:00 to 2011-12-31 00:00:00Data columns (total 12 columns):HR 2...
  • Python实现按某一列关键字分组,并计算各列的平均值,并用该值填充该分类该列的nan值。 DataFrame数据格式 fillna方式实现 groupby方式实现 DataFrame数据格式 以下是数据存储形式: fillna方式实现 1、按照...
  • Python实现按某一列关键字分组,并计算各列的平均值,并用该值填充该分类该列的nan值。 DataFrame数据格式 fillna方式实现 groupby方式实现 DataFrame数据格式以下是数据存储形式: fillna方式实现 按照...
  • Python实现按某一列关键字分组,并计算各列的平均值,并用该值填充该分类该列的nan值。DataFrame数据格式fillna方式实现groupby方式实现DataFrame数据格式以下是数据存储形式:fillna方式实现1、按照industryName1列...
  • Python实现按某一列关键字分组,并计算各列的平均值,并用该值填充该分类该列的nan值。DataFrame数据格式fillna方式实现groupby方式实现DataFrame数据格式以下是数据存储形式:fillna方式实现1、按照industryName1列...
  • Python实现按某一列关键字分组,并计算各列的平均值,并用该值填充该分类该列的nan值。DataFrame数据格式fillna方式实现groupby方式实现DataFrame数据格式以下是数据存储形式:fillna方式实现1、按照industryName1列...
  • 种:按照‘分组的名字’进行分组, 然后的列名’各组的平均值&最大值: 求平均值: df.groupby('分组的名字')['的列名'].mean() 最大值: df.groupby('分组的名字')['的列名'].max() 第二...
  • 我有一个数据框,我想计算扩展平均值超过一列(quiz_score),但需要按两个不同的列(userid和week)进行分组.数据如下所示:data = {"userid": ['1','1','1','1','1','1','1','1', '2','2','2','2','2','2','2','2'],\...
  • 我有一个数据框,我想计算扩展平均值超过一列(quiz_score),但需要按两个不同的列(userid和week)进行分组.数据如下所示:data = {"userid": ['1','1','1','1','1','1','1','1', '2','2','2','2','2','2','2','2'],\...
  • 接着上篇继续,上篇主要讲Pandas数据的处理部分,这篇记录偏数据分析的部分,继续使用titanic的数据集。要求titanic中各船舱票价、年龄段人数之类的聚合型问题,类似以Excel中的数据透视表,pandas中使用pivot...
  • 情景:计算两次考试,所有学生的平均成绩: '''a.csv date,name,grade 2020-07-01,mary,70 2020-07-01,tom,80 2020-07-01,jerry,70 2020-07-02,mary,80 2020-07-02,tom,90 2020-07-02,tom,100''' grade = pd....
  • #把ave_time这列的缺失值进进行填充,填充的方法是按这一列平均值进行填充 df2=df.fillna(aveTime) #取表中的第3列的所有值 col=df2.iloc[:,2] #取表中的第3列的所有值 arrs=col.values #输出结果 print(arrs) ...
  • #需求:分数的平均值和总和 #1、导入包 import pandas as pd s = pd.read_excel(r"D:\pythonProject\Pandas玩转Excel-" r"源代码\代码\019\...#3、新建一列,axis选按行计算平均值 s["和"] = temp.sum(axis=1) s
  • 读取本地文件import pandas as pddf = pd.read_excel("test.xlsx")分类求平均值部分截图按education分组求平均值print(df.groupby('education').mean())一共三类特殊玩法print(df.groupby('createTime').mean())按...
  • # -*-coding: utf-8 -*- import pandas as pd #读取csv文件 df=pd.read_csv('A_2+20+DoW+VC.csv') ...#把ave_time这列的缺失值进进行填充,填充的方法是按这一列平均值进行填充 df2=df.fillna(aveTime) #...
  • 我想做个函数,它可以找到两件事:平均得分(满分100%),其中正面=1,反面=0他们为了得到这个分数而玩的游戏的数量是否可以为n设置动态函数?在import pandas as pdimport numpy as npdf=pd.DataFrame({'Users': ...
  • # -*-coding: utf-8 -*- import pandas as pd #读取csv文件 df=pd.read_csv('A_2+20+DoW+VC.csv') ...#把ave_time这列的缺失值进进行填充,填充的方法是按这一列平均值进行填充 df2=df.fillna(aveTime) #
  • # -*-coding: utf-8 -*- import pandas as pd #读取csv文件 df=pd.read_csv('A_2+20+DoW+VC.csv') ...#把ave_time这列的缺失值进进行填充,填充的方法是按这一列平均值进行填充 df2=df.fillna(aveTim...

空空如也

空空如也

1 2 3 4
收藏数 62
精华内容 24
关键字:

pandas求一列平均值