精华内容
下载资源
问答
  • 我有组数据看起来像这样201206040210 -3461.00000000 -8134.00000000 -4514.00000000-4394.00000000 0 201206040211 -3580.00000000 -7967.00000000 -4614.00000000 -7876.00000000 0 201206040212 -3031.00000000...

    我有一组数据看起来像这样201206040210 -3461.00000000 -8134.00000000 -4514.00000000

    -4394.00000000 0 201206040211 -3580.00000000 -7967.00000000 -4614.00000000 -7876.00000000 0 201206040212 -3031.00000000 -9989.00000000 -9989.00000000 -3419.00000000 0 201206040213 -1199.00000000 -6961.00000000 -3798.00000000 -5822.00000000 0 201206040214 -2940.00000000 -5524.00000000 -5492.00000000

    -3394.00000000 0

    我想从第二列到最后一列,找出最小值、最大值和平均值。

    当列被空格和-分隔时,我对如何使用split有点困惑。

    我想一旦我这样做,我就可以使用min()和max函数。我已经写了一个shell脚本来做同样的事情#!/bin/ksh

    awk '{print substr($5,2);}' data' > /data1

    sort -n data1 > data2

    tail -1 data2

    head -1 data2

    awk '{sum+=$1} END {print "average = ",sum/NR}' data2

    我只是不知道如何在python中实现这一点。谢谢

    编辑:决定用numpy来做这个。在

    展开全文
  • 我想做个函数,它可以找到两件事:平均得分(满分100%),其中正面=1,反面=0他们为了得到这个分数而玩游戏数量是否可以为n设置动态函数?在import pandas as pdimport numpy as npdf=pd.DataFrame({'Users': ...

    我有两个不同的抛硬币数据帧。我想做一个函数,它可以找到两件事:平均得分(满分100%),其中正面=1,反面=0

    他们为了得到这个分数而玩的游戏的数量

    是否可以为n列设置动态函数?在import pandas as pd

    import numpy as np

    df=pd.DataFrame({'Users': [ 'Bob', 'Jim', 'Ted', 'Jesus', 'James'],

    'Round 1': ['np.nan','H','np.nan','T','H'],

    'Round 2': ['np.nan','H','H','H','T'],

    'Round 3': ['np.nan','T','T','T','T'],

    })

    df2=pd.DataFrame({'Users': [ 'Boob', 'Paul', 'Todd', 'Zeus', 'Derrik'],

    'Round 1': ['H','H','np.nan','T','np.nan'],

    'Round 3': ['H','T','H','T','np.nan'],

    'Round 5': ['H','T','H','T','np.nan'],

    'Round 7': ['H','H','H','H','H'],

    })

    df = df.set_index('Users')

    df2 = df2.set_index('Users')

    print (df)

    print (df2)

    以下是我尝试的:

    ^{pr2}$

    如果可能的话,我想我必须使用groupby

    结果应该如下所示:Round 1 Round 2 Round 3 Average Rounds played

    Users

    Bob np.nan np.nan np.nan NaN 0

    Jim 1 1 0 0.66 3

    Ted np.nan 1 0 0.5 2

    Jesus 0 1 0 0.33 3

    James 1 0 0 0.33 2

    [5 rows x 3 columns]

    展开全文
  • 我有一个数据框,我想计算扩展平均值超过一列(quiz_score),但需要按两个不同列(userid和week)进行分组.数据如下所示:data = {"userid": ['1','1','1','1','1','1','1','1', '2','2','2','2','2','2','2','2'],\...

    我有一个数据框,我想计算扩展平均值超过一列(quiz_score),但需要按两个不同的列(userid和week)进行分组.数据如下所示:

    data = {"userid": ['1','1','1','1','1','1','1','1', '2','2','2','2','2','2','2','2'],\

    "week": [1,1,2,2,3,3,4,4, 1,2,2,3,3,4,4,5],\

    "quiz_score": [12, 14, 14, 15, 9, 15, 11, 14, 15, 14, 15, 13, 15, 10, 14, 14]}

    >>> df = pd.DataFrame(data, columns = ['userid', 'week', 'quiz_score'])

    >>> df

    userid week quiz_score

    0 1 1 12

    1 1 1 14

    2 1 2 14

    3 1 2 15

    4 1 3 9

    5 1 3 15

    6 1 4 11

    7 1 4 14

    8 2 1 15

    9 2 2 14

    10 2 2 15

    11 2 3 13

    12 2 3 15

    13 2 4 10

    14 2 4 14

    15 2 5 14

    我需要计算每周用户ID的扩展方式 – 也就是说,对于每个用户每周,我需要他们在前几周的平均测验得分.我知道解决方案将涉及以某种形式使用shift()和pd.expanding_mean()或.expanding().mean(),但我无法将分组和移位正确 – 即使我尝试不移动,结果没有正确分组,似乎只是扩展行的意思,好像根本没有分组:

    df.groupby([‘userid’,’week’]).apply(pd.expanding_mean).reset_index()

    要清楚,正确的结果将如下所示:

    userid week expanding_mean_quiz_score

    0 1 1 NA

    1 1 2 13

    2 1 3 13.75

    3 1 4 13.166666

    4 1 5 13

    5 1 6 13

    6 2 1 NA

    7 2 2 15

    8 2 3 14.666666

    9 2 4 14.4

    10 2 5 13.714

    11 2 6 13.75

    请注意,每个用户/周的expanding_mean_quiz_score是该用户在前几周的分数的平均值.

    谢谢你的帮助,我从来没有使用过expanding_mean()而且我在这里难过.

    最佳答案 您可以将用户ID和“周”分组,并跟踪这些分组的总分数和计数.然后在groupby对象上使用扩展方法来累积分数和计数.最后,通过划分两个累积来获得所需的列.

    a=df.groupby(['userid', 'week'])['quiz_score'].agg(('sum', 'count'))

    a = a.reindex(pd.MultiIndex.from_product([['1', '2'], range(1,7)], names=['userid', 'week']))

    b = a.groupby(level=0).cumsum().groupby(level=0).shift(1)

    b['em_quiz_score'] = b['sum'] / b['count']

    c = b.reset_index().drop(['count', 'sum'], axis=1)

    d = c.groupby('userid').fillna(method='ffill')

    d['userid'] = c['userid']

    d = d[['userid', 'week', 'em_quiz_score']]

    userid week em_quiz_score

    0 1 1 NaN

    1 1 2 13.000000

    2 1 3 13.750000

    3 1 4 13.166667

    4 1 5 13.000000

    5 1 6 13.000000

    6 2 1 NaN

    7 2 2 15.000000

    8 2 3 14.666667

    9 2 4 14.400000

    10 2 5 13.714286

    11 2 6 13.750000

    展开全文
  • Python中如何DataFrame中某一列数的平均值? 例如df对象中close列的5日均线: 1.使用循环,采用手动计算的方式: df['close'][i-4:i+1].mean() 获取第i天的5日均线 2.对整个dataframe对象,使用rolling...

    Python中如何求DataFrame中某一列数的日平均值?

    例如求df对象中close列的5日均线:

    1.使用循环,采用手动计算的方式:

    df['close'][i-4:i+1].mean()

    获取第i天的5日均线

    2.对整个dataframe对象,使用rolling函数:

    daily['close'].rolling(5).mean()

    其中rolling[5]返回的是一个rolling对象,包含5行数据的对象,因此需要想(1)中一样使用mean,获取平均值。

    获取每一条记录的5日均值。

    展开全文
  • 更改此行:x = (row['Total APM'])收件人:^{pr2}$这会将字符串/数字转换为实际整数,您可以使用该整数进行数值运算。在下面是代码中可能发生事情:>>> x = "1">>> sum(x)Traceback (most recent call last):...
  • 目前,它正在获取所有中所有值的平均值:def average_column (csv):f = open(csv,"r")average = 0Sum = 0row_count = 0for row in f:for column in row.split(','):n=float(column)Sum += nrow_count += 1ave...
  • python函数列表平均值的方法:用法:mean(matrix,axis=0)其中matrix为个矩阵,axis为参数以m * n矩阵举例:axis不设置值,对 m*n 个数求均值,返回个实数axis=0:压缩行,对各列求均值,返回 1* n 矩阵axis=1...
  • python函数列表平均值的方法:用法:mean(matrix,axis=0)其中matrix为个矩阵,axis为参数以m * n矩阵举例:axis不设置值,对 m*n 个数求均值,返回个实数axis=0:压缩行,对各列求均值,返回 1* n 矩阵axis=1...
  • python函数列表平均值的方法:用法:mean(matrix,axis=0)其中matrix为个矩阵,axis为参数以m * n矩阵举例:axis不设置值,对 m*n 个数求均值,返回个实数axis=0:压缩行,对各列求均值,返回 1* n 矩阵axis=1...
  • python函数列表平均值的要领:用法:mean(matrix,axis=0)个中matrix为个矩阵,axis为参数以m * n矩阵举例:axis不设置值,对 m*n 个数求均值,返回个实数axis=0:紧缩行,对各列求均值,返回 1* n 矩阵axis=1...
  • 这是种相当时间和资源有效的方法,它读取值并并行计算所有文件的平均值,但每次只读取行文件 – 但它会暂时读取整个第个.dat文件进入内存以确定每个文件中将有多少行和每数字.你没有说你的“数字”是整数还是...
  • 我使用以下代码来获得薪水大于某个阈值的人的平均年龄.dataframe.filter(df['salary'] > 100000).agg({"avg": "age"})的年龄是数字(浮点数),但我仍然收到此错误.py4j.protocol.Py4JJavaError: An error ...
  • 生信(五)awk取某一列的平均值

    千次阅读 2018-11-02 11:38:46
    怎么第四列的平均数呢? Python版本 我们可以用几行Python代码解决,比如这样: 其耗时: R版本 用R来做计算也是很适合的,比如像这样: 其耗时: awk版本 awk用行代码就可以解决问题,像这样(注意耗时):...
  • 用法:mean(matrix,axis=0) 其中 matrix为个矩阵,axis为参数以m * n矩阵举例:axis 不设置,对 m*n 个数求均值,返回个实数axis = 0:压缩行,对各列求均值,返回 1* n 矩阵axis =1 :压缩,对各行均值,...
  • 编写程序p1.py编写程序,找出个列表中最大。示例代码如下:2. 编写程序p2.py模仿p1.py源代码,编写程序,找出个列表中最小值,数据还是使用[2, 4, 9, 7,19, 94, 5],运行结果如下:23. 编写程序p3.py编写...
  • Python成绩:"); labscore3.setBounds(50, 230, 100, 50); txtscore3 = new JTextField("请输入学生成绩:",30); txtscore3.setBounds(130, 240, 180, 30); labscore4 = new JLabel("C...
  • (1)、算数平均值权重 步骤: 判断矩阵按求和,得到新矩阵a_axis_0_sum 把判断矩阵中都除以和,得到新矩阵b 计算新矩阵b行和,得到新矩阵b_axis_1_sum 将b_axis_1_sum每个值除以总和,获得...
  • 他们还告诉数据集中值与数据集中各列的算术平均值相差多远。有时,可能需要获取本质上为数字特定列的标准偏差。这是std()可以使用该功能地方。可以将需要计算均值的列索引到数据框,并可以使用点运算符对此...
  • 1. 均值 import numpy as np X=np.array([1,2,3,4,5,6]...np.mean(a) # 将上面二维矩阵每个元素相加除以元素个求平均数) #输出:2.5 np.mean(a, axis=0) # axis=0,计算每一列的均值 #输出:array([ 2., ...
  • 、聚合函数 1. 聚合函数的介绍 聚合函数又叫组函数,通常是对表中的数据进行统计和计算,...● avg(col):表示指定列的平均值 2. 总行 (1)返回总行,包括 null 值:select count(*) from job; (2)返回总行
  • 1、np.mean(X,axis=0):矩阵X每一列的平均值 np.mean(X,axis=1):矩阵X每一行的平均值 2、shape函数是numpy.core.fromnumeric中的函数,它的功能是查看矩阵或者数组的维。 X.shape会输出矩阵X为几维几列 ...
  • mu = np.mean(X_norm,0) # 一列的平均值(0指定为列,1代表行) sigma = np.std(X_norm,0) # 一列的标准差 for i in range(X.shape[1]): # 遍历列 X_norm[:,i] = (X_norm[:,i]-mu[i])/sigma[i] # 归一化...
  • 本文主要介绍python的第三方数据分析库pandas,阐述其在数据分析领域应该如何高效地进行分组聚合,共分享5个最佳实践。groupby概念groupby语句在数据分析...将每一列分别聚合求平均数,和,标准差,如下所示传入字典...
  • 求平均值,然后对于所有样例,都减去对应均值第二步:特征协方差矩阵第三步:协方差特征值和特征向量第四步:将特征值按照从大到小顺序排序,选择其中最大k个,然后将其对应k个特征向量分别作为...
  • python 数据结构

    2019-06-06 09:29:08
    (1)如:在一列排好顺序成绩下,去掉一个最低分和一个最高分,对剩下的数求平均值 def ggg(grede): frist,*list,end = grede return list grede = [23,45,55,78,89,100] list = ggg(grede) print("%f\n"%(sum...
  • python学习笔记--groupby

    2017-05-20 14:21:23
    1)groupby主要用户数据描述性统计分析,包括: 按一列或多列分组平均,计数,标准差等。 2) 经过优化的GroupBy的方法 count 分组中非NA值的数量 sum 非NA值的和 mean 非NA值的平均值 median 非NA值...
  • 对于一列数字,比如10.1、10.3、9.7、9.9、10.5来说,我们要采用一个数字Y来替代他们。要求是这些与Y差异要达到最小。在数学上就是:‍但是数学上对于绝对值比较排斥,一般直接采用平方代替。也就是二乘...
  • 2.并在其筛选出其大于平均值的数; 二.将分开文件合并操作: 三.排序 四.找到多页面下文章后,按照专栏名字进行对应,记录保存名字后那些文章; 五.实现某列的去重,只保留其中数据内容: 使用drop...
  • Excel公式基础在空格里加等于号之后直接书写公式即可例如一列三个数的平均值:=(A1+A2+A3)/3用求和函数来做:=SUM(A1:A3)/3统计A1,A2....,A10中非空单元格的个数:=COUNTA(A1:A10)IF语句:=IF(条件,条件为...
  • PCA算法,从名字看也知道是用于降维的,通过提取主特征...零均值化就是一列的平均值,然后该列上的所有都减去这个均值。也就是说,这里零均值化是对每一个特征而言的,零均值化后,每个特征的均值变成0。2)...

空空如也

空空如也

1 2 3
收藏数 42
精华内容 16
关键字:

python求一列数的平均值

python 订阅