精华内容
下载资源
问答
  • DataFrame.value_counts(subset=None,normalize=False,sort=True,ascending=False)[source]返回一个包含DataFrame中唯一行数的Series。1.1.0版中的新功能。参数:subset:list-like, 可选计算唯一组合时要使用的列。...

    DataFrame.value_counts(subset=None, normalize=False, sort=True, ascending=False)[source]

    返回一个包含DataFrame中唯一行数的Series。

    1.1.0版中的新功能。

    参数:subset :list-like, 可选

    计算唯一组合时要使用的列。

    normalize:bool, 默认为 False

    返回比例而不是频率。

    sort :bool, 默认为 True

    按频率排序。

    ascending:bool, 默认为 False

    升序排列。

    返回值:Series

    Notes

    返回的Series将具有一个MultiIndex,每个输入列具有一个级别。默认情况下,结果中将省略包含任何NA值的行。默认情况下,生成的Series将按降序排列,以便第一个元素是出现频率最高的行。

    例子,>>> df = pd.DataFrame({'num_legs': [2, 4, 4, 6],

    ... 'num_wings': [2, 0, 0, 0]},

    ... index=['falcon', 'dog', 'cat', 'ant'])

    >>> df

    num_legs num_wings

    falcon 2 2

    dog 4 0

    cat 4 0

    ant 6 0>>> df.value_counts()

    num_legs num_wings

    4 0 2

    6 0 1

    2 2 1

    dtype: int64>>> df.value_counts(sort=False)

    num_legs num_wings

    2 2 1

    4 0 2

    6 0 1

    dtype: int64>>> df.value_counts(ascending=True)

    num_legs num_wings

    2 2 1

    6 0 1

    4 0 2

    dtype: int64>>> df.value_counts(normalize=True)

    num_legs num_wings

    4 0 0.50

    6 0 0.25

    2 2 0.25

    dtype: float64

    展开全文
  • value函数对数据进行排序,(忘记的同学可以在下面复习一下~)侦探L:如何使用Python对数据进行排序(入门篇)​zhuanlan.zhihu.com今天再介绍一下如何在python里使用value_counts( )和counts( )进行计数。...

    在我们使用pandas进行数据分析时,时常需要对数据进行排序、计量,以获取数据的某些信息,在之前的文章中,我已经为大家介绍过如何用如何使用sort_value函数对数据进行排序,(忘记的同学可以在下面复习一下~)侦探L:如何使用Python对数据进行排序(入门篇)​zhuanlan.zhihu.com8246b80d1a355d33fe6f4972b18181a6.png

    今天再介绍一下如何在python里使用value_counts( )和counts( )进行计数。

    一、counts( )函数

    1、count()在字符串里的使用

    函数体及主要参数:

    count(str,start=0 ,end=len(string)

    str:要搜索的子字符串

    start:开始搜索的位置,默认是0,也就是从第一个字符开始搜索。

    end:结束搜索的位置,默认在最后一个字符停止搜索。

    实验一下~

    首先我们还是先构建一个字符串:

    df_str="abcabcdabcdeab5343实验字符串串串串"

    df_str

    统计一下字符“a”的个数:

    统计一下字符“3”的个数:

    统计一下字符“串”的个数:

    题外小知识:

    输出结果的时候,其实L更推荐使用format()函数进行输出,这也是一种更实用的输出方式,类似上面的输出结果,我们可以用format( )进行更高级的输出:

    print("统计一下字符 'a' 的个数: \n{}".format(df_str.count('a')))

    等以后有空再写一篇关于输入输出的文章~

    2、count( )在列表里的使用

    创建一个实验列表:

    a=[1,2,3,4,5,4,4,4,2,'a','b','a','子','子']

    大家注意看下面6种情况下,不同的输出结果:

    也就是说在使用的时候,要根据数值类型的不同,正确区别字符。

    二、value_counts( )函数

    在pandas中,value_counts常用于数据表的计数及排序,它可以用来查看数据表中,指定列里有多少个不同的数据值,并计算每个不同值有在该列中的个数,同时还能根据需要进行排序。

    函数体及主要参数:

    value_counts(values,sort=True, ascending=False, normalize=False,bins=None,dropna=True)

    sort=True: 是否要进行排序;默认进行排序

    ascending=False: 默认降序排列;

    normalize=False: 是否要对计算结果进行标准化并显示标准化后的结果,默认是False。

    bins=None: 可以自定义分组区间,默认是否;

    dropna=True:是否删除缺失值nan,默认删除

    首先,我们还是先创建一个数据表:

    import pandas as pd

    import numpy as np

    df = pd.DataFrame({'城市':['北京','广州', '天津', '上海', '杭州', '成都', '澳门', '南京','北京','北京'],

    '收入':[10000, 10000, 5000, 5002, 40000, 50000, 8000, 5000,5000,5000],

    '年龄':[50, 43, 34, 40, 25, 25, 45, 32,25,25]})

    df.set_index([["一","二","三","四","五","六","七","八","九","十"]],inplace=True)

    df

    (1)查看“城市”这一列的计数结果:

    可以看到,默认降序排列;

    (2)采用升序的方式,查看“收入”这一列:

    df['收入'].value_counts(ascending=True)

    (3)使用标准化normalize=True的方法,查看“年龄”这一列的计数占比:

    df['年龄'].value_counts(ascending=True,normalize=True)

    PS:缺失值是默认被删除的,也就是不被计算其中~

    而且,如果要计数的对象是numpy里的ndarray类型的话,可以用size的方法,同样可以达到上述的效果,这里就不举例了~

    以上便是的内容,感谢大家的细心阅读,同时欢迎感兴趣的小伙伴一起讨论、学习,想要了解更多内容的可以看我的其他文章,同时可以持续关注我的动态~

    展开全文
  • 1. Series 情况下:pandas 的 value_counts() 函数可以对Series里面的每个值进行计数并且排序。import pandas as pddf = pd.DataFrame({'区域' : ['西安', '太原', '西安', '太原', '郑州', '太原'],'10月份销售' : ...

    3a2c5c47719654b2eb3ed26ac95e70d8.png

    在pandas里面常用value_counts确认数据出现的频率。

    1. Series 情况下:

    pandas 的 value_counts() 函数可以对Series里面的每个值进行计数并且排序。

    import pandas as pd

    df = pd.DataFrame({'区域' : ['西安', '太原', '西安', '太原', '郑州', '太原'],

    '10月份销售' : ['0.477468', '0.195046', '0.015964', '0.259654', '0.856412', '0.259644'],

    '9月份销售' : ['0.347705', '0.151220', '0.895599', '0236547', '0.569841', '0.254784']})

    print(df)

    统计每个区域出现多少次:

    print(df['区域'].value_counts())

    每个区域都被计数,并且默认从高到低排序。

    如果想升序排列,设置参数 ascending = True:

    print(df['区域'].value_counts(ascending=True))

    如果想得出计数占比,可以加参数 normalize=True

    print(df['区域'].value_counts(normalize=True))

    注:空值默认剔除掉的。value_counts()返回的结果是一个Series数组,可以跟别的数组进行计算。

    2. DataFrame 情况下:

    import pandas as pd

    df = pd.DataFrame({'区域1' : ['西安', '太原', '西安', '太原', '郑州', '太原'],

    '区域2' : ['太原', '太原', '西安', '西安', '西安', '太原']})

    print(df.apply(pd.value_counts))

    区域2中没有郑州,所以是NaN。

    以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。

    展开全文
  • value_counts()函数返回一个Series, 其中包含唯一值的计数。它返回一个降序排列的对象, 这样它的第一个元素将成为最常出现的元素。默认情况下, 它不包含NA值。句法Series.value_counts(normalize=False, sort=True, ...

    value_counts()函数返回一个Series, 其中包含唯一值的计数。它返回一个降序排列的对象, 这样它的第一个元素将成为最常出现的元素。

    默认情况下, 它不包含NA值。

    句法

    Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)

    参数

    normalize:如果为true, 则返回的对象将包含唯一值的相对频率。

    sort:按值排序。

    升序:按升序排序。

    bins:不对值进行计数, 而是将它们分组到半开式容器中, 这些容器为pd.cut(仅适用于数字数据)提供了便利。

    dropna:不包括NaN计数。

    退货

    它返回计数的序列。

    例1

    import pandas as pd

    import numpy as np

    index = pd.Index([2, 1, 1, np.nan, 3])

    index.value_counts()

    输出

    1.0 2

    3.0 1

    2.0 1

    dtype: int64

    例2

    import pandas as pd

    import numpy as np

    index = pd.Index([2, 1, 1, np.nan, 3])

    a = pd.Series([2, 1, 1, np.nan, 3])

    a.value_counts(normalize=True)

    输出

    1.0 0.50

    3.0 0.25

    2.0 0.25

    dtype: float64

    范例3

    import pandas as pd

    index = pd.Index([1, 3, 2, 2, 1, np.nan])

    index.value_counts()

    a = pd.Series([1, 3, 2, 2, 1, np.nan])

    a.value_counts(bins=2)

    输出

    (0.997, 2.0] 4

    (2.0, 3.0] 1

    dtype: int64

    例子4

    import pandas as pd

    index = pd.Index([1, 3, 2, 2, 1, np.nan])

    index.value_counts()

    a = pd.Series([1, 3, 2, 2, 1, np.nan])

    a.value_counts(dropna=False)

    输出

    2.0 2

    1.0 2

    NaN 1

    3.0 1

    dtype: int64

    展开全文
  • python value_counts()的基础及进阶用法(超详细)

    万次阅读 多人点赞 2019-11-29 21:56:58
    pandas 计数函数value_counts() 完整版函数 value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True) 参数: 1.normalize : boolean, default False 默认false,如为true,则以百分比的...
  • 在我使用:step1['y_ocsvm'].value_counts()来获得1和-1的计数,结果是:step1['y_ocsvm'].value_counts()Out[11]:1 1622-1 426Name: y_ocsvm, dtype: int64我想找出-1数与1数的比值。我可以简单地做426/16...
  • with_team[['team1', 'team2']] == opponent).any(axis=1)] winners = matches_against_opponents['winner'].value_counts().reindex([team, opponent]) # print(winners) comparison_df.loc[opponent] = [winners...
  • counts介绍value_counts是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中个数,类似Excel里面的count函数其是pandas下面的顶层函数,也可以作用在Series、DataFrame下pd.value_counts...
  • value_counts() 函数介绍2. 统计属性的个数 1. value_counts() 函数介绍 返回DataFrame数据中其中一列数据取值的个数 比如: print(column_data.value_counts(), "类型: ", type(column_data.value_counts()).__...
  • 问题描述:df表是学生的刷卡记录数据,df1表是学生的各个课程的绩点数据,现在要计算每个学生的刷卡频数以及其对应的平均绩点...value_counts是对计算频数的函数需要注意,value_counts生成的结果索引是sfrzh,值是...
  • Pandas 库为此提供了许多有用的函数value_counts 就是其中之一。此函数返回 pandas 数据框中各个项的数量。但在使用 value-counts 函数的大多数时候用到的是默认参数。因此,在这篇短文中,介绍了如何通过自定义...
  • 在我们使用pandas进行数据分析时,时常需要对数据进行排序、计量,以获取...如何使用Python对数据进行排序(入门篇)​zhuanlan.zhihu.com今天再介绍一下如何在python里使用value_counts( )和counts( )进行计数。...
  • 1. Series 情况下:pandas 的 value_counts() 函数可以对Series里面的每个值进行计数并且排序。import pandas as pddf = pd.DataFrame({'区域' : ['西安', '太原', '西安', '太原', '郑州', '太原'],'10月份销售' : ...
  • pandas 统计数据频率函数value_counts

    万次阅读 2018-07-19 15:11:33
    value_counts默认参数如下: value_counts(values, sort=True, ascending=False, normalize=False, bins=None, dropna=True) ### Series类型 import pandas as pd data=pd.Series(['python','java','python','...
  • 在我们使用pandas进行数据分析时,时常需要对数据进行排序、计量,以获取...如何使用Python对数据进行排序(入门篇)​zhuanlan.zhihu.com今天再介绍一下如何在python里使用value_counts( )和counts( )进行计数。...
  • 在数据分析时,当我们需要统计一个数据集中的元素的出现次数时,对于pandas中的Series对象,直接有value_counts函数,会直接返回一个以元素为索引,出现次数为值的Series,如下图所示。 问题在于,如果数据集较...
  • 计数操作1.pandas.Series.value_countsSeries.value_counts(normalize=False,sort=True,ascending=False, bins=None, dropna=True)作用:返回一个包含值和该值出现次数的Series对象,次序按照出现的频率由高到低排序....
  • 有时候,运算结果中间不完全显示,有人称为“截断数据”。我们把数据输出为csv,...shu = df["RA_C"].value_counts() print(shu) shu.to_csv("shu.csv",mode='a') .value_counts()统计多列数据中重复出现的值 ...
  • count()、value_counts()与size()函数

    千次阅读 2019-07-25 22:03:13
    1、python中的count()函数 统计某个元素出现的次数 如:统计string中某字符的次数 str.count(sub,start=0,end=len(string)-1) Args Annotations sub 搜索的子字符串 start 字符串开始搜索的索引...
  • 在pandas库中实现Excel的数据透视表效果通常用的是df['a'].value_counts()这个函数,表示统计数据框(DataFrame) df的列a各个元素的出现次数;例如对于一个数据表如pd.DataFrame({'a':['A','A','B','C','C','C'],'b':...
  • 在pandas库中实现Excel的数据透视表效果通常用的是df['a'].value_counts()这个函数,表示统计数据框(DataFrame) df的列a各个元素的出现次数;例如对于一个数据表如pd.DataFrame({'a':['A','A','B','C','C','C'],'b':...
  • pandas value_couts遇到的问题

    千次阅读 2017-06-23 01:04:00
    python 使用pandas的value_counts函数时,出现错误 Traceback (most recent call last):  File "/Users/lumingshu/PycharmProjects/shunfeng/splitFile.py", line 34, in  print data2['预测分级A'].value_...
  • 在pandas库中实现Excel的数据透视表效果通常用的是df['a'].value_counts()这个函数,表示统计数据框(DataFrame) df的列a各个元素的出现次数;例如对于一个数据表如pd.DataFrame({'a':['A','A','B','C','C','C'],'b':...
  • 在pandas库中实现Excel的数据透视表效果通常用的是df['a'].value_counts()这个函数,表示统计数据框(DataFrame) df的列a各个元素的出现次数;例如对于一个数据表如pd.DataFrame({'a':['A','A','B','C','C','C'],'b':...

空空如也

空空如也

1 2 3 4
收藏数 75
精华内容 30
热门标签
关键字:

pythonvalue_counts函数

python 订阅