精华内容
下载资源
问答
  • #将excel列转化为python中的Series,即一维数组,然后统计Series中各数据的频数 import pandas as pd data = pd.read_excel(r'C:/Users/...count = data['number'].value_counts()#number为表格列名 print(count) ...
    #将excel列转化为python中的Series,即一维数组,然后统计Series中各数据的频数
    import pandas as pd
    data = pd.read_excel(r'C:/Users/Administrator/Desktop/data.xlsx') #读取excel表格数据
    count = data['number'].value_counts()#number为表格列名
    print(count)
    

    在这里插入图片描述

    展开全文
  • value_counts() 方法返回一个序列 Series,该序列包含每个值的数量。也就是说,对于数据框中的任何列,value-counts () 方法会返回该列每个项的计数。 value_counts()是Series拥有的方法,一般在DataFrame中使用时...

    value_counts() 方法返回一个序列 Series,该序列包含每个值的数量。也就是说,对于数据框中的任何列,value-counts () 方法会返回该列每个项的计数。

    value_counts()是Series拥有的方法,一般在DataFrame中使用时,需要指定对哪一列或行使用。value_Coutn只能对应series,不能直接对整个dataframe做操作

    value_counts()在DataFrame的用法:

    import pandas as pd
    import numpy as np
    df1= DataFrame(
                    {"handsome":["timo","anni","timo"],
                    "smart":["mike","anni","mike"]}
                    )
    print(df1)
    '''
      handsome smart
    0     timo  mike
    1     anni  anni
    2     timo  mike
    '''
    
    df1.apply(pd.value_counts)##数据框要借助apply来应用value_counts()
    '''
    	   handsome	smart
    anni	1.0	     1.0
    mike	NaN	     2.0
    timo	2.0	     NaN
    '''

     

    value_counts()  把每個值分別有多少展示一下.在 python 当中 除了 0 其他數字都是 true。所以在这里,括号里可以用任何数字表示。

    churn.flag.value_counts()
    0 5174
    1 1869
    Name: flag, dtype: int64
    
    churn.flag.value_counts(normalize=True)
    0 0.73463
    1 0.26537
    Name: flag, dtype: float64
    
    churn.flag.value_counts(1)
    0 0.73463
    1 0.26537
    Name: flag, dtype: float64

     

    value_counts()是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中有多少重复值。

    
    import pandas as pd
    import numpy as np
    from pandas import DataFrame
    from pandas import Series
    s1=Series(["timo","mike","anni","timo"])
    s1.value_counts()
    '''
    timo    2
    mike    1
    anni    1
    dtype: int64
    '''

     

    pandas 计数函数value_counts()

    value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)
    '''
    normalize : boolean, default False 默认false,如为true,则以百分比的形式显示
    sort : boolean, default True 默认为true,会对结果进行排序
    ascending : boolean, default False 默认降序排序
    bins : integer, 格式(bins=1),意义不是执行计算,而是把它们分成半开放的数据集合,只适用于数字数据
    dropna : boolean, default True 默认删除na值
    '''

    value_counts()并不是未带任何参数,而是所有参数都是默认的


     

    展开全文
  • 来源:DeepHub IMBA 本文约1800字,建议阅读5分钟我们将探讨 Pandas value_counts() 的不同用例。 数据科学家通常将大部分时间花在探索和预处理数据上。...

    来源:DeepHub IMBA
    
    本文约1800字,建议阅读5分钟 我们将探讨 Pandas value_counts() 的不同用例。
    

    数据科学家通常将大部分时间花在探索和预处理数据上。当谈到数据分析和理解数据结构时,Pandas value_counts() 是最受欢迎的函数之一。该函数返回一个包含唯一值计数的系列。生成的Series可以按降序或升序排序,通过参数控制包括或排除NA。

    在本文中,我们将探讨 Pandas value_counts() 的不同用例。您将学习如何使用它来处理以下常见任务。

    1. 默认参数

    2. 按升序对结果进行排序

    3. 按字母顺序排列结果

    4. 结果中包含空值

    5. 以百分比计数显示结果

    6. 将连续数据分入离散区间

    7. 分组并调用 value_counts()

    8. 将结果系列转换为 DataFrame

    9. 应用于DataFrame


    1、默认参数

    Pandas value_counts() 函数返回一个包含唯一值计数的系列。默认情况下,结果系列按降序排列,不包含任何 NA 值。例如,让我们从 Titanic 数据集中获取“Embarked”列的计数。

     >>> df['Embarked'].value_counts()
     
     S   644
     C   168
     Q     77
     Name: Embarked, dtype: int64
    


    2、按升序对结果进行排序

    value_count() 返回的系列默认按降序排列。对于升序结果,我们可以将参数升序设置为 True。

     >>> df['Embarked'].value_counts(ascending=True)
     
     Q     77
     C   168
     S   644
     Name: Embarked, dtype: int64
    


    3、按字母顺序排列结果

    我们已经学习了参数升序以获得按值计数 ASC 或 DESC 排序的结果。在某些情况下,最好按字母顺序显示我们的结果。这可以通过在 value_counts() 之后调用 sort_index(ascending=True) 来完成,例如

     >>> df['Embarked'].value_counts(ascending=True).sort_index(ascending=True)
     
     C   168
     Q     77
     S   644
     Name: Embarked, dtype: int64
    


    4、包括结果中的 NA

    默认情况下,结果中会忽略包含任何 NA 值的行。有一个参数 dropna 来配置它。我们可以将该值设置为 False 以包含 NA 的行数。

     df['Embarked'].value_counts(dropna=False)
     S     644
     C     168
     Q       77
     NaN     2
     Name: Embarked, dtype: int64
    


    5、以百分比计数显示结果

    在进行探索性数据分析时,有时查看唯一值的百分比计数会更有用。这可以通过将参数 normalize 设置为 True 来完成,例如:

     df['Embarked'].value_counts(normalize=True)
     
     S   0.724409
     C   0.188976
     Q   0.086614
     Name: Embarked, dtype: float64
    

    如果我们更喜欢用百分号 (%) 格式化结果,我们可以设置 Pandas 显示选项如下:

     >>> pd.set_option('display.float_format', '{:.2f}%'.format)
     >>> df['Embarked'].value_counts(normalize = True)
     
     S   0.72%
     C   0.19%
     Q   0.09%
     Name: Embarked, dtype: float64
    


    6、将连续数据分入离散区间

    Pandas value_counts() 可用于使用 bin 参数将连续数据分入离散区间。与 Pandas cut() 函数类似,我们可以将整数或列表传递给 bin 参数。

    当整数传递给 bin 时,该函数会将连续值离散化为大小相等的 bin,例如:

     >>> df['Fare'].value_counts(bins=3)
     (-0.513, 170.776]     871
     (170.776, 341.553]     17
     (341.553, 512.329]     3
     Name: Fare, dtype: int64
    

    当列表传递给 bin 时,该函数会将连续值划分为自定义组,例如:

     >>> df['Fare'].value_counts(bins=[-1, 20, 100, 550])
     (-1.001, 20.0]   515
     (20.0, 100.0]     323
     (100.0, 550.0]     53
     Name: Fare, dtype: int64
    


    7、分组并执行 value_counts()

    Pandas groupby() 允许我们将数据分成不同的组来执行计算以进行更好的分析。一个常见的用例是按某个列分组,然后获取另一列的唯一值的计数。例如,让我们按“Embarked”列分组并获取不同“Sex”值的计数。

     >>> df.groupby('Embarked')['Sex'].value_counts()
     
     Embarked Sex   
     C         male       95
              female     73
     Q         male       41
              female     36
     S         male     441
              female   203
     Name: Sex, dtype: int64
    


    8、将结果系列转换为 DataFrame

    Pandas value_counts() 返回一个Series,包括前面带有 MultiIndex 的示例。如果我们希望我们的结果显示为 DataFrame,我们可以在 value_count() 之后调用 to_frame()。

     >>> df.groupby('Embarked')['Sex'].value_counts().to_frame()
    


    9、应用于DataFrame

    到目前为止,我们一直将 value_counts() 应用于 Pandas Series,在 Pandas DataFrame 中有一个等效的方法。Pandas DataFrame.value_counts() 返回一个包含 DataFrame 中唯一行计数的系列。

    让我们看一个例子来更好地理解它:

     df = pd.DataFrame({
        'num_legs': [2, 4, 4, 6],
        'num_wings': [2, 0, 0, 0]},
        index=['falcon', 'dog', 'cat', 'ant']
     )
     >>> df.value_counts()
     
     num_legs num_wings
     4         0           2
     6         0           1
     2         2           1
     dtype: int64
    

    通过在 df 上调用 value_counts(),它返回一个以 num_legs 和 num_wings 作为索引的 MultiIndex 系列。从结果中,我们可以发现有 2 条记录的 num_legs=4 和 num_wing=0。

    同样,我们可以调用 to_frame() 将结果转换为 DataFrame

     >>> df.value_counts().to_frame()
    


    总结

    在本文中,我们探讨了 Pandas value_counts() 的不同用例。我希望这篇文章能帮助你节省学习 Pandas 的时间。我建议您查看 value_counts() API 的文档并了解您可以做的其他事情。

    谢谢阅读。本文代码在这里:

    https://github.com/BindiChen/machine-learning/blob/master/data-analysis/046-pandas-value_counts/pandas-value_counts.ipynb

    编辑:文婧

    校对:林亦霖

    展开全文
  • Python_value_counts()用法

    千次阅读 2019-08-15 18:22:07
    value_counts()是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中有多少重复值。 1、对Series里面的每一列的每个值进行计数并且排序 import pandas as pd df = pd.DataFrame({'区域' : ...

    value_counts()是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中有多少重复值。

    1、对Series里面的每一列的每个值进行计数并且排序
    import pandas as pd
    df = pd.DataFrame({'区域' : ['西安', '太原', '西安', '太原', '郑州', '太原'], 
                      '10月份销售' : ['0.477468', '0.195046', '0.015964', '0.259654', '0.856412', '0.259644'],
                      '9月份销售' : ['0.347705', '0.151220', '0.895599', '0236547', '0.569841', '0.254784']})
    print(df)
    
    print(df['区域'].value_counts())#默认降序
    print(df['区域'].value_counts())#默认降序
    [out]
    太原    3
    西安    2
    郑州    1
    Name: 区域, dtype: int64
    
    
    rint(df['区域'].value_counts(ascending=True))#升序排列
    print(df['区域'].value_counts(ascending=True))#升序排列
    [out]
    
    郑州    1
    西安    2
    太原    3
    Name: 区域, dtype: int64
    

     

    展开全文
  • 业务场景: 招聘数据探索分析 1、读取数据并存为一个名叫job_info的据框。 2、将列命名为:['公司’,’岗位’,...首先用value_counts() 统计岗位这一列每个元素出现的个数,返回结果是Series       &
  • python value_counts()的基础及进阶用法(超详细)

    万次阅读 多人点赞 2019-11-29 21:56:58
    pandas 计数函数value_counts() 完整版函数 value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True) 参数: 1.normalize : boolean, default False 默认false,如为true,则以百分比的...
  • 有时候,运算结果中间不完全显示,有人称为“截断数据”。我们把数据输出为csv,...shu = df["RA_C"].value_counts() print(shu) shu.to_csv("shu.csv",mode='a') .value_counts()统计多列数据中重复出现的值 ...
  • value_counts()的用法

    千次阅读 2019-07-12 17:23:25
    value_counts()是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中有多少重复值。 value_counts()是Series拥有的方法,一般在DataFrame中使用时,需要指定对哪一列或行使用。 import ...
  • new']=data.groupby('col1')['col2'].transform(min) #6.value_counts data['col1'].value_counts() #参数有normalize : 默认false,如为true,则以百分比的形式显示 #sort : 默认为true,会对结果进行排序 #...
  • pandas 计数value_counts()

    千次阅读 2018-08-23 10:12:53
    sort : boolean, default True 是否排序 ascending : boolean, default False 默认降序排序 bins : integer, optional 而不是数值计算,把它们分成半开放的箱子,一个方便的pd.cut,只适用于数字数据 dropna : ...
  • value_counts()

    千次阅读 2018-09-01 15:24:00
    Series.value_counts(normalize=False,sort=True,ascending=False,bins=None,dropna=True) 功能:返回包含唯一值计数的对象。结果对象将按降序排列,以便第一个元素是最常出现的元素。 不包括默认的NA值。 参数:...
  • pandas计数 value_counts()

    千次阅读 2018-09-17 19:43:00
    来自:曹骥 ...pandas 的 value_counts() 函数可以对Series里面的每个值进行计数并且排序。 import pandas as pd df = pd.DataFrame({'区域' : ['西安', '太原', '西安', '太原', '郑州', '太原'], ...
  • 1.Value_counts 在数据统计的时候我们经常会用到value_counts模块; 一般value_counts用于对Series的数据频率分析 例如: df = pd.DataFrame({'区域' : ['西安', '太原', '西安', '太原', '郑州', '太原'], '10...
  • 在数据分析时,当我们需要统计一个数据集中的元素的出现次数时,对于pandas中的Series对象,直接有value_counts函数,会直接返回一个以元素为索引,出现次数为值的Series,如下图所示。 问题在于,如果数据集较...
  • 当谈到数据分析和理解数据结构时,Pandas value_counts() 是最受欢迎的函数之一。 该函数返回一个包含唯一值计数的系列。 生成的Series可以按降序或升序排序,通过参数控制包括或排除NA。 在本文中,我们将探讨 ...
  • pandas 的 value_counts() 函数可以对Series里面的每个值进行计数并且排序。 import pandas as pd df = pd.DataFrame({'区域' : ['西安', '太原', '西安', '太原', '郑州', '太原'], '10月份销售' : ['0.477468', ...
  • count()、value_counts()与size()函数

    千次阅读 2019-07-25 22:03:13
    value_counts() 函数,可以对Series中的 元素进行计数及排序 3、pandas中的 size() ,Series中出现的元素个数(要和numpy中的size()区别开)                  
  • df3 = df['user name'].groupby(df['time']).value_counts() 其他操作 pandas操作1(读csv不要索引/写csv不要索引/删除有空值行/按时间排序) pandas操作2(增加列并赋值/两列时间相减/按时间合并且求和) pandas...
  • 作者 ParulPandey编译自机器学习算法与Python学习,Datawhalevalue_counts()value_counts() 方法返回一个序列 Series,该序列包...
  • value_counts

    2020-10-20 10:15:29
    Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)[source] 返回包含计数的Series。得到的对象将按降序排列,以便第一个元素是最经常出现的元素。默认情况下排除NA值 ...
  • pandas.Series.value_counts

    2017-11-28 09:05:00
    Series.value_counts(normalize=False,sort=True,ascending=False,bins=None,dropna=True) 功能:返回包含唯一值计数的对象。结果对象将按降序排列,以便第一个元素是最常出现的元素。 不包括默认的NA值。 参数:...
  • value_counts()返回的结果是一个Series数组,可以跟别的数组进行运算。 value_count()跟透视表里(pandas或者excel)的计数很相似,都是返回一组唯一值,并进行计数。这样能快速找出重复出现的值。 size()和...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 13,526
精华内容 5,410
关键字:

value_counts排序