精华内容
下载资源
问答
  • 今天小编就为大家分享一篇pandas 选择某几列的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • pandas取某些的方法

    千次阅读 2019-05-20 20:59:40
    df_rawdata.loc[:,list(df_rawdata.columns)[3:]] 第3后的所有

    df_rawdata.loc[:,list(df_rawdata.columns)[3:]]
    取第3列后的所有列

    展开全文
  • pandas取某几列

    万次阅读 2019-06-19 11:31:11
    import pandas as pd data = pd.read_csv() data = data.iloc[:, 0:13] # 按位置某几列
    import pandas as pd
    
    data = pd.read_csv()
    data = data.iloc[:, 0:13]  # 按位置取某几列
    
    展开全文
  • 主要介绍了Pandas实现一数据分隔为两列,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • 主要介绍了pandas对dataFrame中某一个的数据进行处理的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
  • pandas 某一数据的几种形式比较

    万次阅读 2019-12-10 14:22:41
    工作中我们需要对DataFrame进行比较多样化的操作,那么当我们需要取出某一数据时该如何进行...import pandas as pd data1 = pd.DataFrame(...) #任意初始化一个数为3的DataFrame data1.columns=['a', 'b', 'c...

     工作中我们需要对DataFrame进行比较多样化的操作,那么当我们需要取出某一列数据时该如何进行操作呢,下面的代码就是对几种方法的一个总结,希望对各位有所帮助。可以根据自己的需求取出需要的一列或多列。

    import pandas as pd
    data1 = pd.DataFrame(...) #任意初始化一个列数为3的DataFrame
    data1.columns=['a', 'b', 'c']
     
    1.
    data1['b']
    #这里取到第2列(即b列)的值
     
    2.
    data1.b
    #效果同1,取第2列(即b列)
    #这里b为列名称,但必须是连续字符串,不能有空格。如果列名有空格,则只能采取第1种方法
     
    3.
    data1[data1.columns[1:]]
    #这里取data1的第2列到最后一列的所有数据
    
    ps:这种方法容易有误解,注意区分
    data1[5:10]
    #这里取6到11行的所有数据,而不是列数据
    

     

    展开全文
  • 今天小编就为大家分享一篇pandas 根据的值选取所有行的示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • pandas 选取行和的方法

    万次阅读 多人点赞 2019-05-16 09:03:50
    本文介绍在 pandas 中如何读取数据行列的方法。数据由行和组成,在数据库中,一般行被称作记录 (record),被称作字段 (field)。回顾一下我们对记录和字段的获取方式:一般情况下,字段根据名称获取,记录根据...

    本文介绍在 pandas 中如何读取数据行列的方法。数据由组成,在数据库中,行被称作记录 (record),列被称作字段 (field)。回顾一下我们对记录和字段的获取方式:比较常见的,字段根据名称获取,记录根据筛选条件获取。比如获取 student_idstudnent_name 两个字段;记录筛选,比如语文和数学考试分数都大于 90 的所有记录。对于熟悉 SQL 语句的人来说,就是下面的语句:

    select student_id, student_name
    from exam_scores
    where chinese >= 90 and math >= 90
    

    上面的 SQL 语句表示从考试成绩表 (exam_scores) 中,筛选出语文和数学都大于或等于 90 分的所有学生 id 和 name。学习 pandas 数据获取,推荐这种以数据结果为目标导向的方式,而不是被动的按 pandas 提供的 loc, iloc的语法中,一条条顺序学习。

    本篇我们要分析的关于销售数量和金额的一组数据,数据存放在 csv 文件中。示例数据我在 github 上放了一份,方便大家对照练习。

    选择列

    选择单列

    以下两种方法返回 Series 类型:

    import pandas as pd
    df = pd.read_csv('sample-salesv3.csv')
    
    df.name
    # 或者
    df['name']
    

    如果需要返回 DataFrame 格式,使用 list 作为参数。为了方便说明,给出在 jupyter notebook 中显示的界面。

    选择多列

    如果需要选取多列,传给 DataFrame 一个包含列名的 list

    选择行

    基于条件选择

    假设我们要筛选 quantity < 0 的所有记录:

    按多条件筛选的处理方式。假设想筛选 quantity < 0 并且 unit price > 50 的所有记录:

    代码:

    criteria = (df['quantity'] < 0) & (df['unit price'] > 50)
    df[criteria].head()
    

    在 pandas 中,AND 条件的运算符为 & ,OR 条件的运算符为 |。假设想筛选所有 quantity > 30 unit price > 50 的记录:

    代码:

    criteria = (df['quantity'] > 30) | (df['unit price'] > 50)
    df[criteria].head()
    

    基于字符串的记录筛选

    如果筛选条件为基于字符串,可以使用用 Series.str.xxx 方法,主要有 startswith, endswithcontains等。举一个例子,筛选出所有 name 含有 White 的记录:

    代码:

    criteria = df['name'].str.contains('White')
    df[criteria].head()
    

    这里解释一下 pandas 布尔索引 (boolean indexing) 的概念。布尔索引的意思是首先构建一个与 DataFrame 的 index 长度相同的一个 boolean 向量 (boolean vector),这个向量中只包含 True 或者 False,布尔索引是一个 Series。然后 DataFrame 在筛选的时候,基于 DataFrame 的行索引,当布尔索引相同行索引所在行的 value 为 True 时,DataFrame 的这一行就包含在筛选之中,否则就排除在外。

    为了能看得更加清晰,我们把上面的例子用另外一个方法来展示。创建一个新列:is_selected,这一列是一个布尔索引。

    df['is_selected'] = df['name'].str.contains('White')
    

    我们看到,is_selected 由 True 和 False 构成。

    构建了 is_selected 列之后,通过df[df['name'].str.contains('White')] 筛选与下面的语句作用相同:

    df[df['is_selected'] == True]
    

    可以把 df['name'].str.contains('White') 这个布尔索引理解为构建了一个新列,然后基于这一列进行筛选。

    基于 DateTime 类型的记录筛选

    如果列的类型是 DateTime 类型,比如本示例的 date 列。pandas 读取 csv 文件时,date 列是 str 类型,所以我们先将 date 列转换成 datetime 类型,然后基于 pandas 的 Timestamp 类型构建筛选条件。

    # 将 date 列转换成 datetime 类型
    df['date'] = pd.to_datetime(df['date'])
    
    # 筛选条件为日期大于 2014/4/1
    criteria = df['date'] > pd.Timestamp(2014,4,1)
    df[criteria].head()
    

    同时选择行和列

    如果基于本篇所说的模式,同时选择行和列,最简单的方法是组合,比如先基于行构建 DataFrame,然后再基于这个 DataFrame 选取需要的列:

    where = df['name'].str.contains('White')
    cols = ['name', 'quantity', 'unit price', 'ext price']
    df[where][cols].head()
    

    示例数据

    sample sales - github

    参考

    展开全文
  • Python Pandas 指定和指定行值

    千次阅读 2021-03-25 16:44:25
    需要取一个数据表里其中2列和前10行的值: top10=pd_brand[['品牌','ASIN']][0:10]) #取列名称为品牌和ASIN的前10行数据
  • 下面小编就为大家分享一篇pandas 取出表中一数据所有的值并转换为array类型的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • Pandas截取的一部分

    千次阅读 2019-02-19 22:05:00
    以股票代码为例: 型式为:6位数字+"."+交易所代码,如600028.SH 如只需保留前6位: pattern = '(\w+)(?:.SZ|.SH)$' df['股票代码'] = df['股票代码'].str.extract(pattern) 另外一种方式: ...
  • pandas抽取行列数据

    千次阅读 2020-02-12 15:35:12
    行和的几种常用方式: data[ 列名 ]:单列或多,不能用连续方式,也不能用于行。 data.列名:只用于单列,不能用于行。 data[ i:j ]:用起始行下标(i)和终止行下标(j)单行或者连续多行,不能用于...
  • pandas 提取指定数据

    2020-06-21 11:57:27
    ```timeframe.loc[:,['car']] ...我使用loc函数应该就能把这一所有行给提取出来呀,为什么我弄出来就变成一了? 我本身有94。 整个数据是两列,我提取了表头为car的那 ``` car 0 3946 ```
  • 主要介绍了pandas数据处理基础之筛选指定行或者指定的数据的相关资料,需要的朋友可以参考下
  • pandas获取指定的和行

    万次阅读 多人点赞 2018-07-09 21:42:09
    house_info = pd.read_csv('house_info.csv')1:取行的操作:house_info.loc[3:6]类似于python的切片操作2:取列操作:house_info['price'] 这是读取csv文件时默认的第一行索引3:取两列house_info[['price',...
  • 取某一行 取列 同时取行和列 使用 df.loc[(取的行),(取的列)]
  • 36_Pandas获取行数,数和元素总数(大小) 如何获取pandas.DataFrame和pandas.Series的行数,数和总元素(大小)。 pandas.DataFrame 显示行数,数等:df.info() 获取行数:len(df) 获取数:len(df....
  • 点击上方“菜鸟编程大本营”,选择“星标”公众号重磅干货,第一时间送达来源:机器之心Python 是开源的,它很棒...有一个用于数据科学的包绝对是必需的,它就是 pandaspandas 最有趣的地方在于里面隐藏了很多包。...
  • 主要是DataFrame.apply函数的应用,如果设置axis参数为1则每次函数每次会取出DataFrame的一行来做处理,如果axis为1则每次。 如代码所示,判断如果城市名中含有ing字段且年份为2016,则新test值赋为1,否则...
  • 今天小编就为大家分享一篇pandas.loc 选取指定进行操作的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • 今天小编就为大家分享一篇python pandas读取csv后,获取标签的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • Excel总表快速分表:step1: 读取exel数据到DataFramestep2: dataframe中数据进行筛选step3:将筛选完的数据存储到excel中工作中应用实例step1:读取Excel的数据到pandas 的Dataframe方法1:采用pandas,读取sheet1的...
  • import pandas as pd from pandas import Sereis, DataFrame ser = Series(np.arange(3.)) data = DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz')) data['w'] #选择表格中的'w',...
  • import pandas as pd #读取csv文件 df=pd.read_csv('A_2+20+DoW+VC.csv') #求‘ave_time’的平均值 aveTime=df['ave_time'].mean() #把ave_time这的缺失值进进行填充,填充的方法是按这一的平均值进行填充 df2=...
  • 导入时可以为pandas取个别名pd。Step2:调用pandas库的read_excel函数来读取Excel表格内容,使用点表示法。Step3:调用sum函数对整个数据表求和并将结果记录到[总分]。sum函数默认对每一进行求和,通过修改参数...
  • lt = [['zoo',2],['foo',1],['zff',2],['zoo',6],['dff',0]] df = pd.DataFrame(lt, columns=['string'...df[ df['string'].isin( ['zoo','zff'] ) ] # 一数据满足多个值的行 string int 0 zoo 2 2 zff 2 3 zoo 6 df
  • 然后我通过pandas.Dataframe.values把该的值转成了一个numpy的二维数组,差不多长成这个样子,如下: 然后继续处理df.values.flatten()转成以为数组,长成如下样子: 这个时候达到的我的要求了。   ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 23,653
精华内容 9,461
关键字:

pandas取列