精华内容
下载资源
问答
  • 当我们手头有两文件,一个文件很大,有很行,而另一个文件比较小,现在我们需要根据两文件的一个公共,取出大文件中同时出现在两文件中的那些行的所有数据数据解释如下: 文件A: 文件B: ...

    当我们手头有两个文件,一个文件很大,有很多很多行,而另一个文件比较小,现在我们需要根据两个文件的一个公共列,取出大文件中同时出现在两个文件中的那些行的所有数据。

    数据解释如下:

    文件A:

    文件B:

    我想从文件A中取出“汉字井号”分别为“孤东7-27更5186”、“孤东7-23斜更186”、“孤东7-6平1”这几行的资料。代码如下

    # -*- coding: utf-8 -*-
    """
    Created on Wed Nov 29 10:46:31 2017
    
    @author: wq
    """
    
    import pandas as pd
    
    #input.csv是那个大文件,有很多很多行
    df1 = pd.read_csv('A.csv', encoding='gbk')
    
    #input1.csv是那个小文件,其中他们有一行或者若干行存储的特征参数相同
    df2 = pd.read_csv('B.csv', encoding='gbk')
    
    #加encoding=‘gbk’是因为文件中存在中文,不加可能出现乱码
    index = df1[u'汉字井号'].isin(df2['well'])
    
    outfile = df1[index]
    
    outfile.to_csv('outfile.csv', index=False, encoding='gbk')
    效果如下:


    展开全文
  • python对excel操作大全详解(获取某一列,某一行的值,对某一列信息筛选) 在此使用的包是pandas,因为其可以同时处理xls和xlsx两种excel文件。 使用pd读取有多个sheet的excel pandas读取的常用格式pd.read_excel...

    python对excel操作大全详解(获取某一列,某一行的值,对某一列信息筛选)

    在此使用的包是pandas,因为其可以同时处理xls和xlsx两种excel文件。

    使用pd读取有多个sheet的excel

    pandas读取的常用格式pd.read_excel(file, sheet_name),其中sheetname可以使用数字进行替代,从0开始,默认为0

    pandas写入的格式为data.to_excel('filename',sheet_name='A')

    处理的excel信息如下:

    在这里插入图片描述
    在这里插入图片描述
    代码如下:

    import pandas as pd
    path = 'G:\动力系\新建文件夹\什么.xls'
    data = pd.read_excel(path,None)#读取数据,设置None可以生成一个字典,字典中的key值即为sheet名字,此时不用使用DataFram,会报错
    print(data.keys())#查看sheet的名字
    for sh_name in data.keys():
        print('sheet_name的名字是:',sh_name)
        sh_data = pd.DataFrame(pd.read_excel(path,sh_name))#获得每一个sheet中的内容
        print(sh_data)
        
    
    

    结果:
    在这里插入图片描述

    获得某一行,某一列的值

    pd对excel的相关基本操作看下面的链接

    https://blog.csdn.net/weixin_43245453/article/details/90056884

    数据使用的是第一个sheet

    import pandas as pd
    path = 'G:\动力系\新建文件夹\什么.xls'
    data = pd.DataFrame(pd.read_excel(path))#读取数据,设置None可以生成一个字典,字典中的key值即为sheet名字,此时不用使用DataFram,会报错
    print(data.index)#获取行的索引名称
    print(data.columns)#获取列的索引名称
    print(data['姓名'])#获取列名为姓名这一列的内容
    print(data.loc[0])#获取行名为0这一行的内容
    

    结果:
    在这里插入图片描述

    对某一列的信息进行筛选

    筛选使用的是data.loc[列名称 = 提取的信息]

    假如我要提取院系下面的动力,代码如下:

    import pandas as pd
    path = 'G:\动力系\新建文件夹\什么.xls'
    data = pd.DataFrame(pd.read_excel(path))#读取数据,设置None可以生成一个字典,字典中的key值即为sheet名字,此时不用使用DataFram,会报错
    result = data.loc[data['院系'] == '动力']#获取列明为院系,内容为动力的内容
    print(result)
    

    结果如下:
    在这里插入图片描述

    展开全文
  • pandas多个列的组合条件筛选数据

    千次阅读 2020-03-18 15:11:09
    比如,我想筛选出“设计井别”、“投产井别”、“目前井别”三列数据都为11的数据,结果如下: 当然,这里的筛选条件可以根据用户需要自由调整,代码如下: # -*- coding: utf-8 -*- import pandas as pd #input....

    A文件:
    在这里插入图片描述
    比如,我想筛选出“设计井别”、“投产井别”、“目前井别”三列数据都为11的数据,结果如下:
    在这里插入图片描述
    当然,这里的筛选条件可以根据用户需要自由调整,代码如下:

    # -*- coding: utf-8 -*-
    import pandas as pd
     
    #input.csv是那个大文件,有很多很多行
    df1 = pd.read_csv(u'input.csv', encoding='gbk')
     
    #加encoding=‘gbk’是因为文件中存在中文,不加可能出现乱码
     
    #这里的筛选条件可以根据用户需要进行修改
     
    outfile = df1[(df1[u'设计井别']=='11') & (df1[u'投产井别']=='11') &(df1[u'目前井别']=='11')]
     
    outfile.to_csv('outfile.csv', index=False, encoding='gbk')
    

    有时我们也会有相反的一个需求,需要删除“设计井别”、“投产井别”、“目前井别”三列数据都为11的那些行,效果如下:
    在这里插入图片描述
    代码如下:

    #input.csv是那个大文件,有很多很多行
    df1 = pd.read_csv(u'input.csv', encoding='gbk')
    df2 = pd.read_csv(u'outfile.csv', encoding='gbk')
    #加encoding=‘gbk’是因为文件中存在中文,不加可能出现乱码
    index = ~df1[u'汉字井号'].isin(df2[u'汉字井号'])
    df4 = df1[index]
    df4.to_csv('outfile1.csv', index=False, encoding='gbk')
    
    展开全文
  • python筛选excel某一列中相同的数据

    万次阅读 多人点赞 2018-11-13 11:34:57
    python筛选excel某一列中相同的数据 1.需要cmd下载 pip install pandas 的模板 2.注意文件的路径问题不要出错 3.还有文件的编码格式 ------encoding = 'gbk' import pandas as pd #读取excel文件信息 d...

                                          求赞----求关注

    python筛选excel某一列中相同的数据

    1.需要cmd下载 pip install pandas  的模板

    2.注意文件的路径问题不要出错

    3.还有文件的编码格式 ------encoding = 'gbk'

    import pandas as pd

    #读取excel文件信息

    data = pd.read_csv('1.csv',encoding = 'gbk')

    #筛选表格中需要的列

    data_gender = data[['ID','Price','Actualamount','Merchandise','Time','Place']]

    data_gender_re = data_gender[data_gender.notnull()]   #除去缺失值

      #筛选Place中地点为A 的数据  

    FF = data_gender_re.loc[(data_gender_re['Place'] == 'A')] 
    print(data_gender_re.loc[(data_gender_re['Place'] == 'A')])

    FF.to_csv('C:\\Users\\Administrator\\Desktop\\A.csv',index=False,encoding = 'gbk')       #生成excel文件

    代码如下:

    import pandas as pd
    
    data = pd.read_csv('1.csv',encoding = 'gbk')
    
    data_gender = data[['ID','Price','Actualamount','Merchandise','Time','Place']]
    data_gender_re = data_gender[data_gender.notnull()]
    
    FF = data_gender_re.loc[(data_gender_re['Place'] == 'A')]
    print(data_gender_re.loc[(data_gender_re['Place'] == 'A')])
    
    FF.to_csv('C:\\Users\\Administrator\\Desktop\\A.csv',index=False,encoding = 'gbk')
    
    
    

    需要处理文件如下:

    得到的结果如下:

     

      #筛选Place中地点为A 的数据

    展开全文
  • 请教下各位高手,SQL中group by 功能用C++如何实现啊? 小弟想做的是多列数据筛选的功能,比如一个结构体中包含成员A,B,C,从一个结构体数组中筛选出A,B,C不完全相同的数据,非常谢谢!
  • 、join()函数的用法 语法: ‘sep’.join(seq) 参数说明 sep:分隔符。可以为空 seq:要连接的元素序列、字符串、元组、字典 上面的语法即:以sep作为分隔符,将...二、结合series.str.contains()使用筛选数据 ...
  • 目标1:从d0数据框中,筛选出rs中包含 '2_161686082’中值的数据框 ** d1 = d0.loc[d0['rs']=='2_161686082'] d1 ** 目标2:从d0数据框中,筛选出rs中包含 ** l1=['2_161686082','ALGA0072703','ASGA0022902'...
  • 今天讲一下利用power query将”数据”文件目录下的多个文件夹里的txt里的数据的最后一列合并到一个excel数据文件里。如下图:数据目录下有2014-2017等4个年份文件夹,每个文件夹下都有每天产生的数据文件,而且每年的...
  • 业务场景: 招聘数据探索分析 1、读取数据并存为一个名叫job_info的据框。 2、将命名为:['公司’,’岗位’,’工作地点’,’工资’,’发布日期]。 3、哪个岗位招聘需求最多? 4、取出9月3日发布的招聘信息。 5...
  • 在工作和学习中,我们经常要和Excl打交道,对数据进行一些简单和复杂的处理,可以说Office三件套是业界公认的“神器”级别...提取Excl两列(列)数据相同的数据等等这样要对Excl数据进行一列或者列的数据处理(提取...
  • EXCEL中筛选一列数据中包含某些数字。返回它前面的序号。(0x040403为要含的数字) =IF(LEN(SUBSTITUTE(B2,"0x040403",...
  • 后来在写关于活动月份环比的时候,因为列值不唯一,需要提供多个值来解决筛选情况,当时使用的是“IN”。 本期呢,白茶决定分享一下,如果我的限定条件,不只是一列,而是很多列,该怎么操作呢? 这是群里小伙伴提...
  • 点击我们需要增加筛选 点击数据–>自动筛选 点击倒三角图标就可以进行内容筛选了,还有内容占比分析功能
  • 场景:集团中心下发本省数据时,并未按地市、业务拆分,现需要按地市、业务拆分并分发到地市。本文利用Python的pandas包实现了以上场景。
  • 最近需要筛选Excel的数据 看到网上有大神做出来的Demo 但是在mac上...Sub 如何将个Excel工作表的数据拆分成多个工作表() Dim Arr, Rng As Range, Sht As Worksheet, Dic As Object Dim k, t, Str As String, i A
  • 比如,我想筛选出“设计井别”、“投产井别”、“目前井别”三列数据都相等的数据,结果如下: 当然,这里的筛选条件可以根据用户需要自由调整,代码如下: # -*- coding: utf-8 -*- """ Created on Wed Nov 29 10:...
  • 首先,将需要拆分的sheet命名为“明细”,接下来运行此代码,按提示操作即可。 在这里插入代码片 Sub chaifen() '定义变量类型 Dim sht, sh1, sh2 As Worksheet ...'程序开始是要求输入按哪一列拆分数...
  • 今天在操作数据库时,有一个新的统计需求 需求:统计2019年月份列名为A的调用量,其中DEPT_NM和COMPANY_NAME一致的,认为是同一数据,需要去重  表名称 : TEST , 表结构如下   ID COMPANY_NAME DEPT_...
  • 问题介绍 python中删除表格中常用的...下面给大家介绍另外一方法,支持删除和筛选数据; data.name.isin([筛选元素]); data:原始数据集 name:列名称 筛选元素:该列满足的条件值; 操作示例 1、 删除某一列满足...
  • awk行码:筛选指定值的数据

    千次阅读 2019-08-02 00:33:47
    awk其实不只是一个工具、一个命令,它其实也是种『编程语言』。场景1:一个TAB分割的数据文件,假设名为data.txt,第二列为用户id。从中筛选用户id为123的所...
  • 在工作中,有时会需要根据一列从一堆数据筛选中该列中成员的其他信息。百度起来,关键词都不知道该怎么打,搜到了也只是讲解一些用法,实际操作起来,如果没有一定的耐心,很那跟着一步一步做下去。我也是受身边...
  • java swing的JTable中的某一列加入下拉复选框, ...点击单元格,出现下拉框,选择的多个数据显示在单元格? 效果图如下所示: ![图片说明](https://img-ask.csdn.net/upload/201901/25/1548384695_331151.png)
  • Pandas的DataFrame在筛选列数据的时候,有一个非常方便的用法。假设现在有这样一个DataFrame:import pandas as pd data = [ {...
  • Excel 2016从一列筛选全是字母或者中文的单元格1. 需求2. 使用公式2.1IF()函数2.2 LEN()和LENB()函数3. 解决需求4. 知识扩展 1. 需求 如下图所示,需要筛选出所有中文研究者,剔除包含英文字母的研究者。 2. 使用...
  • pandas筛选符合多个条件的方法

    万次阅读 多人点赞 2019-08-30 19:16:52
    时候,我都会面临着筛选出一张表中符合多列条件的数据,使用pandas可以快速的实现目标,在此记录下自己最常用的筛选手段
  • Py之pandas:利用isin函数对dataframe格式数据按照多个字段的条件筛选 目录 利用isin函数对dataframe格式数据按照多个字段的条件筛选 代码设计 输出结果 利用isin函数对dataframe格式数据按照...
  • 2、需求:想在满足条件的数据筛选出其中fversion值最大对应的完整记录 3、实现:  3.1、在指定字段上使用Max(),产生问题-造成查询的数据错乱,返回的信息只有fversion值满足条件,fid并不是MAX...
  • pandas 的 DataFrame 选择 筛选列

    千次阅读 2020-08-12 22:31:03
    选择多列, 返回的是一个 DataFrame df1 = df[['1', '2', '3']] df2 = df.reindex(columns=['1', '2', '3']) 我的B站视频教程 【Python】【Pandas】 1.0 数据分析 & Excel 办公自动化 超详细...
  • sql按一列筛选,不显示重复行

    千次阅读 2007-03-18 11:38:00
    例如:一个学生选课表: 姓名 课程 选课日期 联系电话.......... 小王 数学 ***** ******** 小王 英语 ****** ******** 小张 
  • pandas 筛选指定行或者数据

    万次阅读 2018-11-22 18:51:00
    pandas主要的两个数据结构是:series(相当于一行或一列数据结构和DataFrame(相当于多行列的一个表格数据机构)。    原文:https://www.cnblogs.com/gangandimami/p/8983323.html     DataFrame.drop(labels...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 118,906
精华内容 47,562
关键字:

一列筛选多个数据