精华内容
下载资源
问答
  • pythonexcel操作大全详解(获取某一列,某一行的值,某一列信息筛选) 在此使用的包是pandas,因为其可以同时处理xls和xlsx两种excel文件。 使用pd读取有多个sheet的excel pandas读取的常用格式pd.read_excel...

    python对excel操作大全详解(获取某一列,某一行的值,对某一列信息筛选)

    在此使用的包是pandas,因为其可以同时处理xls和xlsx两种excel文件。

    使用pd读取有多个sheet的excel

    pandas读取的常用格式pd.read_excel(file, sheet_name),其中sheetname可以使用数字进行替代,从0开始,默认为0

    pandas写入的格式为data.to_excel('filename',sheet_name='A')

    处理的excel信息如下:

    在这里插入图片描述
    在这里插入图片描述
    代码如下:

    import pandas as pd
    path = 'G:\动力系\新建文件夹\什么.xls'
    data = pd.read_excel(path,None)#读取数据,设置None可以生成一个字典,字典中的key值即为sheet名字,此时不用使用DataFram,会报错
    print(data.keys())#查看sheet的名字
    for sh_name in data.keys():
        print('sheet_name的名字是:',sh_name)
        sh_data = pd.DataFrame(pd.read_excel(path,sh_name))#获得每一个sheet中的内容
        print(sh_data)
        
    
    

    结果:
    在这里插入图片描述

    获得某一行,某一列的值

    pd对excel的相关基本操作看下面的链接

    https://blog.csdn.net/weixin_43245453/article/details/90056884

    数据使用的是第一个sheet

    import pandas as pd
    path = 'G:\动力系\新建文件夹\什么.xls'
    data = pd.DataFrame(pd.read_excel(path))#读取数据,设置None可以生成一个字典,字典中的key值即为sheet名字,此时不用使用DataFram,会报错
    print(data.index)#获取行的索引名称
    print(data.columns)#获取列的索引名称
    print(data['姓名'])#获取列名为姓名这一列的内容
    print(data.loc[0])#获取行名为0这一行的内容
    

    结果:
    在这里插入图片描述

    对某一列的信息进行筛选

    筛选使用的是data.loc[列名称 = 提取的信息]

    假如我要提取院系下面的动力,代码如下:

    import pandas as pd
    path = 'G:\动力系\新建文件夹\什么.xls'
    data = pd.DataFrame(pd.read_excel(path))#读取数据,设置None可以生成一个字典,字典中的key值即为sheet名字,此时不用使用DataFram,会报错
    result = data.loc[data['院系'] == '动力']#获取列明为院系,内容为动力的内容
    print(result)
    

    结果如下:
    在这里插入图片描述

    展开全文
  • pandas对每一行进行操作

    千次阅读 2019-04-14 15:52:10
    pandas对一行或者多行进行获取 要获取某一行,你需要用 .loc[] 来按索引(标签名)引用这一行,或者用 .iloc[],按这行在表中的位置(行数)来引用。 同时你可以用 .loc[] 来指定具体的行列范围,并生成一个子数据表...

    pandas对一行或者多行进行获取

    要获取某一行,你需要用 .loc[] 来按索引(标签名)引用这一行,或者用 .iloc[],按这行在表中的位置(行数)来引用。
    同时你可以用 .loc[] 来指定具体的行列范围,并生成一个子数据表,就像在 NumPy里做的一样。比如,提取 ‘c’ 行中 'Name’ 列的内容

    条件筛选

    用中括号 [] 的方式,除了直接指定选中某些列外,还能接收一个条件语句,然后筛选出符合条件的行/列。比如,我们希望在下面这个表格中筛选出 ‘W’>0 的行:
    你可以用逻辑运算符 &(与)和 |(或)来链接多个条件语句,以便一次应用多个筛选条件到当前的 DataFrame 上。举个栗子,你可以用下面的方法筛选出同时满足 ‘W’>0 和’X’>1 的行:

    清洗数据

    删除或填充空值

    在许多情况下,如果你用 Pandas 来读取大量数据,往往会发现原始数据中会存在不完整的地方。在 DataFrame 中缺少数据的位置, Pandas 会自动填入一个空值,比如 NaN或 Null 。因此,我们可以选择用 .dropna() 来丢弃这些自动填充的值,或是用.fillna() 来自动给这些空值填充数据。

    展开全文
  • pandas 根据筛选条件指定excel列进行筛选导入需要筛选的excel和筛选条件要筛选的表格A思路结果 这两天老师要求筛选一下最近几年学院发表的文章,从图书馆那要了份数据量较大的excel,将该excel分成学生文章、老师...

    pandas 根据筛选条件对指定excel列进行筛选

    这两天老师要求筛选一下最近几年学院发表的文章,从图书馆那要了份数据量较大的excel,将该excel分成学生文章、老师文章两份excel,以第一作者为区分,B站学习法稍微补了补python操作excel,看到pandas就顺手用一下了……大佬勿喷,仅仅是稍微学了一下。

    导入需要筛选的excel和筛选条件

    import pandas as pd
    
    df = pd.read_excel('D:/py_project/datafenxi/scut.xls',sheet_name='savedrecs')
    ji_he = {'name1','name2','name3',任意多个name}
    

    这里的ji_he是提供的学院所有老师的姓名,与下面的要筛选的表格A做匹配,标记出A中一作为老师的论文。那剩下的未标记就是学生。

    要筛选的表格A

    excel内容大概长这样(对不起!杰伦力宏紫棋):

    ID Author Full Names 发了什么期刊、日期等等
    0 Zhou, Jielun;Peng, Yuyan;Li, Bai;Xiu, Er xxxx
    1 Wang, Lihong;Zhang, San;Li, Si xxxx
    2 Deng, Ziqi ;Wang, Wu xxxx

    这里一作就是杰伦,力宏,和紫棋。

    思路

    1、由于我们只要第一作者,所以对要筛选的表格A的Author Full Names列进行遍历,按;分割成数组取第0个元素,因为拿到的表格一作的格式千奇百怪,还有-等等莫名字符,所以稍微改了下。
    2、拿到的每行A表格的一作名字,与指定老师名单做匹配,True则记录下该索引ID,并给值teacher创建sheet1
    3、使用merg()将要筛选的表格A与sheet1做匹配整合成一张表。

    while i < len(df):
        a = df.loc[i, 'Author Full Names']  # 取出Author Full Names列的第i行
        a1 = str(a).split(';')[0].replace('-', '')   # 筛选第i行AFN列的内容,按;分割成数组取第0个元素,删除-字符返回a1
        # print('q', a1)
        if a1 in ji_he:
            print('qq', i)    # 获取匹配的索引
            df3.loc[i] = ['teacher']   # 给匹配出来的一作老师标上teacher
            df3.to_excel("D:/py_project/datafenxi/outputscut.xls")   # 输出为新的列表
        i += 1
    

    这里我们可以拿到一个根据A匹配出来的一作是老师身份的索引表sheet1,like this:在这里插入图片描述
    然后用merge()根据ID将两份表拼成一份完整表,就基本完成需求了(分成两份表我直接选择excel做透视了,又懒又菜说的就是我)

    import pandas as pd
    
    sheet1 = pd.read_excel('D:/py_project/datafenxi/scut.xls', sheet_name='savedrecs', index_col='ID')
    sheet2 = pd.read_excel('D:/py_project/datafenxi/scut.xls', sheet_name='Sheet1', index_col='ID')
    
    table = sheet1.merge(sheet2, how='left', on='ID')
    table.to_excel("D:/py_project/datafenxi/outputfinal.xls")
    print(table)
    

    结果

    这部分语法可以参考B站视频 Link,记得把两个sheet放在一个excel里面(其实我看到了其他大佬直接将多个sheet输出在一个excel,但我没时间改了,之后看看。)
    以下是最终结果,表格最右边区分身份:teacher,空为student。
    在这里插入图片描述

    展开全文
  • 使用python数据进行筛选

    千次阅读 2020-05-31 19:51:18
    DataFrame列表: 1使用isin函数筛选 ...2使用loc函数筛选 ...平时使用最多的筛选应该是字符串的模糊筛选, ...筛选包含某字符的 作者:探索数据之美 链接:https://www.jianshu.com/p/805f20a...

    DataFrame列表:

     

    1使用isin函数筛选

     

     

    2使用loc函数筛选

    平时使用最多的筛选应该是字符串的模糊筛选,

    在SQL语句里用的是like,在pandas里我们可以用.str.contains()来实现。

    2.1使用str.contains函数筛选

     

    2.2也可以使用  '|'  来进行多个条件的筛选:

    筛选包含某一字符的行

     

     

     



    作者:探索数据之美
    链接:https://www.jianshu.com/p/805f20ac6e06
    来源:简书
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    展开全文
  • 使用Pandas数据进行筛选和排序

    万次阅读 多人点赞 2016-12-06 16:06:37
    使用Pandas数据进行筛选和排序
  • awk一行码:筛选某列指定值的数据

    千次阅读 2019-08-02 00:33:47
    awk其实不只是个工具、个命令,它其实也是种『编程语言』。场景1:个TAB分割的数据文件,假设名为data.txt,第二列为用户id。从中筛选用户id为123的所...
  • js实现数据进行筛选

    千次阅读 2019-02-28 18:07:47
    js实现数据进行筛选 &lt;html&gt; &lt;head&gt; &lt;script src="https://code.jquery.com/jquery-3.1.1.min.js"&gt;&lt;/script&gt; &lt;/head&gt; &...
  • data = pd.read_excel(‘XX.xls’) datashaixuan = data[data[‘第列列名’].isin(‘特定值’)]
  • DataTable行筛选

    千次阅读 2016-09-02 22:06:38
    筛选DataTable中的数据,使用 Select()方法,筛选结果可以保存到 DataRow[] drArr 也可以另存为个新DataTable 筛选示例: DataRow[] drArr = dt.Select("C1='abc'");//查询(如果Select内无条件,就是查询所有的...
  • 使用Pandas数据进行筛选和排序 本文转载自:蓝鲸的网站分析笔记 原文链接:使用Pandas数据进行筛选和排序 目录: sort() 单列数据进行排序 多列数据进行排序 获取金额最小前10项 获取金额...
  • dataframe 按条件筛选行

    万次阅读 多人点赞 2018-09-18 14:54:39
    使用Pandas数据进行筛选和排序   转自:http://bluewhale.cc/2016-08-06/use-pandas-filter-and-sort.html   筛选和排序是Excel中使用频率最多的功能,通过这个功能可以很方便的数据表中的数据使用指定的...
  • 如何合并单元格进行筛选

    千次阅读 2014-01-14 14:20:14
    如果读过,那你应该明白,如果要筛选,那只需要往合并区域里写入空白的数列就可以了,而且能直接使用“自动筛选”哦,方便、快捷!   这里,我们将讨论不处理合并区域的情况下,使用“高级筛选”的方式。   很多人...
  • awk某列进行筛选

    万次阅读 2016-04-21 15:39:04
    cat revenue_20160420.upd | awk -F"\t" '$4寻找第四列小于负100的行数
  • Gif演示(行插入一行空白行) 图文演示 1. 假设有abc三行, 行之间插入空白行 2. 接着新增一列,添加上序列号 3. 复制粘贴一次序列号(以此类推, 隔N行, 复制N次) 4. 选中C列, 排序和筛选-升序 ...
  • PowerQuery 定位筛选行

    千次阅读 2019-09-04 14:15:09
    定位,返回的是条唯一的记录 Record 筛选,返回不定行数 ,是 Table
  • SELECT id, FROM_UNIXTIME( cen_time, '%Y-%m-%d %H%i' ) minutes, max(cen_time) as date_time,`index`,symbol,cen_time FROM tp_mdapi_stock_trend where symbol='".$game['symbol']."' and date_format(fro...
  • 最近数据进行处理的时候, 需要对一个列表里面的数据进行除杂处理, 只保留部分有特定特征的值, 所以必须用到正则表达式来匹配, 开始使用的是下子就想到的就是通过循环列表内的个元素来进行匹配. ...
  • winodws下cmd结果进行筛选

    万次阅读 2018-03-17 12:03:48
    /B 在一行的开始配对模式。 /E 在一行的结尾配对模式。 /L 按字使用搜索字符串。 /R 将搜索字符串作为一般表达式使用。 /S 在当前目录和所有子目录中搜索匹配文件。 /I 指定搜索不分大小写。 /X ...
  • train_df[train_df['TransactionID']==2987000]
  • pandas基础__之__数据进行筛选和排序
  • Excel自动筛选、单元格选择不同的值显示不同的颜色 今天用Excel做个简单的数据记录,全不懂,百度后才知道的,记录一下。。     数据——>有效性——>设置——>允许:序列   ——>来源:(用","分隔的多个...
  • 怎样在个表里筛选个对象的时间最新的条记录
  • 筛选出报文中BasicPremiun字段的值,进行求和 2.操作 1)两次 ctrl+f,输出筛选条件,点筛选按钮 2)在上面的红色矩形处输入要查找的关键,并勾上”列出包含字符串的“。回车。 3)在新弹出的结果对话框上...
  • Python Pandas 数据筛选方法汇总

    千次阅读 2020-05-19 20:48:24
    Pandas 数据筛选一、准备数据二、通过逻辑规则筛选(大于/小于等)三、删除重复元素三、显示最前面 / 最后面的 n 3.1 显示前面 n 3.2 显示后面 n 四、随机抽取4.1 随机抽取一定比例4.2 随机抽取 n 五、...
  • 当我们频繁的数据库进行操作时,可能造成CPU使用率过高,这时我们可以先将数据表读取到DataTable,然后在必要的时候再更新到数据库中。 以下是DataTable中数据的选择和更新操作。采用DataTable.Select()方法。...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 183,949
精华内容 73,579
关键字:

怎么对每一行进行筛选