精华内容
下载资源
问答
  • I have a really large excel file and i need to delete about 20,000 rows, contingent on meeting a simple condition and excel won't let me delete such a complex range when using a filter. The condition ...

    I have a really large excel file and i need to delete about 20,000 rows, contingent on meeting a simple condition and excel won't let me delete such a complex range when using a filter. The condition is:

    If the first column contains the value, X, then I need to be able to delete the entire row.

    I'm trying to automate this using python and xlwt, but am not quite sure where to start. Seeking some code snippits to get me started...

    Grateful for any help that's out there!

    解决方案

    Don't delete. Just copy what you need.

    read the original file

    open a new file

    iterate over rows of the original file (if the first column of the row does not contain the value X, add this row to the new file)

    close both files

    rename the new file into the original file

    展开全文
  • 使用python删除excel表格重复。# 导入pandas包并重命名为pdimport pandas as pd# 读取Excel中Sheet1中的数据data = pd.DataFrame(pd.read_excel('test.xls', 'Sheet1'))# 查看读取数据内容print(data)# 查看是否有...

    使用python删除excel表格重复行。

    # 导入pandas包并重命名为pd

    import pandas as pd

    # 读取Excel中Sheet1中的数据

    data = pd.DataFrame(pd.read_excel('test.xls', 'Sheet1'))

    # 查看读取数据内容

    print(data)

    # 查看是否有重复行

    re_row = data.duplicated()

    print(re_row)

    # 查看去除重复行的数据

    no_re_row = data.drop_duplicates()

    print(no_re_row)

    # 查看基于[物品]列去除重复行的数据

    #wp = data.drop_duplicates(['物品'])

    #print(wp)

    # 将去除重复行的数据输出到excel表中

    no_re_row.to_excel("test2.xls")

    补充知识:Python数据预处理(删除重复值和空值)

    pandas几个函数的使用,大数据的预处理(删除重复值和空值),人工删除很麻烦

    Python恰好能够解决

    注释很详细在这不一一解释了

    ######################################

    ##### 读写excel(xls\xlsx)文件

    import pandas as pd

    import numpy as np

    df_excel = pd.read_excel('data3.xlsx')

    print('数据量行*列',df_excel.shape)

    # # df_excel.to_excel('df_excel.xlsx',header=None)#生成文件保存,无表头

    print('数据集中存在重复观测的数量:\n',np.sum(df_excel.duplicated())) #F为不存在,T为存在,用sum显示重复的数量

    print('删除行重复后的数据\n',df_excel.drop_duplicates(subset=None,keep='first',inplace=None))#excel文件中设定第一和第二行为重复行,结果删除了第二行保留第一行

    ###df_excel.drop_duplicates(subset=['A','B'],keep='first',inplace=True)

    #### 代码中subset对应的值是列名,表示只考虑这两列,将这两列对应值相同的行进行去重。默认值为subset=None表示考虑所有列。

    #####keep='first'表示保留第一次出现的重复行,是默认值。keep另外两个取值为"last"和False,分别表示保留最后一次出现的重复行和去除所有重复行。

    #####inplace=True表示直接在原来的DataFrame上删除重复项,而默认值False表示生成一个副本

    print('数据集列中是否存在缺失值:\n',df_excel.isnull().any()) #F为不存在,T为存在

    print('每一行的缺失值个数:',df_excel.isnull().sum(axis=1))

    print('每一列的缺失值个数:',df_excel.isnull().sum(axis=0))

    ####### df.isnull().sum(axis=0)每一列的缺失值个数

    #####df.isnull().any()则会判断哪些”列”存在缺失值

    df=df_excel.dropna()

    print(df_excel.dropna(thresh=5))

    # #axis=0: 删除包含缺失值(NaN)的行

    # #axis=1: 删除包含缺失值(NaN)的列

    # # how=‘any' :要有缺失值(NaN)出现删除

    # # how=‘all': 所有的值都缺失(NaN)才删除

    # 还有一个thresh参数

    # thresh=n,保留至少有 n 个非 NaN 数的行

    ######drop用法

    print(df_excel.drop(['edu'],axis=1))#按照列删除edu这一列

    print(df_excel.drop([0],axis=0))#按照行删除0这一行

    以上这篇python 删除excel表格重复行,数据预处理操作就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

    展开全文
  • python 删除excel

    万次阅读 热门讨论 2019-08-26 15:53:53
    pandas 删除excel列 from openpyxl import * filename = r’C:\Users\Desktop\a.xlsx’ wb = load_workbook(filename) ws = wb.active ws.delete_cols(13) #删除 13 列数据 wb.save(filename) 读取excel部分...

    pandas 删除excel某一列

    from openpyxl import *
    
    filename = r’C:\Users\Desktop\a.xlsx’
    wb = load_workbook(filename)
    ws = wb.active
    ws.delete_cols(13) #删除第 13 列数据
    ws.delete_rows(3) #删除第 3行数据
    wb.save(filename)
    

    读取excel部分数据并分列

    import pandas as pd
    
    #读取excel部分数据,按照规则分列其中一部分数据
    def date_divide():
        af = pd.read_excel(book,ignore_index=True,header=0)#读取所有内容
        df = pd.read_excel(book,usecols=[8,8],ignore_index=True,header=0)#读取部分内容
        df['机构'] = df['所在机构'].str.split('-').str[1]
        df['机构二'] = df['所在机构'].str.split('-').str[2]
        df['分组'] = df['所在机构'].str.split('-').str[3]
        df['组别'] = df['所在机构'].str.split('-').str[4]
        df['所在机构'] = df['所在机构'].str.split('-').str[0]
    
    展开全文
  • 留空另外一种是,您想删除后,后面数据动态填充前面的数据针对第二种,有一个不是太高效的办法,就是:利用column读取后是list这个特点,删除list中的元素,然后再把list覆盖写入原来的excel表中同样地,针对第一种...

    Excel删除有两种情况,

    一种是,您想删除后,留空

    另外一种是,您想删除后,后面数据动态填充前面的数据

    针对第二种,有一个不是太高效的办法,就是:

    利用column读取后是list这个特点,删除list中的元素,然后再把list覆盖写入原来的excel表中

    同样地,针对第一种,您可以在list中自己留空两个元素即可。

    下面是针对第二种的代码

    def delete_to_excel(name):#name是您自己要删除的单元格的内容

    file='XXXXXXXXXXXXX'#您自己的excel所在路径

    data = xlrd.open_workbook(file)

    table = data.sheets()[0]

    lists=table.col_values(0)#获取表格中的一列,得到的是列表

    if name in lists:

    lists.remove(name)#删除list中的一个元素

    work_book = xlwt.Workbook()

    sheet1 = work_book.add_sheet('Sheet1') # 添加表单 add_sheet(表单名称)

    for i,element in enumerate(lists):#往Sheet1中写入“删除一个元素”后的一列

    sheet1.write(i, 0,element) # 第index行,第0列,写入lists元素

    work_book.save(path) # 覆盖原来的excel文件,即完成删除操作。

    代码不保证健壮性,例如需要删除Excel中不存在的元素,您可以自己添加

    展开全文
  • 前言学习Python的过程中,我们会遇到Excel的各种问题。下面这篇文章主要给大家介绍了关于pythonexcel进行数据剔除操作的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧。Python解析...
  • python3.7 openpyxl 删除指定列或者一行# encoding:utf-8import pandas as pdimport openpyxlxl = pd.read_excel(r"E:\55\CRM经营分析表-10001741-1570416265044.xls")xl.to_excel(r"E:\55\crms.xlsx")wk = ...
  • 原文地址:https://jeffsui.github.io/2020/01/02/python-standard-library-csv/文档路径官方文档:https://docs.python.org/zh-cn/3.8/library/csv.htmlCSV 文件格式文件扩展名为.csv,通用的电子表格文件格式,...
  • #使用python操作excel文件时,需要导入三方库openpyxl,可使用命令python -m pip install openpyxl进行安装import openpyxl#导入openpyxl库from openpyxl import Workbook#导入Workbook#注意:对excel文件进行操作...
  • 常见的数据文件类型如下:txtcsvexcel(xls\xlsx)在线网页数据pdf\word其他数据软件格式1 txt文件更多参考:https://docs.python.org/3/tutorial/inputoutput.html#reading-and-writing-files文件读取#文件input输出...
  • 留空另外一种是,您想删除后,后面数据动态填充前面的数据针对第二种,有一个不是太高效的办法,就是:利用column读取后是list这个特点,删除list中的元素,然后再把list覆盖写入原来的excel表中同样地,针对第一种...
  • # 将文件读取出来放个列表里面 pwd = r'C:/Users/31373/Desktop/data' # 获取文件目录 # 新建列表,存放文件名 file_list = [] # 新建列表存放每个文件数据(依次读取多个相同结构的Excel文件并创建...
  • 以源代码从网站 KEGG-API获取了所需要的文本,其格式如下:[字符串1]:1b'>hsa:10056 K01890 phenylalanyl-tRNA synthetase beta chain [EC:6.1.1.20] | (RefSeq) FARSB, FARSLB, FRSB, HSPC173, NEDBLLA, PheHB, ...
  • 存在则导入:wb = Workbook() #表不存在,创建wb = load_workbook('process_free_result.xlsx')#表存在,导入#创建和使用sheet#ws1 = wb.create_sheet("free_test") # 默认在最后新建sheet#ws2 = wb.cr...
  • 学生表,第一列,id;第二列,名字;第三列,分数。第二页,学生id是20-40,分数都是80分。我们需要把第二页的学生,粘贴到第一页里。从而形成一个完整的长表。可以在尾追加一个41号的学生,考70分。我们还可以在...
  • import openpyxl #导入库 wb = openpyxl.load_workbook(filename=“D:\迅雷下载\行列测试1.xlsx...正序的是话就是 先删除 1 水果 2元 这一行 删除过后 2 蔬菜 4元 这一行会变成 1 蔬菜 4元 for 循环就直接跳过了1 蔬菜
  • 如何使用pythonexcel一行确定,列不确定)持续追加数据(不覆盖元数据)
  • python 不忽略首行python 处理 csv 文件时,pandas.read_csv(“data.csv”) 默认会将第一行作为标题... 但我看书的时候,前面二章看的实在头晕,所以,我们还是通过读取文件来开始我们的python数据分析吧。 读取csv...
  • 第一章:整行插入与删除Excel 的插入实例演示 插入演示采用正序遍历操作,直接使用 xlwings 提供的 sheet.api.Rows("行数").Insert() 方法就能实现整行插入处理。 需要注意的是,如果是前插入,要避免再次...
  • Python操作Excel删除一个Sheet

    千次阅读 2019-03-08 17:30:00
    在使用Python进行数据分析处理,操作Excel,有时需要删除某个Excel里的某个sheet,这里记录个我测试成功的个办法 软件环境: 1、OS:Win 10 64位 2.Python 3.7 3、使用openpyxl这个库 4、在当前文件夹下...
  • 我们从网上下载的批量excel文件中,有时候这些文件的第一行是广告信息,我们可以利用python批量删除第一行,并且保存文件。由于程序涉及大量的IO操作,我们可以使用多线程进行操作。 简介 get_all_excel(path): ...
  • Python _Excel操作(删除表中特定

    万次阅读 2019-08-03 11:02:40
    比如名字中包括2D_54019的删除。 在博客上看到篇,思路是先把excel读下来,保存为字典。在字典里把不要的都删去,然后再写回原表。写回原表太麻烦了,图省事就重新生成excel吧。 首先是把表保存在字典里...
  • 在处理电子表格时,可能经常... 使用Python删除Excel工作表中的 使用Python删除Excel工作表中的列 为了在Excel工作表中插入或删除和列,我们将Aspose.Cells for Python via Java它是个功能强大的电子表格处理A
  • 删除excel中列为特定值的所有 # 导入需要用到的相关包 import os import openpyxl #定义删除函数 def delete_row(filename, sheet_name, exc_string, column_num): # 载入工作簿 wb = openpyxl.load_workbook...
  • 前言:在上一次的博客中,我学习到了对Excel文件的读、写、改操作。那么如何实现对Excel文件操作...首先,我们将Excel文件中的内容读到以文件第一列key,文件的每行为value的字典dic中。 def read_excel(self,boo...
  • 任务如下: 创建一个表,里面有10000万测试数据,可以最好写成脚本,一遍不断的修改 思路: ...1、编辑excel第一行:字段名,第二:字段类型;第三:字段长度;第四:not null 2、第二步编...
  • Python读写excel对于python 处理excel 表格,这个日常工作的需求还是不少,于是查查...xlrd:用于读Excel文件xlwt:写Excel包,文件后缀名为.xls,最多只能存65536数据(2的16次方)xlsxwriter:也是写Excel包,文...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 14,958
精华内容 5,983
关键字:

python删除excel第一行

python 订阅