精华内容
下载资源
问答
  • 解决pandas读取xlsx文件报错“XLRDError: Excel xlsx file; not supported”
    2021-09-07 14:01:32

    代码:

    df=pd.read_excel("xxx")
    

    报错:

    XLRDError: Excel xlsx file; not supported
    

    原因:
    xldr==2.0.1版本不支持xlsx的读写,仅支持xls。详见此博客

    解决办法:
    (1)安装老版本xlrd

    pip uninstall xlrd
    pip install xlrd==1.2.0
    

    (2)pd.read_excel指定engine为openpyxl

    df=pd.read_excel("xxx",engine="openpyxl")
    
    更多相关内容
  • pandas读取xlsx文件

    2022-04-18 20:17:55
    pandas读取xlsx文件

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


    Python 读取xlsx文件

    第一次保错

    使用pandas的read_excel()报错

    df = pd.read_excel()
    
    ImportError: Missing optional dependency 'xlrd'. Install xlrd >= 1.0.0 for Excel support Use pip or conda to install xlrd
    

    然后安装xlrd,又出现了新的问题

    第二次报错

    下面展示一些 内联代码片

    XLRDError: Excel xlsx file; not supported
    

    解决方法:使用openpyxl代替xlrd
    安装openpyxl,然后问题解决
    注意,需要指定engine=‘openpyxl’

    pd.read_excel('filename.xlsx',engine='openpyxl')
    
    展开全文
  • Python使用pandas读取xlsx文件,python

    千次阅读 2020-11-25 16:10:24
    python使用pandasxlsx文件读取前n行数据读取指定数据(指定行指定列)获取文件行号和列标题将数据转换为字典形式import pandas as pd#1.读取前n行所有数据df1=pd.read_excel('d1.xlsx')#读取xlsx中的第一个sheet...

    python使用pandas读xlsx文件

    读取前n行数据

    读取指定数据(指定行指定列)

    获取文件行号和列标题

    将数据转换为字典形式

    import pandas as pd

    #1.读取前n行所有数据

    df1=pd.read_excel('d1.xlsx')#读取xlsx中的第一个sheet

    data1=df1.head(10)#读取前10行所有数据

    data2=df1.values#list【】 相当于一个矩阵,以行为单位

    #data2=df.values() 报错:TypeError: 'numpy.ndarray' object is not callable

    print("获取到所有的值:\n{0}".format(data1))#格式化输出

    print("获取到所有的值:\n{0}".format(data2))

    #2.读取特定行特定列

    data3=df1.iloc[0].values#读取第一行所有数据

    data4=df1.iloc[1,1]#读取指定行列位置数据:读取(1,1)位置的数据

    data5=df1.iloc[[1,2]].values#读取指定多行:读取第一行和第二行所有数据

    data6=df1.iloc[:,[0]].values#读取指定列的所有行数据:读取第一列所有数据

    print("数据:\n{0}".format(data3))

    print("数据:\n{0}".format(data4))

    print("数据:\n{0}".format(data5))

    print("数据:\n{0}".format(data6))

    #3.获取xlsx文件行号、列号

    print("输出行号列表{}".format(df1.index.values))#获取所有行的编号:0、1、2、3、4

    print("输出列标题{}".format(df1.columns.values))#也就是每列的第一个元素

    #4.将xlsx数据转换为字典

    data=[]

    for i in df1.index.values:#获取行号的索引,并对其遍历

    #根据i来获取每一行指定的数据,并用to_dict转成字典

    row_data=df1.loc[i,['id','name','class','data','score',]].to_dict()

    data.append(row_data)

    print("最终获取到的数据是:{0}".format(data))

    #iloc和loc的区别:iloc根据行号来索引,loc根据index来索引。

    #所以1,2,3应该用iloc,4应该有loc

    数据:d1.xlsx

    id

    name

    class

    data

    score

    201901

    A

    1

    Jan-20

    1.3

    201902

    B

    2

    Mar-20

    3.4

    201903

    C

    3

    May-20

    3.4

    201904

    D

    1

    Jan-20

    3.4

    201905

    E

    1

    Feb-20

    5.6

    201906

    F

    1

    Mar-20

    4.6

    201907

    G

    1

    Feb-19

    7.8

    201908

    H

    2

    Apr-30

    5.6

    201909

    I

    3

    Jan-42

    5.6

    201910

    G

    4

    Mar-30

    4.5

    201911

    K

    5

    Apr-20

    3.4

    201912

    L

    6

    Apr-20

    2.3

    201913

    M

    4

    Mar-20

    2.4

    运行结果展示

    watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1JpdGFBbmRXYWtha2E=,size_16,color_FFFFFF,t_70

    watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1JpdGFBbmRXYWtha2E=,size_16,color_FFFFFF,t_70

    watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1JpdGFBbmRXYWtha2E=,size_16,color_FFFFFF,t_70

    展开全文
  • python使用pandasxlsx文件

    万次阅读 多人点赞 2020-09-02 17:21:28
    python使用pandasxlsx文件 读取前n行数据 读取指定数据(指定行指定列) 获取文件行号和列标题 将数据转换为字典形式 import pandas as pd #1.读取前n行所有数据 df1=pd.read_excel('d1.xlsx...

    python使用pandas读xlsx文件

    1. 读取前n行数据

    2. 读取指定数据(指定行指定列)

    3. 获取文件行号和列标题

    4. 将数据转换为字典形式

    import pandas as pd
    #1.读取前n行所有数据
    df1=pd.read_excel('d1.xlsx')#读取xlsx中的第一个sheet
    data1=df1.head(10)#读取前10行所有数据
    data2=df1.values#list【】  相当于一个矩阵,以行为单位
    #data2=df.values()   报错:TypeError: 'numpy.ndarray' object is not callable
    print("获取到所有的值:\n{0}".format(data1))#格式化输出
    print("获取到所有的值:\n{0}".format(data2))
    
    #2.读取特定行特定列
    data3=df1.iloc[0].values#读取第一行所有数据
    data4=df1.iloc[1,1]#读取指定行列位置数据:读取(1,1)位置的数据
    data5=df1.iloc[[1,2]].values#读取指定多行:读取第一行和第二行所有数据
    data6=df1.iloc[:,[0]].values#读取指定列的所有行数据:读取第一列所有数据
    print("数据:\n{0}".format(data3))
    print("数据:\n{0}".format(data4))
    print("数据:\n{0}".format(data5))
    print("数据:\n{0}".format(data6))
    
    #3.获取xlsx文件行号、列号
    print("输出行号列表{}".format(df1.index.values))#获取所有行的编号:0、1、2、3、4
    print("输出列标题{}".format(df1.columns.values))#也就是每列的第一个元素
    
    #4.将xlsx数据转换为字典
    data=[]
    for i in df1.index.values:#获取行号的索引,并对其遍历
        #根据i来获取每一行指定的数据,并用to_dict转成字典
        row_data=df1.loc[i,['id','name','class','data','score',]].to_dict()
        data.append(row_data)
    print("最终获取到的数据是:{0}".format(data))
    
    #iloc和loc的区别:iloc根据行号来索引,loc根据index来索引。
    #所以1,2,3应该用iloc,4应该有loc
    

    数据:d1.xlsx

    idnameclassdatascore
    201901A1Jan-201.3
    201902B2Mar-203.4
    201903C3May-203.4
    201904D1Jan-203.4
    201905E1Feb-205.6
    201906F1Mar-204.6
    201907G1Feb-197.8
    201908H2Apr-305.6
    201909I3Jan-425.6
    201910G4Mar-304.5
    201911K5Apr-203.4
    201912L6Apr-202.3
    201913M4Mar-202.4

    运行结果展示

     

     

    展开全文
  • 使用pandas读取xlsx

    千次阅读 2021-07-02 11:19:14
    一、使用pandas读取xlsx  引用pandas库 import pandas as pd pd.read_excel(path, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False,dtype=None, engine=None, converters...
  • ##############读文件示例################################### excelFile = "C:\\Users\\win10\\Desktop\\test.xlsx" df = pd.read_excel(excelFile,sheet_name= "Sheet1") nrows = df.shape[0] ncols = df.columns...
  • 使用pandasxlsx文件的基本操作

    万次阅读 多人点赞 2019-03-28 15:06:09
    起因:因最近实习期间,要求查看.xlsx文件中数据是否有误,由于数据较多,想用python去执行,结果发现网上对xlsx文件操作或是太旧,大多难以应用,所以自己整理了一下,以备自己后用。 模拟一个测试数据集data_test...
  • <p style="text-align:center"><img alt="" src=...有没有大佬能帮忙解决上图问题 用pandas读取文件的时候显示 invalid synax 救救孩子 已经尝试了很多方法都解决不了</p>
  • import pandas as pd df = pd.read_excel(r'学习\1890303.xlsx') # 行索引 print(df.index.values) # 列索引 print(df.columns.values) # 第0行 print(df.loc[0].values) # 第一行和第二行 print(df.loc[[1, 2]]....
  • refer to:dframe = pd.read_excel(“file_name.xlsx”)dframe = pd.read_excel(“file_name.xlsx”, sheetname=”Sheet_name”)dframe = pd.read_excel(“file_name.xlsx”, sheetname=number)原文如下:////////////...
  • python使用pandas读取xlsx数据并存入txt

    千次阅读 2022-03-11 21:25:04
    使用pandas读取xlsx数据并存入txt文件 转换一个文件: import pandas as pd df = pd.read_excel('../data/x/ant_1.5.xlsx',usecols="C,X") # 使用pandas模块读取数据 df['Class']=df['Class'].str.replace('.','/',...
  • pandas读取xlsx文件,编码问题

    千次阅读 2020-08-13 21:04:28
    csv是文本文件,用记事本就能打开, xlsx 是二进制的文件只有用excel才能打开,如果用记事本打开是乱码 首先,我的pandas版本为1.1.0 然后,使用pd.read_excel()读取,详细的方法参数可以看这篇博客,我就列举下其中...
  • 今天在用低版本的pandas==0.24.2时,读取xlsx文件报错。 pd.read_excel(xlsx_file_IO_string) # xlsx IO流 Must explicitly set engine if not passing in buffer or path for io. 查看了源代码,如果未指定...
  • 今天想把数据处理用pandas来处理。计划很完美。然后就在第一步read-excle中的时候就报错了。...所以pandas.read_excel(‘xxx.xlsx’)会报错。 安装旧版xlrd,在cmd中运行: pip uninstall xlrd pip ...
  • python使用pandas和xlsxwriter读写xlsx文件 已有xlsx文件如下: 1. 读取前n行所有数据 # coding: utf-8 import pandas as pd # 1. 读取前n行所有数据 df = pd.read_excel('school.xlsx')#读取xlsx中第一个sheet ...
  • 正常pandas读取Excel为 df = pd.read_excel(‘abc.xlsx’) 当需要获取指定列名的数据时使用参数useclos=[‘列名1’, ‘列名2’…] 变成 use_name = [‘a’, ‘b’, ‘c’,…] df = pd.read_excel(‘abc.xlsx’, ...
  • import pandas as pd def xlsx_to_csv_pd(): data_xls = pd.read_excel('../DATA/ausdata.xlsx', index_col=0) data_xls.to_csv('...用pandas转换,需要安装依赖包:xlrd,新版本只支持xls不支持xlsx,所以下载
  • pandas.read_excel(XXX.xlsx)之后发现,报错了 发现忘记下载xlrd包这时候再下载xlrd包就可以了 pip install xlrd 然后回来再运行,发现还是不行,于是查阅了无数博客..... 发现 新版本的xlrd包竟然不支持xlsx 只...
  • xlsx文件转csv文件注意事项:python默认输出编码为‘utf-8’,excel默认读取文件编码为'gbk',写入csv时,需要指定编码方式:encoding='gbk'。
  • import pandas as pd #任意的多组列表 a = [1,2,3] b = [4,5,6] #字典中的key值即为csv中列名 dataframe = pd.DataFrame({'a_name':a,'b_name':b}) #将DataFrame存储为csv,index表示是否显示行名,default=True ...
  • 原因是最近xlrd更新到了2.0.1版本,只支持.xls文件。所以pandas.read_excel(‘xxx.xlsx’)会报错。 重新安装 xlrd 就能读取了 pip install xlrd==1.2.0
  • 下载的xlrd版本太高,已经不支持打开xlsx文件。 解决方案: 1.pip uninstall xlrd,再下载pip install xlrd==1.2.0版本 2.使用openpyxl。 先下载pip install openpyxl,再把读取的代码改成下式: temp_data = pd....
  • 笔者在使用Mac进行Python开发时使用pandas读取xlsx文件遇到这个错误: ImportError: Missing optional dependency 'xlrd'. Install xlrd >= 1.0.0 for Excel support Use pip or conda to install xlrd. 看似...
  • 今天遇到了要在搭建的Django的后台,写了一个读取xlsx文件的函数, 用pandas.read_excel(文件路径) 执行时,总是提示 Excel xlsx file; not supported错误 原因是新版本xlrd只支持.xls文件,不支持.xlsx文件。 ...
  • 原因是最近xlrd更新到了2.0.1版本,只支持.xls文件。 所以pandas.read_excel(‘xxx.xlsx’)会报错。...也可以用openpyxl代替xlrd打开.xlsx文件: df=pandas.read_excel(‘data.xlsx’,engine=‘openpyxl’) ...
  • 操作步骤导入pandas获取相应sheet的数据、排序、求和、求平均值、计算日期差
  • 使用pandas轻松读取表格xlsx数据

    千次阅读 2019-10-11 11:56:50
    import re from pathlib import Path import pandas as pd here = Path('/home/zero/桌面/xxxx') for filename in here.rglob('*.xlsx'): print(filename) x = pd.ExcelFile(filename) print(x.sheet_n...
  • Python读取excel文件有很多方法,这里主要介绍一下xlrd包的使用...创建数据文件"product_sales.xlsx",有两个工作表"sales","price"。3.读取数据文件,并命名为workbook。workbook = xlrd.open_workbook("product_s...
  • python pandas读取excel-Python使用Pandas读写EXCEL文件教程

    万次阅读 多人点赞 2020-11-01 13:01:15
    什么是ExcelExcel 是微软出品的和款办公软件它能够创建和编辑以”xls”和”xlsx”为后缀的电子表格文件Excel文件可以在Windows、macOS、Android和iOS系统中使用自1993年发布5.0 版本以来,Excel 已经成为电子表格...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 15,965
精华内容 6,386
关键字:

pandas读取xlsx文件

友情链接: nifty.rar