精华内容
下载资源
问答
  • 首先是pd.read_excel的参数:函数为: pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,names=None, arse_cols=None,date_parser=None,na_values=None,thousands=None, convert_float=True...
  • Python 中pandas.read_excel详细介绍 #coding:utf-8 import pandas as pd import numpy as np filefullpath = r"/home/geeklee/temp/all_gov_file/pol_gov_mon/downloads/1.xls" ...df = pd.read_excel(filef
  • 这篇文章主要介绍了Python 中pandas.read_excel详细介绍的相关资料,需要的朋友可以参考下 Python 中pandas.read_excel详细介绍 #coding:utf-8 import pandas as pd import numpy as np filefullpath = r"/home/...
  • 问题描述 使用pandas库的read_excel()方法读取外部excel文件报错, 截图如下 好像是缺少了什么方法的样子 问题分析 分析个啥, 水平有限, 直接面向stackoverflow编程 ...我找到了下面的这几种说法 ...
  • 除了使用xlrd库或者xlwt库进行对excel表格的操作读与写,而且pandas库同样支持...首先是pd.read_excel的参数:函数为: pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,names=None, arse_

    除了使用xlrd库或者xlwt库进行对excel表格的操作读与写,而且pandas库同样支持excel的操作;且pandas操作更加简介方便。

    首先是pd.read_excel的参数:函数为:

    pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,names=None,
                    arse_cols=None,date_parser=None,na_values=None,thousands=None, 
                    convert_float=True,has_index_names=None,converters=None,dtype=None,
                    true_values=None,false_values=None,engine=None,squeeze=False,**kwds)

    表格数据:
    这里写图片描述这里写图片描述

    常用参数解析:

    • io :excel 路径;
    In [10]: import pandas as pd
    #定义路径IO
    In [11]: IO = 'example.xls'
    #读取excel文件
    In [12]: sheet = pd.read_excel(io=IO)
    #此处由于sheetname默认是0,所以返回第一个表
    In [13]: sheet
    Out[13]:
       姓名  年龄        出生日  爱好   关系
    0  小王  23 1991-10-02  足球   朋友
    1  小丽  23 1992-11-02  篮球  NaN
    2  小黑  25 1991-10-18  游泳   同学
    3  小白  21 1989-09-09  游戏  NaN
    4  小红  25 1990-08-07  看剧  NaN
    5  小米  24 1991-12-12  足球  NaN
    6  大锤  26 1988-09-09  看剧   个人
    #上述列表返回的结果和原表格存在合并单元格的差异
    • sheetname:默认是sheetname为0,返回多表使用sheetname=[0,1],若sheetname=None是返回全表 。注意:int/string返回的是dataframe,而none和list返回的是dict of dataframe。
    In [7]: sheet = pd.read_excel('example.xls',sheetname= [0,1])
    #参数为None时,返回全部的表格,是一个表格的字典;
    #当参数为list = [0123]此类时,返回的多表格同样是字典
    In [8]: sheet
    Out[8]:
    {0:    姓名  年龄        出生日  爱好   关系
     0  小王  23 1991-10-02  足球   朋友
     1  小丽  23 1992-11-02  篮球  NaN
     2  小黑  25 1991-10-18  游泳   同学
     3  小白  21 1989-09-09  游戏  NaN
     4  小红  25 1990-08-07  看剧  NaN
     5  小米  24 1991-12-12  足球  NaN
     6  大锤  26 1988-09-09  看剧   个人, 1:    1  3  5  学生
     0  2  3  4  老师
     1  4  1  9  教授}
    #value是一个多位数组
    In [15]: sheet[0].values
    Out[15]:
    array([['小王', 23, Timestamp('1991-10-02 00:00:00'), '足球', '朋友'],
           ['小丽', 23, Timestamp('1992-11-02 00:00:00'), '篮球', nan],
           ['小黑', 25, Timestamp('1991-10-18 00:00:00'), '游泳', '同学'],
           ['小白', 21, Timestamp('1989-09-09 00:00:00'), '游戏', nan],
           ['小红', 25, Timestamp('1990-08-07 00:00:00'), '看剧', nan],
           ['小米', 24, Timestamp('1991-12-12 00:00:00'), '足球', nan],
           ['大锤', 26, Timestamp('1988-09-09 00:00:00'), '看剧', '个人']], dtype=object)
    
    #同样可以根据表头名称或者表的位置读取该表的数据
    #通过表名
    In [17]: sheet = pd.read_excel('example.xls',sheetname= 'Sheet2')
    In [18]: sheet
    Out[18]:
       1  3  5  学生
    0  2  3  4  老师
    1  4  1  9  教授
    
    #通过表的位置
    In [19]: sheet = pd.read_excel('example.xls',sheetname= 1)
    
    In [20]: sheet
    Out[20]:
       1  3  5  学生
    0  2  3  4  老师
    1  4  1  9  教授
    • header :指定作为列名的行,默认0,即取第一行,数据为列名行以下的数据;若数据不含列名,则设定 header = None;
    #数据不含作为列名的行
    In [21]: sheet = pd.read_excel('example.xls',sheetname= 1,header = None)
    In [22]: sheet
    Out[22]:
       0  1  2   3
    0  1  3  5  学生
    1  2  3  4  老师
    2  4  1  9  教授
    #默认第一行数据作为列名
    In [23]: sheet = pd.read_excel('example.xls',sheetname= 1,header =0)
    In [24]: sheet
    Out[24]:
       1  3  5  学生
    0  2  3  4  老师
    1  4  1  9  教授
    • skiprows:省略指定行数的数据
    In [25]: sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skiprows= 1)
    #略去1行的数据,自上而下的开始略去数据的行
    In [26]: sheet
    Out[26]:
       0  1  2   3
    0  2  3  4  老师
    1  4  1  9  教授
    • skip_footer:省略从尾部数的行数据
    In [27]: sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skip_footer= 1)
    #从尾部开始略去行的数据
    In [28]: sheet
    Out[28]:
       0  1  2   3
    0  1  3  5  学生
    1  2  3  4  老师
    • index_col :指定列为索引列,也可以使用 u’string’
    #指定第二列的数据作为行索引
    In [30]: sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skip_footer= 1,index_col=1)
    
    In [31]: sheet
    Out[31]:
       0  2   3
    1
    3  1  5  学生
    3  2  4  老师
    • names:指定列的名字,传入一个list数据
    In [32]: sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skip_footer= 1,index_col=1,names=['a','b','c'])
        ...:
    
    In [33]: sheet
    Out[33]:
       a  b   c
    1
    3  1  5  学生
    3  2  4  老师

    总体而言,pandas库的pd.read_excel和pd.read_csv的参数比较类似,且相较之前的xlrd库的读表操作更加简单,针对一般批量的数据处理最好选择pandas库操作。但是功能有待完善或者本次研究的不够深入,比如合并单元格的问题,欢迎一起讨论交流。

    展开全文
  • 【Python】pd.read_excel应用

    千次阅读 2019-08-12 23:21:27
    第一次运行必须带上定义:import pandas...pd.read_excel(1) read_excel(io, sheet_name, header, names, index_col, parse_cols, usecols, squeeze, dtype, engine, converters, true_values, false_values, ski...

    第一次运行必须带上定义:import pandas as pd,故意报错展现

    pd.read_excel(1)

    read_excel(io, sheet_name, header, names, index_col, parse_cols, usecols, squeeze, dtype, engine, converters, true_values, false_values, skiprows, nrows, na_values, keep_default_na, verbose, parse_dates, date_parser, thousands, comment, skip_footer, skipfooter, convert_float, mangle_dupe_cols, **kwds)

    这函数有**kwds,函数在调用时,可以有任意数量和种类的命名参数,或者称关键字参数。这个就是决定了,pd.read_excel除了第一个路径外,后面参数顺序随便可换;

    这个函数有效参数一共有26个,下文开始逐个描述,其中有3个问题,持续思考中~

    Squeeze单列从SeriesDataFrame直观体现~

    Thousands=","针对文本的差异如何直观体现~

    mangle_dupe_cols=False的报错

    整体初始模式:

    read_excel(io,sheet_name=0,header=0,names=None,index_col=None,parse_cols=None,Nrows=None,usecols=None,skiprows=0,skipfooter=0,Squeeze=False,Dtype=None,Engine=None,Converters=None,true_values=None,false_values=None,na_values=None,keep_default_na=False,Verbose=False,parse_dates=False,date_parser=None,thousands=None,Comment=None,convert_float=True,mangle_dupe_cols=True)

    注意:目前python中,skipfooter和skip_footer不能共存,所以上面只有25个参数。

    1、io :excel路径

    默认就是C:\Users\XXX    XXX是用户名:pd.read_excel("test1.xlsx")

      

    2、sheet_name:默认是sheet_name=0;          也可以使用sheetname

    1)sheetname=’sheet2’ 返回指定名字的表;2)返回多表使用sheet_name=[0,1,2] 代表返回第几张,0默认第一张,0,1,2代表返回第一张、第二张、第三张;3)若sheet_name=None是返回全表。

    3、header :指定作为列名的行,默认header=0,即取第一行,数据为默认从这一行下面开始读取;若数据想不含列名,则设定header=None;

    案例1:pd.read_excel("test2.xlsx",header=1)

    案例2:pd.read_excel("test2.xlsx",header=None)

    4、names要使用的列名列表,默认names=None;匹配header进行使用,会覆盖原因的表头文字。指定的名字出现重复的话,会出现.1,.2

    案例1:pd.read_excel("test2.xlsx",header=0,names='54321')

    案例2:pd.read_excel("test2.xlsx",header=0,names='54333')

     

    5、index_col指定列为索引列,默认index_col=None,index_col=0,选择第一列为索引

    案例:pd.read_excel("test2.xlsx",index_col=0)

    6、parse_cols,默认parse_cols=None,相关于usecols,显示多少列,None是显示全部列,parse_cols=1,显示2列

    案例:pd.read_excel("test2.xlsx",parse_cols=1)

    7、Nrows,8、usecols需要展示的行列数进行指定,默认Nrows=None,usecols=None,这里意思就是展示全部的有数据的行和列,nrows=2,usecols=2,意思就是需求2行,3列

    案例:pd.read_excel("test2.xlsx",nrows=2,usecols=2)

    9、skiprows省略指定行数的数据,默认skiprows=0,从表头开始省略的行数,表头也算是数据。

    案例:pd.read_excel("test2.xlsx",skiprows=1)

       

    10、skipfooter省略从尾部数的行数据,默认skipfooter=0,设置0就是省略0行。

    11、skip_footer是一样的

    案例:pd.read_excel("test2.xlsx",skipfooter=28)

     

    12、Squeeze,如果文件值包含一列,则返回一个Series,默认Squeeze=False;这里及哪怕只有一列也是按照默认的输出为dataframe,Squeeze=True,在只有一列的时候就是为Series;

    #Pandas各个数据类型的关系:0维单值变量->1维Series->2维DataFrame->3维层次化

    #Time- Series:以时间为索引的Series,它是由index(索引)和value(数值)组成

    #DataFrame:二维的表格型数据结构。很多功能与R中的data.frame类似。

    #Panel :三维的数组,可以理解为DataFrame的容器。

    针对只有1列的案例如下,但是实际的直观差异需要进一步跟进。

    案例:pd.read_excel("test3.xlsx",Squeeze=True)

       

    13、Dtype,每列数据的数据类型。例如 {‘a’: np.float64, ‘b’: np.int32},默认Dtype=None也就是按照初始的数据类型进行输出;这里需要匹配np,需要额外定意思import numpy as np

    这里把第一类的类型进行了改变

    案例:pd.read_excel("test2.xlsx",dtype={'你':np.int32,'好':np.float64,'啊':np.float64,'我':np.float64,'区':np.float64})

      

    14、Engine,使用的分析引擎。可以选择C或者是python。C引擎快但是Python引擎功能更加完备。默认Engine=None就是使用python。

    案例:pd.read_excel("test2.xlsx",Engine="C")

     

    15、Converters,在某些列中转换值的函数的命令默认Converters=None;也就是不进行转化。这个可以是公式转换,也可以是字符类型转化,默认的数字是int格式,案例改为tsr。

    #Python的数字类型有int整型、long长整型、float浮点数、complex复数、以及布尔值(0和1)

     #对于布尔值,只有两种结果即True和False,其分别对应与二进制中的0和1。

    #文本类型str类。

    案例:pd.read_excel("test7.xlsx",converters={'str':str})

      

    16、true_values,指定字符变为true,默认true_values=None,默认没有字符转化为true

    17、false_values,指定字符变为false,默认false_values=None,默认没有字符转化为true

    18、na_values,指定字符变为NaN,默认false_values=None,默认没有字符转化为NaN

    这3个模块可以一起理解。

    案例pd.read_excel("test4.xlsx",true_values='你',false_values='好',na_values='无')

     

    19、keep_default_na,如果指定na_values参数,并且keep_default_na=False,那么默认的NaN将被覆盖,否则添加。默认keep_default_na=True;默认不会被新定义的NaN影响默认的NaN规则

    默认的NaN定义'-1.#IND', '1.#QNAN', '1.#IND', '-1.#QNAN', '#N/A N/A','#N/A', 'N/A', 'NA', '#NA', 'NULL', 'NaN', '-NaN', 'nan', '-nan', ''转换为NaN

    案例pd.read_excel("test5.xlsx",na_values=['无'],keep_default_na=False)

      

    20、Verbose,是否显示各种解析器的输出信息,例如:“在非数字列中显示插入的na值的数目”等。默认Verbose=False;默认不显示,python默认使用紧凑的正则表达式(即普通的正则表达式),但为了提高正则表达式的可读性,我们可以使用松散的。这个模块主要是意思理解。

    21、parse_dates,分析日期,默认=False;也就是不分析日期,适用于表格里面没有日期的。如果为true,需要指定将哪一列解析为时间索引。如果列或索引包含不可分析的日期,则整个列或索引将作为对象数据类型原封不动地返回。对于非标准的日期时间分析,请在pd.read_excel之后使用pd.to_datetime。注意:对于ISO8601格式的日期,存在一个快速路径。

     [1, 2, 3] -> 解析1,2,3列的值作为独立的日期列;

     [[1, 3]] -> 合并1,3列作为一个日期列使用dict,

     {‘foo’ : [1, 3]} -> 将1,3列合并,并给合并后的列起名为"foo"

    案例1:pd.read_excel("test13.xlsx",parse_dates=['第1次'])

    案例2:pd.read_excel("test13.xlsx",parse_dates=[['第1次','第2次']])

    案例3:pd.read_excel("test13.xlsx",parse_dates={'foo':['第1次','第3次']})

       

    22、date_parser,日期分析器,默认=None;也就是不开启,适用于表格里面没有日期的。用于解析日期的函数,默认使用dateutil.parser来做转换。dateutil.parser 顾名思意 就是与日期相关库里的一个日期解析器,能够将字符串转换为日期格式,我们来看看具体的用法。

    需要在线安装 pip install python-dateutil;一般要分析的情况下,就开启就可以了。

    案例:pd.read_excel("test13.xlsx",date_parser=True)

    23、Thousands,设置默认的数字千分符号,默认thousands =None;默认不设置。此参数仅对Excel中存储为文本的列是必需的,无论显示格式如何,都将自动分析任何数值列,这里读取excel的时候,不管excel有没有千分符,都会默认无。

    数据格式的展示

     

    案例:pd.read_excel("test12.xlsx",Thousands=",")

    但是好像没有直接的明显差异,需要持续跟进

      

    24、Comment,标识着多余的行不被解析。如果该字符出现在行首,这一行将被全部忽略。这个参数只能是一个字符,空行;默认Comment=None。表示不按照这个方式忽略

    案例:pd.read_excel("test11.xlsx",comment='#')

      

    25、convert_float,转换浮点数,默认convert_float=True ;将整数浮点转换为int(即1.0–>1)将整数浮点转换为int(即1.0–>1)。如果为False,则所有数值数据都将作为浮点数读取:Excel将所有数字作为浮点数存储在内部。

    案例:pd.read_excel("test10.xlsx",convert_float=False)

       

    26、mangle_dupe_cols,默认mangle_dupe_cols=True;则重复列将指定为“x.0”…“x.n”,如果设定为false则会将所有重名列覆盖,但是实际测试会报错!

     

    此处可能是Pandas包的问题,持续跟进~

    直接读取和设置True均正常

    案例:pd.read_excel("test9.xlsx",mangle_dupe_cols=True)

    换个思路,自己设置标题,也是一样

    案例:pd.read_excel("test9.xlsx",header=None,names="1111",mangle_dupe_cols=False)

     

     

    参考资料:https://blog.csdn.net/u010801439/article/details/80052677

     

    展开全文
  • pd.read_excel使用

    千次阅读 2019-04-16 21:57:35
    pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,names=None, arse_cols=None,date_parser=None,na_values=None,thousands=None, convert_float=True,has_...
    pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,names=None,
                    arse_cols=None,date_parser=None,na_values=None,thousands=None, 
                    convert_float=True,has_index_names=None,converters=None,dtype=None,
                    true_values=None,false_values=None,engine=None,squeeze=False,**kwds)

    常用参数解析:

    • io :excel 路径
    import numpy as np
    import pandas as pd
    from pandas import DataFrame
    #定义路径IO
    IO="C:\\Users\\zhouy_000\\Desktop\\python_study\\20190416\\test.xlsx"
    #读取excel文件
    sheet_a=pd.read_excel(io=IO)
    #此处由于sheetname默认是0,所以返回第一个表
    print(sheet_a)
    """
       姓名  年龄        出生日  爱好   关系
    0  小王  23 1991-10-02  足球   朋友
    1  小丽  23 1992-11-02  篮球  NaN
    2  小黑  25 1991-10-18  游泳   同学
    3  小白  21 1989-09-09  游戏  NaN
    4  小红  25 1990-08-07  看剧  NaN
    5  小米  24 1991-12-12  足球  NaN
    6  大锤  26 1988-09-09  看剧   个人
    """
    sheet_list=pd.read_excel(io=IO,sheet_name=[0,1])
    print(type(sheet_list))
    #<class 'collections.OrderedDict'>
    print(sheet_list[1])
    """
            A        B     C
    0  animal  balance  city
    1     100       90    80
    """
    
    • sheetname:默认是sheetname为0,返回多表使用sheetname=[0,1],若sheetname=None是返回全表 。注意:int/string返回的是dataframe,而none和list返回的是dict of dataframe。(如上例所示sheet_list可视为一个列表,sheet_list[1]返回第二个表)
    print(sheet_list[0].columns)
    #Index(['姓名', '年龄', '出生日', '爱好', '关系'], dtype='object')
    print(sheet_list[0].index)
    #RangeIndex(start=0, stop=7, step=1)
    print(sheet_list[0].values)
    """
    [['小王' 23 Timestamp('1991-10-02 00:00:00') '足球' '朋友']
     ['小丽' 23 Timestamp('1992-11-02 00:00:00') '篮球' nan]
     ['小黑' 25 Timestamp('1991-10-18 00:00:00') '游泳' '同学']
     ['小白' 21 Timestamp('1989-09-09 00:00:00') '游戏' nan]
     ['小红' 25 Timestamp('1990-08-07 00:00:00') '看剧' nan]
     ['小米' 24 Timestamp('1991-12-12 00:00:00') '足球' nan]
     ['大锤' 26 Timestamp('1988-09-09 00:00:00') '看剧' '个人']]
    """
    • header :指定作为列名的行,默认0,即取第一行,数据为列名行以下的数据;若数据不含列名,则设定 header = None;
    #同样可以根据表头名称或者表的位置读取该表的数据
    sheet_b=pd.read_excel(io=IO,sheet_name="def",header=0)
    print(sheet_b)
    """
            A        B     C
    0  animal  balance  city
    1     100       90    80
    """
    sheet_b=pd.read_excel(io=IO,sheet_name="def",header=None)
    print(sheet_b)
    """
            0        1     2
    0       A        B     C
    1  animal  balance  city
    2     100       90    80
    """
    • skiprows:省略指定行数的数据
    • skipfooter:省略从尾部数的行数据
    sheet_a=pd.read_excel(io=IO,sheet_name="abc",header=0)
    print(sheet_a)
    print(len(sheet_a))
    """
       姓名  年龄        出生日  爱好   关系
    0  小王  23 1991-10-02  足球   朋友
    1  小丽  23 1992-11-02  篮球  NaN
    2  小黑  25 1991-10-18  游泳   同学
    3  小白  21 1989-09-09  游戏  NaN
    4  小红  25 1990-08-07  看剧  NaN
    5  小米  24 1991-12-12  足球  NaN
    6  大锤  26 1988-09-09  看剧   个人
    7
    """
    sheet_b=pd.read_excel(io=IO,sheet_name="abc",header=0,skiprows=1,skipfooter=2)
    print(sheet_b)
    print(len(sheet_b))
    """
       小王  23 1991-10-02 00:00:00  足球   朋友
    0  小丽  23          1992-11-02  篮球  NaN
    1  小黑  25          1991-10-18  游泳   同学
    2  小白  21          1989-09-09  游戏  NaN
    3  小红  25          1990-08-07  看剧  NaN
    4
    """
    • index_col :指定列为索引列,也可以使用 u’string’
    • names:指定列的名字,传入一个list数据
    sheet_a=pd.read_excel(io=IO,sheet_name="abc",header=0,index_col=0,names=["a","b","c","d","e"])
    print(sheet_a)
    """
         b          c   d    e
    a                         
    小王  23 1991-10-02  足球   朋友
    小丽  23 1992-11-02  篮球  NaN
    小黑  25 1991-10-18  游泳   同学
    小白  21 1989-09-09  游戏  NaN
    小红  25 1990-08-07  看剧  NaN
    小米  24 1991-12-12  足球  NaN
    大锤  26 1988-09-09  看剧   个人
    """

    index_col类似set_index,names作用类似修改列名。

    参考:https://blog.csdn.net/brucewong0516/article/details/79096633

     

    展开全文
  • 写脚本,报错很正常,但总报些无厘头的错就让人很郁闷。上午大概花了三小时的时间做了个分类问题,但居然一半以上的时间都花在读取excel文件这一步了!...data= pd.ExcelFile(path1) df = data.parse(sh

    写脚本,报错很正常,但总报些无厘头的错就让人很郁闷。上午大概花了三小时的时间做了个分类问题,但居然一半以上的时间都花在读取excel文件这一步了!我。。。
    下面就来看看究竟是何方妖孽:
    问题简述:读取一个.xls文件,通过关键字取出该文件的某一列数据。(用过pandas的同学大概都会觉得这个功能干起来和听起来一样简单,那究竟报了什么错呢?)
    一开始,我是这样干的:

    path1 = "D:\\数据分析\XXX.xlsx"
    data= pd.ExcelFile(path1)
    df = data.parse(sheet_name="表1",header=None)
    print(df["某个索引"])
    

    刚刚想查一下这个.parse() 的说明,但居然只能查到这个放在在java的用法。啊啊啊,天知道我当时为啥就搜到了这个用法。反正,这玩意返回的内容都是data型的(这方法底层可能是由java实现的),导致最后一行用索引提数据的时候一直出现KeyError的报错。(该方法的官方解释在这里:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.ExcelFile.parse.html)

    当时用这个方法是因为目标文件中包含了多个表,但我不知道pd.read_excel()可以指定表读入。。。官方解释在这里:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html?highlight=read_excel#pandas.read_excel
    后来发现,pd.read_excel()读出来的东西也是data型的,要用np.array()转换一下才能做数组的相关操作,否则总是报很奇怪的错误。(更奇怪的是在debag模式下这就是ndarry…, 这个报错真的解决了贼久!)
    后来,把代码改成这样就好啦!

    path1 = "D:\\数据分析\XXX.xlsx"
    df = pd.read_excel(path1, sheetname = "表1")
    print(df["某个索引"])
    

    究其原因还是pd.ExcelFile()和pd.read_csv()的不同造成的,但我没有在这里深究,还请知道的同学不吝赐教。这里有个博客简述了它俩的区别:
    https://mingju.net/2020/05/pd.read_excel_and_pd.ExcelFile/

    如有错误,还请指出!

    展开全文
  • pandas:pd.read_excel操作读取excel文件

    千次阅读 2019-09-27 14:34:49
    除了使用xlrd库或者xlwt库进行对excel表格的操作读与写,而且pandas库同样支持excel的操作;...pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,names=None, arse_cols=None,...
  • pd.read_excel()练习

    千次阅读 2019-05-29 19:23:17
    # -*- coding: utf-8 -*- import pandas as pd import numpy as np df11=pd.read_excel("C:/Users/Administrator/Desktop/20190527/表...df12=pd.read_excel("C:/Users/Administrator/Desktop/20190527/表2.xls...
  • pd.read_excel(io, # 文件路径 sheetname=0, # 用于选取sheet表,默认是选取第一个sheet,即参数为0 header=0, # 表头,指定某一行作为列标签,默认是第一行,即参数为0 skiprows=None, # 跳过行,默认是无 index...
  • pandas中pd.read_excel()的用法

    万次阅读 多人点赞 2020-08-18 17:39:54
    人们经常用pandas处理表格型数据,时常需要读入excel表格数据,很多人一般都是直接这么用:pd.read_excel(“文件路径文件名”),再多一点的设置可能是转义一下路径中的斜杠,一旦原始的excel表不是很规整,这样简单...
  • pandas.read_excel(io,sheet_name = 0,header = 0,names = None,index_col = None,usecols = None,squeeze = False,dtype = None, ...) io:字符串,文件的路径对象。 sheet_name:None、string、int、...
  • pd.read_excel(path, skiprows, nrows, header) 参数解析: path:表示路径 header:指定作为列名的行,默认0,即取第一行,数据为列名行以下的数据;若数据不含列名,则设定 header=None; skiprows:省略指定行数...
  • pd.read_excel

    千次阅读 2019-04-15 08:37:39
    data=pd.read_excel(‘pl_09/ZhaoyangHospital.xlsx’,sheetname=‘Sheet1’) data.head() 购药时间 社保卡号 商品编码 商品名称 销售数量 应收金额 实收金额 0 2016-01-01 星期五 1.616528e+06 236701.0 强力VC银.....
  • 在我们日常当中,CSV格式的文件占大多数,但是我们也经常读入EXCEl表格文件,接下来我们聊聊常用的pd.read_excel()函数的常用参数 首先,认识一下pd.read_excel(),函数的官方文档是这么说的:将Excel文件读取到...
  • import pandas as pd data = pd.read_excel('1.xlsx',index_col=u'a5') print(data.head()) 'a5’这列就变为第一列,也就是索引位置了
  • 除了使用xlrd库或者xlwt库进行对excel表格的操作读与写,而且...首先是pd.read_excel的参数:函数为: def read_excel(io, sheet_name=0, header=0, skiprows=None,skip_footer=0, index_col=None, names=None,...
  • pd.read_excel() index_col参数

    万次阅读 2019-03-08 20:22:39
    pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,names=None, arse_cols=None,date_parser=None,na_values=None,thousands=None, convert_float=True,has_index_names=N...
  • pd.read_excel()/pd.to_excel()参数详解

    万次阅读 2019-05-22 13:40:51
    1. read_excel read_excel方法定义: pandas.read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, usecols=None, parse_dates=False, date_parser=None, na_...
  • pd.read_excel()官方文档 pandas.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, parse_cols=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=...
  • pd.read_excel()报错 cannot convert float NaN to integer 今天pd.read_excel()时报了这个错,找了半天不知道为什么 最后发现是因为Excel表格中的第一行中居然有一个方格是空的,自然那一列数据就没有列名了,所以...
  • 关于pd.read_excel()读取xls文件报错的解决办法
  • https://blog.csdn.net/weixin_40240670/article/details/80742999
  • python中用pd.read_excel()读取数据,有时候会因为表格中含有空格而导致某一列的数据类型是object类型,此时有两种方法查找空格 1 用excel表格查询,较麻烦,有的是空表格,而有的是含有空格,含有空格的左上角有...
  • 用pandas的pd.read_excel()方法读取excel文件时,遇到某一列的数据前面包含0(如010101)的时候,pd.read_excel()方法返回的DataFrame会将这一列视为int类型,即010101变成10101,这种情况下,如果想要保持数据的...
  • 一、读取(1)read_csvimport pandas as pd mydata_txt = pd.read_csv('lucia_test.txt', sep='\n', encoding='utf8')print(mydata_txt)(2)pd.read_excel ##可以用help(pd.read_excel)来查询#coding:utf-8...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 32,325
精华内容 12,930
关键字:

pd.read_excel