精华内容
下载资源
问答
  • ExcelExport
  • #python 使用pandas操作EXCEL表格数据 import pandas as pd import numpy as np #读取excel表格数据 df = pd.read_excel( r"E:\a研究生学习\项目\数据\h2.xlsx") print(df) #输出表格 print(df.dtypes) #显示表格的...

    原始表格

    #python 使用pandas操作EXCEL表格数据
    import pandas as pd
    import numpy as np
    
    #读取excel表格数据
    df = pd.read_excel( r"E:\a研究生学习\项目\数据\h2.xlsx")
    print(df) #输出表格
    print(df.dtypes) #显示表格的数据类型
    
    #输出
     m1   m2  m3  m4
    0   6082   80   2   3
    1   2132   80   4   3
    2   9857   80   2   1
    3   6543   80   4   3
    4   8628   80   4   3
    5   6696   80   3   3
    6   6738   80   2   1
    7   1843   80   3   2
    8   7362  443   1   3
    9   8347   80   2   3
    10    47   80   3   2
    11  4348  443   2   2
    12  6412   80   1   2
    13  8965   80   1   1
    14  4089   80   3   1
    15   762   80   2   3
    16  3019   80   2   3
    17  8902   80   2   3
    m1    int64
    m2    int64
    m3    int64
    m4    int64
    dtype: object
    
    
    
    print(df['m3']) #显示列名为m3的数据
    
    #输出
    0     2
    1     4
    2     2
    3     4
    4     4
    5     3
    6     2
    7     3
    8     1
    9     2
    10    3
    11    2
    12    1
    13    1
    14    3
    15    2
    16    2
    17    2
    Name: m3, dtype: int64
    
    
    
    #读取表格的第一行(不包含表头)
    data=df.iloc[0].values#0表示第一行 这里读取数据并不包含表头
    print(data)
    
    #输出
    [6082   80    2    3]
    
    
    
    #读取表格的1,2,3行
    data=df.iloc[[1,2,3]].values
    print(data)
    
    #输出
    [[2132   80    4    3]
     [9857   80    2    1]
     [6543   80    4    3]]
    
    
    
    #读取表格的3到6行(索引为2-5)
    data=df.iloc[2:6,:].values
    print(data)
    
    #输出
    [[9857   80    2    1]
     [6543   80    4    3]
     [8628   80    4    3]
     [6696   80    3    3]]
    
    
    #读取表格的3到4列(索引为2-3)
    data=df.iloc[:,2:4].values
    print(data)
    
    #输出
    [[2 3]
     [4 3]
     [2 1]
     [4 3]
     [4 3]
     [3 3]
     [2 1]
     [3 2]
     [1 3]
     [2 3]
     [3 2]
     [2 2]
     [1 2]
     [1 1]
     [3 1]
     [2 3]
     [2 3]
     [2 3]]
    
    
    #读取表格的3到6行(索引为2-5),3到4列(索引为2-3)
    data=df.iloc[2:6,2:4]
    print(data)
    
    #输出
       m3  m4
    2   2   1
    3   4   3
    4   4   3
    5   3   3
    
    展开全文
  • Python使用pandas读取excel表格数据

    万次阅读 多人点赞 2019-04-08 16:14:04
    导入 import pandas as pd ...读取表格并得到表格行列信息 df=pd.read_excel('test.xlsx') height,width = df.shape print(height,width,type(df)) 表格如下: 得到如下输出,为一个4行5列的数据块: ...

    导入

    import pandas as pd
    

    若使用的是Anaconda集成包则可直接使用,否则可能需要下载:pip install pandas

    读取表格并得到表格行列信息

    df=pd.read_excel('test.xlsx')
    height,width = df.shape
    print(height,width,type(df))
    

    表格如下:
    test.xlsx1
    得到如下输出,为一个4行5列的数据块,为DataFrame格式:
    输出
    直接print(df)得到的结果:
    print(df)
    对比结果和表格,很显然表格中的第一行(黄色高亮部分)被定义为数据块的列下标,而实际视作数据的是后四行(蓝色高亮部分);并且自动在表格第一列之前加了一个行索引{0,1,2,3}。
    test.xlsx2

    提取数据放入数组中

    x = np.zeros((height,width))
    for i in range(0,height):
    	for j in range(1,width+1): #遍历的实际下标,即excel第一行
    		x[i][j-1] = df.ix[i,j]
    print(x.shape)
    print(x)
    

    np.zeros()方法定义一个初试值全为0的二维数组(需要导入numpy库),用df.ix[i,j]读取数据并复制入二维数组中,其中for i in range(0,height)循环表示从下标0到下标height-1(不包含height),得到的输出如下:
    输出

    对代码做一些补充说明:

    从DataFrame结构的数据中取值有三种常用的方法:

    #第一种方法:ix
    df.ix[i,j]		# 这里面的i,j为内置数字索引,行列均从0开始计数
    df.ix[row,col]	# 这里面的row和col为表格行列索引,也就是表格中的行与列名称
    
    #第二种方法:loc
    df.loc[row,col]	# loc只支持使用表格行列索引,不能用内置数字索引
    
    #第三种方法:iloc
    df.iloc[i,j]	# iloc只支持使用内置数字索引,不能用表格行列索引
    

    由于ix方法对两种索引都支持,所以这里就有一个问题:如果表格行列索引也是数字怎么办? 比如我上述例子中列索引为表格的第一行{1,2,3,4},而行索引为读取时自动添加的。
    经过实验这种情况将会优先使用表格行列索引,也就对应了上面代码中得到的结果。不过为了不在使用时产生混乱,我个人建议还是使用loc或者iloc而不是ix为好。

    在表格中自定义行列索引的情况

    如果表格是下面这样的形式:
    新表格
    想要让读取得到的DataFrame行索引为{‘one’,‘two’,‘three’,‘four’},列索引为{‘一’,‘二’,‘三’,‘四’,‘五’}。如果直接使用read_excel(filename),虽然列索引会默认为第一行,但是行索引并不会默认为第一列,而是会自动添加一个{0,1,2,3}作为行索引。因此需要达到我们的目的需要设定一下读取时的参数,如下:

    df = pd.read_excel(filename,index_col=0)	# 即指定第一列为行索引
    print(df)
    print('第0行第1列的数据为:',df.iloc[0,1])
    print('第three行第二列的数据为:',df.loc['three','二'])
    

    得到的输出如下所示:
    新dataframe

    展开全文
  • 0. 所需库 - pandas 1. 载入excel文件 x = pd.read_excel(filename) 2. 读取表头 title = x.columns.to_list() 3. 读取某一行的“内容” a = x.iloc[0] #输出的a带有标题索引,并不是一个正常数组,...

    0. 所需库  - pandas

    1. 载入excel文件

    x = pd.read_excel(filename)
    

    2. 读取表头

    title = x.columns.to_list()

    3. 读取某一行的“内容”

    a = x.iloc[0]
    

    #输出的a带有标题索引,并不是一个正常数组,例如

     4.  读取某一行的"值"

    a = x.iloc[0].values

    #此时的输出是一个list,可直接操作

    5. 读取某一列的“内容”

    a= x.iloc[:,0]

    #此时的输出带有索引

    6. 读取某一列的“值”

    a= x.iloc[:,0].values

    #此时输出一个数组

    7. 按照“列名称”读取一列值

    a = x.loc[:,'1000_at'].values

    #此时输出‘1000_at’那一列的值

     

     

     

     

     

     

     

    展开全文
  • /usr/bin/python# -*- coding: UTF-8 -*-import pandas as pdimport timeimport mysql.connector as mysqlconnectorfrom apscheduler.schedulers.blocking import BlockingSchedulerfrom sqlalchemy import create.....

    #!/usr/bin/python

    # -*- coding: UTF-8 -*-

    import pandas as pd

    import time

    import mysql.connector as mysqlconnector

    from apscheduler.schedulers.blocking import BlockingScheduler

    from sqlalchemy import create_engine

    from sqlalchemy.types import BIGINT,VARCHAR,INT,TIMESTAMP,TEXT

    def deviceInfoToHistory():

    excelFile = 'F:\\tools\\python\\Excel_20200617.xlsx'

    df = pd.read_excel(excelFile, usecols=[1,2,3,4,5,6,7,8,9,10])

    connect_info2 = 'mysql+mysqlconnector://root:123456@127.0.0.1:3306/history?charset=utf8'

    engine2 = create_engine(connect_info2) #use sqlalchemy to build link-engine

    print("连接数据库成功")

    print("write df to table 'info_history'")

    df.to_sql(name = 'info_history',

    con = engine2,

    if_exists = 'append',

    index = False,

    dtype = {'id':BIGINT(),

    'bluetooth_mac':VARCHAR(32),

    'lastest_report_time':TIMESTAMP,

    }

    )

    print("写入数据库成功")

    def job():

    print('main-start:', time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(time.time())))

    deviceInfoToHistory()

    print('main-end:', time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(time.time())))

    job()

    展开全文
  • Python处理Excel数据-pandas

    千次阅读 多人点赞 2020-12-15 20:15:41
    Python处理Excel数据-pandas篇 非常适用于大量数据的拼接、清洗、筛选及分析 在计算机编程中,pandasPython编程语言的用于数据操纵和分析的软件库。特别是,它提供操纵数值表格和时间序列的数据结构和运算操作。...
  • 假设有Excel文件data.xlsx,其中内容为现在需要将这个Excel文件中的数据读入pandas,并且在后续的处理中不关心ID列,还需要把sex列的female替换为1,把sex列的male替换为0。本文演示有关的几个操作。(1)导入pandas...
  • python读写excel文件有很多种方法:用xlrd和xlwt进行excel读写用openpyxl进行excel读写用pandas进行excel读写本文使用xlrd读取excel文件(xls,sxls格式),使用xlwt向excel写入数据一、xlrd和xlwt的安装安装很简单,...
  • 如题 python 如何读取特定sheet的excel数据 安装pandas 已经有的可以不用再安装 >pip install pandas 读取数据 首先将excel数据和代码放在一个文件夹下 import pandas as pd data = pd.read_excel('data.xlsx')...
  • 原博文2020-04-11 21:23 −使用Pandas读取excel数据如下:df_column = pd.read_excel("测试数据.xlsx",header=None)#取消默认第一行为列名print(df_column)# 自定义map函数def test_map(x): return (x+1)df_......
  • 利用Python处理Excel数据——pandas

    千次阅读 多人点赞 2020-01-20 19:06:10
    新建一个excel表格(table1.csv)用于案例讲解: 一、导库 import pandas as pd import numpy as np 二、读取数据 df = pd.read_excel('table1.xlsx') # 相对路径 # df = pd.read_excel(r'E:\Anaconda\hc\...
  • 本文实例讲述了Python3使用pandas模块读写excel操作。分享给大家供大家参考,具体如下:前言Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了...
  • Pandaspython的一个数据分析包,纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。一、创建Excel,写入数据importpandas as ...
  • 但是实际中Excel表格结构可能比较杂乱,数据会分散不同的工作表中,而且在表格中分布很乱,这种情况下啊直接使用pandas就会非常吃力。本文虫虫给大家介绍使用pandas和openpyxl读取这样的数据的方法。问题缘起pandas ...
  • 第一步:模块安装pip install pandas第二步:使用(单个工作表为例)说明:如果有多个工作表,那么只要指定sheetname=索引,(第一个工作表为0,第二个工作表为1,以此类推)pd.read_excel(io, sheetname=0,header=0...
  • python 操作Excel(2) 读取Excel——pandas、xlrd pandas xlrd pandas 简介1 pandas 是基于NumPy的一种工具,支持xls与xlsx文件格式。该工具是为了解决数据分析任务而创建的。 Series,在Pandas库中表示一...
  • python读取excel所有数据(cmd界面)cmd界面显示excel数据代码import xlrdimport osfrom prettytable import PrettyTableimport pandas#创建一个Excel表类class Excel(object):def __init__(self, path):self.path = ...
  • 平常我们在测试的过程中需要用到测试用例,那么如何用Python读取excel数据呢,以下是我所学习的过程: 一:安装第三方库 输入 win+r -----> cmd ------>输入以下pip的命令 (两个模块任选其一即可) pip ...
  • python使用pandas读xlsx文件读取前n行数据读取指定数据(指定行指定列)获取文件行号和列标题将数据转换为字典形式import pandas as pd#1.读取前n行所有数据df1=pd.read_excel('d1.xlsx')#读取xlsx中的第一个sheet...
  • Python读取excel表格并通过折线图可视化显示

    千次阅读 多人点赞 2020-03-21 22:42:25
    Python读取excel表格并通过折线图可视化显示 本文是通过pandas和matplotlib模块实现可视化的。如有不足请指正。 excel表格为 第一步 导入模块: import pandas as pd import matplotlib.pyplot as plt 第二步 ...
  • print("-"*10+"用Python如何读取数据源和熟悉数据"+"-"*10) print("哔哩哔哩Python课程,主要讲用pandas获取数据源:") print("1.导入数据\n2.熟悉数据") print('\n') print("-"*15+"1.导入数据"+"-"*15) import ...
  • import pandas as pdimport openpyxl#将excel数据读取,输出格式为dataframe格式path = r'/Users/**/PycharmProjects/class/pyclass1/others/file/学生信息表.xlsx'#sheet_name可填写1)excel中表单序号从0开始2)...
  • 前言:python操作excel表格文件的增删读写,一般需要用到的第三方库有xlwt,xlrd。xlrd负责读取excel,xlwt负责写入excel文件。这种操作方法比较繁琐,效率还不错,通俗易懂。那么有没有一种更简便,操作更简单,效率还...
  • 本地excel文件 ...#pandas模型中的read_excel方法读取excel的xlsx数据 import pandas as pd xlsx_file = "DB1.xlsx" """ # read_excel方法读取文件 xlsx_feature = pd.read_excel(xlsx_file, usecols=...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 18,412
精华内容 7,364
关键字:

python读取excel数据pandas

python 订阅