精华内容
下载资源
问答
  • 场景:我正在尝试编写一个python代码,它读取给定文件夹的所有工作簿,获取每个工作簿的数据并将其放入单个数据(每个工作簿都成为一个数据框,因此我可以单独操作它们)。在问题1:对于此代码,即使我使用了...

    场景:我正在尝试编写一个python代码,它读取给定文件夹中的所有工作簿,获取每个工作簿的数据并将其放入单个数据帧中(每个工作簿都成为一个数据框,因此我可以单独操作它们)。在

    问题1:对于此代码,即使我使用了正确的路径和文件类型,我仍然会收到错误:File "", line 14, in

    f = open(file,'r')

    FileNotFoundError: [Errno 2] No such file or directory: '(1)Copy of

    Preisanfrage_17112016.xlsx'

    问题2:我创建不同数据帧的原因是每个工作簿都有一个单独的格式(行是我的标识符,列是日期)。我的问题是,有些工作簿在名为“Closing”或“Opening”的工作表上有数据,或者没有指定名称。因此,我将尝试单独配置每个数据帧,然后将它们连接起来。在

    问题3:考虑到数据帧数据已经统一后的最终输出,我的目标是以如下格式输出它们:

    ^{pr2}$

    Obs1:对于输出,并非所有日期都具有相同的标识符数组。在

    问题1:您知道代码为什么会产生此错误吗?有没有更好的方法从excel中提取数据?在

    问题2:是否可以为每个工作表创建一个唯一的数据帧?这是个好做法吗?在

    问题3:我可以使用循环进行这种类型的输出吗?这是个好做法吗?在

    Obs2:我不知道这有多重要,但我使用的是python3.6和Anaconda。在

    目前为止的代码:import pandas as pd

    import numpy as np

    import matplotlib.pyplot as plt

    import glob, os

    import datetime as dt

    from datetime import datetime

    import matplotlib as mpl

    directory = os.path.join("C:\\","Users\\Dgms\\Desktop\\final 2")

    for root,dirs,files in os.walk(directory):

    for file in files:

    print(file)

    f = open(file,'r')

    df1 = pd.read_excel(file)

    展开全文
  • 今天小编就为大家分享一篇利用pythonExcel中的特定数据提取并写入新表的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • python从excel中读取数据

    千次阅读 2020-02-11 19:46:01
    读取excel表格数据需要用到xlrd或者openpyxl模块,所以先安装xlrd/openpyxl:直接pip install xird/openpyxl xlrd和openpyxl区别: 1.xlrd能处理的最大行数为65535,超过这个行数的文件就需要用到ope...

    https://www.cnblogs.com/xiaobaixiaobai/p/10724829.html参考文献

    读取excel表格数据需要用到xlrd或者openpyxl模块,所以先安装xlrd/openpyxl:直接pip install xird/openpyxl

    xlrd和openpyxl区别:

        1.xlrd能处理的最大行数为65535,超过这个行数的文件就需要用到openpyxl,openpyxl最大支持1048576行

        2.openpyxl不支持xls格式文件

    xlrd模块常用方法介绍:

        打开excl文件:s = xlrd.open_workbook(“文件路径”)

        获取表格:s.sheets()[0] = s.sheet_by_index(0)  获取第一张表格;  注意:下标值是从0开始

                         s.sheet():获取所以表单的索引

                          sheet = s.sheet_by_name("表名") 获取指定表名的表 

        获取表格的总行数:sheet.nrows

        获取表格的总列数:sheet.ncols

        获取指定行的数据:sheet.row_values(下标值),sheet.row_values(0,1,3)表示从去第2,3,4行的值

        获取指定行的数据:sheet.col_values(下标值)

        获取指定单元格数据:sheet.cell(a,b).value  a表示行的下标值,b表示列的下标值;两者可以调换位置;注意:不加.value取出的值前面会带个text的东西

    下边是完整的一个实例

    import requests
    import bs4
    import re
    import time
    import xlwt
    import xlrd
    import telnetlib
    import urllib 
    from bs4 import BeautifulSoup
    from urllib import request
    from urllib.request import urlopen
    from my_fake_useragent import UserAgent 
    xlsx_path='D:/AA/b.xls'
    data_xsls = xlrd.open_workbook(xlsx_path)
    sheet_name = data_xsls.sheets()[0]
    count_nrows = sheet_name.nrows  #获取总行数
    datalist = []
    for i in range(1,count_nrows):
        a=sheet_name.cell(i,1).value  #根据行数来取对应列的值,并添加到字典中
        datalist.append(a)
    print(datalist[0])

     

    展开全文
  • 常用的表格数据存储文件格式——CSV,Microsoft Excel,Google ExcelPython通常称为粘合语言。...本文的学习内容:谷歌表格中提取数据从CSV文件中提取数据从Excel文件中提取数据本文适用于以下读者...

    常用的表格数据存储文件格式——CSV,Microsoft Excel,Google Excel 。

    6aac44c81443532028e2af9741128920.jpg-wh_651x-s_374195308.jpg

    Python通常称为粘合语言。这个名称归因于人们逐渐开发出的大量接口库和特征,也得益于广泛的使用和良好的开源社区。这些接口库和特征能直接访问不同的文件格式,还可以访问数据源如数据库、网页和各种API。

    本文的学习内容:

    从谷歌表格中提取数据

    从CSV文件中提取数据

    从Excel文件中提取数据

    本文适用于以下读者:

    Python初学者

    必须定期处理数据的人员

    由于本文附有代码,建议处在开发环境之下(建议使用JupyterNotebook / Lab),并建立一个新的笔记本。

    源代码和文件:https://github.com/FBosler/Medium-Data-Extraction

    解决方法

    本文将带你进入一个虚构但却可能异常熟悉的场景。你可以结合不同的数据来源去创建报告或进行分析。

    注意!!!下面的示例和数据纯属虚构。

    假设,你的任务是搞清楚如何提高销售团队的业绩。假设潜在的客户有相当自发的需求。这种情况发生时,销售团队将订单导入系统。然后,销售代表们会在订单交付时安排一个会议。具体日期有时在交付期之前,有时在交付期之后。你的销售代表有一笔费用预算,会在开会期间支付餐费。他们负责报销这笔费用,并将发票交给会计团队处理。在潜在客户决定是否要接受报价后,销售代表会跟踪订单是否达成。

    可使用以下三个资料来源进行分析:

    100,000 份订单 (Google表格)

    约50,000张餐费发票(Excel文件)

    负责公司及销售代表名单(CVS文件)

    获取谷歌表格数据

    访问谷歌表格是这三种方法中最复杂的,因为你需要在使用谷歌表格API前设置一些证书。理论上,你可以获取一个公开可用的谷歌表(即提取源HTML代码)但必须使用Beautiful Soup之类的工具进行大量数据操作,才能将HTML转储转换为有用的内容。我确实尝试过,但是结果很糟糕,不值得一试。所以,API就是如此。此外,还将使用gspread无缝转换数据分析DataFrame。

    获取OAuth2证书

    前往谷歌开发人员控制台,创建一个新项目(或选择现有的项目)。点击“创建项目”。如果公司使用谷歌邮件,可将其更改为私人帐户,以避免潜在的权限冲突。

    bfc9c0d9dac32e740424b2ba9f999823.jpeg

    为项目命名(名称无关紧要,此处将其命名为媒体数据提取)。

    b1cef62f4117ba7c93c7bde34450fdf8.jpeg

    点击APIs & Services ,前往library。

    e9f32c720b93aa91b2579e5ce35c60d8.jpeg

    启用谷歌Sheets API。单击结果,并在如下页面上单击启用 API。

    cf83ec2167cbcbd126bf887bb3d77f68.jpeg

    创建一个服务帐户和密钥文件。服务帐户是用于程序访问的专用帐户,访问权限有限。服务帐户可以而且应该通过有尽可能多的特定权限项目进行设置,当前的任务也需要如此。

    befdda34c48de7040304f6f52da17c9a.jpeg

    创建JSON(另一种文件格式)密钥文件。在角色上,选择“Project -> Viewer”。

    e85fc9d47512e223ac2dbe4d18f8a7b9.jpeg

    如果还没有在前面的步骤中设置角色请立即设置。

    6d9f7300f8f84bd5e522d9a37cdee703.jpeg

    注意:设置为“Viewer”会存在一些限制。如果希望以编程方式创建谷歌表格,则必须选择不同的设置。

    然后,私有JSON密钥文件就可以下载或自动下载了。建议将该文件重命名为'Medium_Data_Extraction_Key,并将文件移动到JupyterNotebook文件夹中,以便与下面的示例无缝衔接。JSON文件包含最近创建的服务帐户证书。

    非常好,就要成功了。

    下载数据

    首先,必须下载并安装其他软件包,在笔记本中运行以下命令。

    !pip install gspread

    !pip install oauth2client

    其次,如果还没有移动密钥文件的话,必须确保将之前创建的JSON密钥文件移动到目前运行的木星笔记本(Jupyternotebook)文件夹中。或者,可以指定一个不同的GOOGLE_KEY_FILE路径。

    fromoauth2client.service_account import ServiceAccountCredentials

    import gspread

    import pandas aspd

    scope = [

    'https://www.googleapis.com/auth/spreadsheets',

    ]

    GOOGLE_KEY_FILE='Medium_Data_Extraction_Key.json'

    credentials = ServiceAccountCredentials.from_json_keyfile_name(GOOGLE_KEY_FILE, scope)

    gc = gspread.authorize(credentials)

    wokbook_key ='10HX66PbcGDvx6QKM8DC9_zCGp1TD_CZhovGUbtu_M6Y'

    workbook = gc.open_by_key(wokbook_key)

    sheet = workbook.get_worksheet(0)

    values= sheet.get_all_values()

    sales_data = pd.DataFrame(values[1:],columns=values[0])

    WORKBOOK_KEY是为本章内容准备的谷歌表格的工作簿id。

    WORKBOOK_KEY = '10HX66PbcGDvx6QKM8DC9_zCGp1TD_CZhovGUbtu_M6Y'

    这份工作簿是公开的,如果想下载不同的数据,需要更改WORKBOOK_KEY。URL有问题的话,id通常可以在谷歌表格的最后两个反斜杠之间找到。

    获取CSV数据

    可以从repo以传统方式下载CSV数据,也可以使用以下代码片段进行下载。同样地,可能需要在笔记本上安装并运行缺失的请求包:

    !pip install requests

    import requests

    url ='https://raw.githubusercontent.com/FBosler/Medium-Data-Extraction/master/sales_team.csv'

    res = requests.get(url, allow_redirects=True)

    withopen('sales_team.csv','wb') asfile:

    file.write(res.content)

    sales_team = pd.read_csv('sales_team.csv')

    CSV数据的美妙之处在于Python /panda可以立即进行处理。Excel则需要额外的库。

    获取Excel数据

    在开始之前,很可能还要安装openpyxl和xlrd,这能让Pandas也可以打开Excel表。

    !pip install openpyxl

    !pip install xlrd

    完成这些步骤之后,可以相同的方式获得Excel数据,并将其加载到另一个DataFrame中。

    url ='https://github.com/FBosler/Medium-Data-Extraction/blob/master/invoices.xlsx?raw=true'

    res = requests.get(url, allow_redirects=True)

    withopen('invoices.xlsx','wb') asfile:

    file.write(res.content)

    invoices = pd.read_excel('invoices.xlsx')

    大功告成!已经创建了三个不同的Pandas数据帧,并且可以在同一个Jupyter notebook中进行访问:

    sales_data

    sales_team

    invoices

    【编辑推荐】

    【责任编辑:华轩 TEL:(010)68476606】

    点赞 0

    展开全文
  • 主要介绍了Python实现读写sqlite3数据库并将统计数据写入Excel的方法,涉及Python针对sqlite3数据库的读取及Excel文件相关操作技巧,需要的朋友可以参考下
  • pythonexcel数据提取到word

    千次阅读 多人点赞 2020-02-17 01:55:29
    pythonexcel数据提取到word 工作可能需要将excel中数据批量生成word,今天分享将excel数据提取,然后生成word数据的方法 先看要求,将当前目录下(定值回执统计表.xlsx)表格的每一行数据按照word模板生成...

    python将excel数据提取到word

    工作中可能需要将excel中的数据批量生成word,今天分享将excel数据提取,然后生成word数据的方法。
    先看要求,将当前目录下(定值回执统计表.xlsx)表格中的每一行数据按照word模板生成word,并保存到当前目录,文件命名按照当天日期+定值回执单.docx。

    在这里插入图片描述按照要求生成如下表格的word
    在这里插入图片描述
    **python版本 3.8.6925.0
    pycharm版本 193.6015.41
    废话不多说,代码如下:

    from docx import Document   #功能是打开文档
    from docx.enum.text import WD_ALIGN_PARAGRAPH  # 功能是对齐
    from docx.shared import Pt #设置磅数
    from docx.oxml.ns import qn  #负责中文格式  以上是每次使用word要使用的库
    from docx.shared import Cm   #调整行高和列宽
    import xlrd
    #from docx.shared import Inches   #设置图片格式
    import time  #需要导入时间
    year =  time.strftime("%Y")
    today = time.strftime("%Y{y}%m{m}%d{d}",time.localtime()).format(y='年',m='月',d='日')  #可以更具需求任意修改中间的内容,带式不能显示中文,通过formate可以实现显示中文
    
    document = Document()   #初始化文档
    document.styles['Normal'].font.name = u'仿宋'  #设置整个文档的字体
    document.styles['Normal'].font.size = Pt(12)   #设置文档磅号
    document.styles['Normal'].element.rPr.rFonts.set(qn('w:esatAsia'),u'仿宋')  #设置文档的基础中文字体,否则显示中文有问题
    
    #document.add_picture('1.PNG',width=Inches(6))    #插入图片,设置图片尺寸
    
    xlsx = xlrd.open_workbook('定值回执统计表.xlsx')
    sheetname = xlsx.sheet_names()[0]
    sheet_c = xlsx.sheet_by_index(0)
    
    for i in range(1,sheet_c.nrows):
        date0 = sheet_c.row_values(i)
    
        P1 = document.add_paragraph()  #增加一个自然段
        P1.alignment = WD_ALIGN_PARAGRAPH.CENTER  #对其方式为居中,不设置默认左对齐
    
        run1 = P1.add_run('%s年度XXX电网继电保护定值回执单'%year)    #增加自然段的内容
        run1.font.name = '仿宋'  #设置自然段的字体
        run1.element.rPr.rFonts.set(qn('w:eastAsia'),u'仿宋')  #为显示中文正确
        run1.font.size =Pt(20)  #设置中文字体磅数
        run1.font.bold = True    #设置加粗
        P1.space_after = Pt(5)  #段前的距离
        P1.space_before = Pt(5)  #段后的距离
    
        table = document.add_table(rows=6,cols=8,style='Table Grid')  #表示6行5列,style 使用word使用word自带格式
        table.run1 = table.cell(0,0).paragraphs[0].add_run('定值单编号:')  #对于合并后的单元格,table(0,0),使用当中的任何一个单元格都可以
        table.run1.font.name = u'仿宋'
        table.run1.element.rPr.rFonts.set(qn('w:eastAisa'),u'仿宋')
        table.cell(0,0).paragraphs[0].aligment =WD_ALIGN_PARAGRAPH.CENTER   #设置表格内容居中
        table.cell(0,0).width = Cm(2)  #设置单元格列宽
        table.cell(0,1).width = Cm(2)
        table.cell(0,2).width = Cm(4)
        table.cell(0,3).width = Cm(1)
        table.cell(0,4).width = Cm(3)
        table.cell(0,5).width = Cm(3)
        table.cell(0,6).width = Cm(1)
        table.cell(0,7).width = Cm(4)
    
        table.rows[0].height = Cm(1)   #设置行高
        table.rows[1].height = Cm(1)
        table.rows[2].height = Cm(3)
        table.rows[3].height = Cm(3)
        table.rows[4].height = Cm(8)
        table.rows[5].height = Cm(2)
    
        table.cell(0,0).merge(table.cell(0,1))  #对第1行进行合并,第0行第0列合并到第0行第5列
        table.cell(0,3).merge(table.cell(0,4))
        table.cell(0,5).merge(table.cell(0,6))
        table.cell(1,0).merge(table.cell(1,1))  #对第1行进行合并,第0行第0列合并到第0行第5列
        table.cell(1,3).merge(table.cell(1,4))
        table.cell(1,5).merge(table.cell(1,6))
        table.cell(2,0).merge(table.cell(4,0))
        table.cell(2,4).merge(table.cell(2,5))
        table.cell(3,1).merge(table.cell(3,7))
        table.cell(4,2).merge(table.cell(4,7))
        table.cell(5,3).merge(table.cell(5,4))
        table.cell(5,5).merge(table.cell(5,6))
    
        table.cell(0,0).text = '通知单编号'
        table.cell(0,2).text = '受令单位'
        table.cell(0,3).text = '设备地址'
        table.cell(0,5).text = '设备名称'
        table.cell(0,7).text = '完成时间'
        table.cell(2,0).text = '内容'
        table.cell(2,1).text = '保护型号'
        table.cell(2,3).text = '版本号'
        table.cell(2,6).text = 'CT变比'
        table.cell(4,1).text = '与定值单不符内容'
        table.cell(5,0).text = '调试人员'
        table.cell(5,2).text = '班组审核'
        table.cell(5,5).text = '中心审核'
    
        table.cell(1,0).text = date0[0]    #开始打印cecel表格中的内容
        table.cell(1,2).text = date0[1]
        table.cell(1,3).text = date0[2]
        table.cell(1,5).text = date0[3]
        table.cell(1,7).text = date0[4]
        table.cell(2,2).text = date0[5]
        table.cell(2,4).text = date0[6]
        table.cell(2,7).text = date0[7]
        table.cell(3,1).text = date0[8]
        table.cell(4,2).text = date0[9]
        table.cell(5,1).text = date0[10]
        document.add_page_break()  #作用是插入分页符
    
    document.save('%s定值回执单.docx'%today)

    PS:刚接触python,看了几天视频,照猫画虎结果算是出来了结果,肯定还有更好的方法,后期继续研究。
    存在的问题:字体设置感觉不太合适,表格的大小还需要进一步进行优化。2020年2月17日留作纪念。

    展开全文
  • 代码用于读Excel中数据,然后批量写进word,文件的读写有专门的类,对于批量处理excel很有帮助
  • python读写excel练习资料,使用python3.6.2,提供给用户做更好的练习使用
  • python如何读取excel数据

    千次阅读 2020-11-30 21:04:27
    python读取excel数据的方法:首先安装Excel读取数据的库xlrd;然后获取Excel文件的位置并且读取进来;接着读取指定的行和列的内容,并将内容存储在列表;最后运行程序即可。python读取excel数据的方法:1、...
  • windows下,使用pythonExcel中数据批量导出到Word模板生成新的文件
  • Python处理Excel文件主要是第三方模块库xlrd、xlwt、pyexcel-xls、xluntils和pyExcelerator,以及win32com和openpyxl模块,此外Pandas也带有可以读取Excel文件的模块(read_excel)。基于扩展知识的目的,我们使用xl...
  • 一,要读取的数据的格式:二,数据读取部分:b站视频参考:https://www.bilibili.com/video/BV14C4y1W7Nj?t=148# 1930workbook=xlrd.open_workbook('1930.xlsx')sheet= workbook.sheet_by_index(0)A1=[]B1=[]# sheet....
  • 今天小编就为大家分享一篇Python从Excel中读取日期一列的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • 主要介绍了Python读取Excel数据并生成图表过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
  • 主要介绍了Python导入数值型Excel数据并生成矩阵操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • inputfile = 'pile.xls' # excel名字 data_obj = xlrd.open_workbook(inputfile) table = data_obj.sheet_by_name(u'gk001_05') # 打开页标签sheet first_value = table.col_values(0) # 第一列数据,索引 second_....
  • Pythonexcel表格操作,数据提取分析

    千次阅读 2021-10-26 09:57:16
    自己编写了一些表格的操作方法,只需传入表格路径和表的位置,就能在根据自己使用的方法展示不同类型的数据如:字典,列表,字典里套列表,列表里套列表,查询最大行数,在指定的行数插入数据等,有疑问欢迎评论 ...
  • 1.从excel读取数据并保存,使用的是xlrd库,使用前先导入 def sign_time(): data = xlrd.open_workbook("F:\\selenium\\IRS\\data\\testexcel\\kq.xls") # 打开excel,路径注意是双斜杠 sheet = data.sheet_by_...
  • /usr/bin/env python3 # coding: utf-8 from tqdm import tqdm import xlrd tiqu = [] workbook=xlrd.open_workbook('daitiqu.xls') sheet=workbook.sheets()[0] #第B列 for i in range(1,691): tiqu.append(sheet...
  • 主要介绍了Python实现提取XML内容并保存到Excel中的方法,涉及Python针对xml文件的读取、解析以及Excel文件的写入、保存等相关操作技巧,需要的朋友可以参考下
  • 今天小编就为大家分享一篇python3读取excel文件只提取某些行某些列的值方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • 处理数据是covid-19数据数据时间2020.1.22至2020.4.3,数据量大,有八九万条数据,如果只是手动提取,费时费力。采用编程代码的方式可以节省人力物力,仅需几秒即可搞定!!!代码如下,仅供参考 #使用前请修改...
  • 主要介绍了python读取并定位excel数据坐标系详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
  • 需要分割第一个表格的机型,提取客户公司信息到第二个表格 实现效果 from openpyxl import load_workbook #1,读取工作表 wb = load_workbook("data\机型名称.xlsx") ws = wb.active #2,读取并拆分需要的...
  • 想着通过简单的方式,并且快速提取数据,就想到了Pythonpython操作Excel使用的openyxl和pandas对Excel进行操作。代码如下:#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time : 2020-02-24 下...
  • Python从PDF中提取表格

    2020-01-04 17:52:54
    使用Python的pdfplumber模块PDF指定的各个页面中提取对应的表格,全部存入pandas的DataFrame。将表格不关注的行列删除后,保存到Excel电子表格。 源码将STM32规格书指定封装的引脚表提取Excel中,方便...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 21,204
精华内容 8,481
关键字:

python从excel中提取数据

python 订阅