精华内容
下载资源
问答
  • 今天我们将再次以一位读者提出的真实需求来讲解如何使用Python从Excel中计算、整理数据并写入Word中,其实并不难,主要就是以下两步:openpyxl读取Excel获取内容docx读写Word文件那我们开始吧!需求确认首先来看下...

    前言

    在前几天的文章中我们讲解了如何从Word表格中提取指定数据并按照格式保存到Excel中,今天我们将再次以一位读者提出的真实需求来讲解如何使用Python从Excel中计算、整理数据并写入Word中,其实并不难,主要就是以下两步:

    openpyxl读取Excel获取内容

    docx读写Word文件

    那我们开始吧!

    需求确认

    首先来看下我们需要处理的Excel部分数据,因涉及隐私已经将数据皮卡丘化

    format,png

    可以看到数据非常多,并且还存在重复数据。而我们要做的就是对每一列的数据按照一定的规则进行计算、整理并使用Python自动填入到Word中,大致的要求如下

    format,png

    format,png

    上面仅是部分要求,真实需要填入word中的数据要更多!

    format,png

    除了对按照格式进行处理并存入Word中指定位置之外,还有一个需求:最终输出的word文件名还需要按照一定规则生成:

    format,png

    OK,需求分析完毕,接下来看Python如何解决!

    Python实现

    首先我们使用Python对该Excel进行解析

    from openpyxl import load_workbook

    import os

    # 获取桌面的路径

    def GetDesktopPath():

    return os.path.join(os.path.expanduser("~"), 'Desktop')

    path = GetDesktopPath() + '/资料/' # 形成文件夹的路径便后续重复使用

    workbook = load_workbook(filename=path + '数据.xlsx')

    sheet = workbook.active # 获取当前页

    # 可以用代码获取数据范围,如果要批处理循环迭代也方便

    # 获取有数据范围

    print(sheet.dimensions)

    # A1:W10

    利用openpyxl读取单元格有以下几种用法

    cells = sheet['A1:A4'] # 返回A1-A4的4个单元格

    cells = sheet['A'] # 获取A列

    cells = sheet['A:C'] # 获取A-C列

    cells = sheet[5] # 获取第5行

    # 注意如果是上述用cells获取返回的是嵌套元祖

    for cell in cells:

    print(cell[0].value) # 遍历cells依然需要取出元祖中元素才可以获取值

    # 获取一个范围的所有cell

    # 也可以用iter_col返回列

    for row in sheet.iter_rows(min_row=1, max_row=3,min_col=2, max_col=4):

    for cell in row:

    print(cell.value)

    明白了原理我们就可以解析获取Excel中的数据了

    # SQE

    SQE = sheet['Q2'].value

    # 供应商&制造商

    supplier = sheet['G2'].value

    # 采购单号

    C2_10 = sheet['C2:C10'] # 返回cell.tuple对象

    # 利用列表推导式后面同理

    vC2_10 = [str(cell[0].value) for cell in C2_10]

    # 用set简易去重后用,连接,填word表用

    order_num = ','.join(set(vC2_10))

    # 用set简易去重后用&连接,word文件名命名使用

    order_num_title = '&'.join(set(vC2_10))

    # 产品型号

    T2_10 = sheet['T2:T10']

    vT2_10 = [str(cell[0].value) for cell in T2_10]

    ptype = ','.join(set(vT2_10))

    # 产品描述

    P2_10 = sheet['P2:P10']

    vP2_10 = [str(cell[0].value) for cell in P2_10]

    info = ','.join(set(vP2_10))

    info_title = '&'.join(set(vP2_10))

    # 日期

    # 用datetime库获取今日时间以及相应格式化

    import datetime

    today = datetime.datetime.today()

    time = today.strftime('%Y年%m月%d日')

    # 验货数量

    V2_10 = sheet['V2:V10']

    vV2_10 = [int(cell[0].value) for cell in V2_10]

    total_num = sum(vV2_10) # 计算总数量

    # 验货箱数

    W2_10 = sheet['W2:W10']

    vW2_10 = [int(cell[0].value) for cell in W2_10]

    box_num = sum(vW2_10)

    # 生成最终需要的word文件名

    title = f'{order_num_title}-{supplier}-{total_num}-{info_title}-{time}-验货报告'

    print(title)

    通过上面的代码,我们就成功的从Excel中提取出来数据,这样Excel部分就结束了,接下来进行word的填表啦,由于这里我们默认读取的word是.docx格式的,实际上读者的需求是.doc格式文件,所以windows用户可以用如下代码批量转化doc,前提是安装好win32com

    # pip install pypiwin32

    from win32com import client

    docx_path = path + '模板.docx'

    # doc转docx的函数

    def doc2docx(doc_path,docx_path):

    word = client.Dispatch("Word.Application")

    doc = word.Documents.Open(doc_path)

    doc.SaveAs(docx_path, 16)

    doc.Close()

    word.Quit()

    print(' doc文件已转换为docx ')

    if not os.path.exists(docx_path):

    doc2docx(docx_path[:-1], docx_path)

    不过在Mac下暂时没有好的解决策略,如果有思路欢迎交流,好了有docx格式文件后我们继续操作Word部分

    docx_path = path + '模板.docx'

    from docx import Document

    # 实例化

    document = Document(docx_path)

    # 读取word中的所有表格

    tables = document.tables

    # print(len(tables))

    # 15

    确定好每个表格数后即可进行相应的填报操作,table的用法和openpyxl中非常类似,注意索引和原生python一样都是从0开始

    tables[0].cell(1, 1).text = SQE

    tables[1].cell(1, 1).text = supplier

    tables[1].cell(2, 1).text = supplier

    tables[1].cell(3, 1).text = ptype

    tables[1].cell(4, 1).text = info

    tables[1].cell(5, 1).text = order_num

    tables[1].cell(7, 1).text = time

    上面代码完成Word中这一部分表格

    format,png

    我们继续用Python填写下一个表格

    for i in range(2, 11):

    tables[6].cell(i, 0).text = str(sheet[f'T{i}'].value)

    tables[6].cell(i, 1).text = str(sheet[f'P{i}'].value)

    tables[6].cell(i, 2).text = str(sheet[f'C{i}'].value)

    tables[6].cell(i, 4).text = str(sheet[f'V{i}'].value)

    tables[6].cell(i, 5).text = str(sheet[f'V{i}'].value)

    tables[6].cell(i, 6).text = '0'

    tables[6].cell(i, 7).text = str(sheet[f'W{i}'].value)

    tables[6].cell(i, 8).text = '0'

    tables[6].cell(12, 4).text = str(total_num)

    tables[6].cell(12, 5).text = str(total_num)

    tables[6].cell(12, 7).text = str(box_num)

    format,png

    这里需要注意两个细节:

    word写入的数据需是字符串,所以从Excel获取的数据需要用str格式化

    表格可能存在合并等其他情况,因此你看到的行数和列数可能不是真实的,需要用代码不断测试。

    按照上面的办法,将之前从Excel中取出来的数据一一填充到Word中对应位置就大功告成!最后保存一下即可。

    document.save(path + f'{title}.docx')

    print(' 文件已生成')

    结束语

    回顾上面的过程,其实从需求和文件格式上看,这次文件的读写解析任务较复杂,码代码和思考时间会较久,所以当我们在考虑使用Python进行办公自动化之前需要想清楚这个问题:这次需要完成的任务是否工作量很多,或者以后长期需要进行,用Python是否可以解放双手?如果不是,实际上手动就可以完成,那么就失去了自动化办公的意义!

    注:本文使用的数据与源码可在公众号:早起Python内获取

    展开全文
  • 在前几天的文章中我们讲解了如何从Word表格中提取指定数据并按照格式保存到Excel中,今天我们将再次以一位读者提出的真实需求来讲解如何使用Python从Excel中计算、整理数据并写入Word中,其实并不难,主要就是以下两...
  • 今天我们将再次以一位读者提出的真实需求来讲解如何使用Python从Excel中计算、整理数据并写入Word中,其实并不难,主要就是以下两步:openpyxl读取Excel获取内容docx读写Word文件那我们开始吧!需求确认首先来...

    点击上方『早起Python』关注并星标公众号

    第一时间接收最新Python干货!

    前言

    在前几天的文章中我们讲解了如何从Word表格中提取指定数据并按照格式保存到Excel中,今天我们将再次以一位读者提出的真实需求来讲解如何使用Python从Excel中计算、整理数据并写入Word中,其实并不难,主要就是以下两步:openpyxl读取Excel获取内容

    docx读写Word文件

    那我们开始吧!

    需求确认

    首先来看下我们需要处理的Excel部分数据,因涉及隐私已经将数据皮卡丘化

    可以看到数据非常多,并且还存在重复数据。而我们要做的就是对每一列的数据按照一定的规则进行计算、整理并使用Python自动填入到Word中,大致的要求如下

    上面仅是部分要求,真实需要填入word中的数据要更多!

    除了对按照格式进行处理并存入Word中指定位置之外,还有一个需求:最终输出的word文件名还需要按照一定规则生成:

    OK,需求分析完毕,接下来看Python如何解决!

    Python实现

    首先我们使用Python对该Excel进行解析from openpyxl import load_workbook

    import os

    # 获取桌面的路径

    def GetDesktopPath():

    return os.path.join(os.path.expanduser("~"), 'Desktop')

    path = GetDesktopPath() + '/资料/' # 形成文件夹的路径便后续重复使用

    workbook = load_workbook(filename=path + '数据.xlsx')

    sheet = workbook.active # 获取当前页

    # 可以用代码获取数据范围,如果要批处理循环迭代也方便

    # 获取有数据范围

    print(sheet.dimensions)

    # A1:W10

    利用openpyxl读取单元格有以下几种用法cells = sheet['A1:A4'] # 返回A1-A4的4个单元格

    cells = sheet['A'] # 获取A列

    cells = sheet['A:C'] # 获取A-C列

    cells = sheet[5] # 获取第5行

    # 注意如果是上述用cells获取返回的是嵌套元祖

    for cell in cells:

    print(cell[0].value) # 遍历cells依然需要取出元祖中元素才可以获取值

    # 获取一个范围的所有cell

    # 也可以用iter_col返回列

    for row in sheet.iter_rows(min_row=1, max_row=3,min_col=2, max_col=4):

    for cell in row:

    print(cell.value)

    明白了原理我们就可以解析获取Excel中的数据了# SQE

    SQE = sheet['Q2'].value

    # 供应商&制造商

    supplier = sheet['G2'].value

    # 采购单号

    C2_10 = sheet['C2:C10'] # 返回cell.tuple对象

    # 利用列表推导式后面同理

    vC2_10 = [str(cell[0].value) for cell in C2_10]

    # 用set简易去重后用,连接,填word表用

    order_num = ','.join(set(vC2_10))

    # 用set简易去重后用&连接,word文件名命名使用

    order_num_title = '&'.join(set(vC2_10))

    # 产品型号

    T2_10 = sheet['T2:T10']

    vT2_10 = [str(cell[0].value) for cell in T2_10]

    ptype = ','.join(set(vT2_10))

    # 产品描述

    P2_10 = sheet['P2:P10']

    vP2_10 = [str(cell[0].value) for cell in P2_10]

    info = ','.join(set(vP2_10))

    info_title = '&'.join(set(vP2_10))

    # 日期

    # 用datetime库获取今日时间以及相应格式化

    import datetime

    today = datetime.datetime.today()

    time = today.strftime('%Y年%m月%d日')

    # 验货数量

    V2_10 = sheet['V2:V10']

    vV2_10 = [int(cell[0].value) for cell in V2_10]

    total_num = sum(vV2_10) # 计算总数量

    # 验货箱数

    W2_10 = sheet['W2:W10']

    vW2_10 = [int(cell[0].value) for cell in W2_10]

    box_num = sum(vW2_10)

    # 生成最终需要的word文件名

    title = f'{order_num_title}-{supplier}-{total_num}-{info_title}-{time}-验货报告'

    print(title)

    通过上面的代码,我们就成功的从Excel中提取出来数据,这样Excel部分就结束了,接下来进行word的填表啦,由于这里我们默认读取的word是.docx格式的,实际上读者的需求是.doc格式文件,所以windows用户可以用如下代码批量转化doc,前提是安装好win32com# pip install pypiwin32

    from win32com import client

    docx_path = path + '模板.docx'

    # doc转docx的函数

    def doc2docx(doc_path,docx_path):

    word = client.Dispatch("Word.Application")

    doc = word.Documents.Open(doc_path)

    doc.SaveAs(docx_path, 16)

    doc.Close()

    word.Quit()

    print(' doc文件已转换为docx ')

    if not os.path.exists(docx_path):

    doc2docx(docx_path[:-1], docx_path)

    不过在Mac下暂时没有好的解决策略,如果有思路欢迎交流,好了有docx格式文件后我们继续操作Word部分docx_path = path + '模板.docx'

    from docx import Document

    # 实例化

    document = Document(docx_path)

    # 读取word中的所有表格

    tables = document.tables

    # print(len(tables))

    # 15

    确定好每个表格数后即可进行相应的填报操作,table的用法和openpyxl中非常类似,注意索引和原生python一样都是从0开始tables[0].cell(1, 1).text = SQE

    tables[1].cell(1, 1).text = supplier

    tables[1].cell(2, 1).text = supplier

    tables[1].cell(3, 1).text = ptype

    tables[1].cell(4, 1).text = info

    tables[1].cell(5, 1).text = order_num

    tables[1].cell(7, 1).text = time

    上面代码完成Word中这一部分表格

    我们继续用Python填写下一个表格for i in range(2, 11):

    tables[6].cell(i, 0).text = str(sheet[f'T{i}'].value)

    tables[6].cell(i, 1).text = str(sheet[f'P{i}'].value)

    tables[6].cell(i, 2).text = str(sheet[f'C{i}'].value)

    tables[6].cell(i, 4).text = str(sheet[f'V{i}'].value)

    tables[6].cell(i, 5).text = str(sheet[f'V{i}'].value)

    tables[6].cell(i, 6).text = '0'

    tables[6].cell(i, 7).text = str(sheet[f'W{i}'].value)

    tables[6].cell(i, 8).text = '0'

    tables[6].cell(12, 4).text = str(total_num)

    tables[6].cell(12, 5).text = str(total_num)

    tables[6].cell(12, 7).text = str(box_num)

    这里需要注意两个细节:word写入的数据需是字符串,所以从Excel获取的数据需要用str格式化

    表格可能存在合并等其他情况,因此你看到的行数和列数可能不是真实的,需要用代码不断测试。

    按照上面的办法,将之前从Excel中取出来的数据一一填充到Word中对应位置就大功告成!最后保存一下即可。document.save(path + f'{title}.docx')

    print(' 文件已生成')

    结束语

    回顾上面的过程,其实从需求和文件格式上看,这次文件的读写解析任务较复杂,码代码和思考时间会较久,所以当我们在考虑使用Python进行办公自动化之前需要想清楚这个问题:这次需要完成的任务是否工作量很多,或者以后长期需要进行,用Python是否可以解放双手?如果不是,实际上手动就可以完成,那么就失去了自动化办公的意义!

    往期精选(?猛戳可查看)

    展开全文
  • 今天我们将再次以一位读者提出的真实需求来讲解如何使用Python从Excel中计算、整理数据并写入Word中,其实并不难,主要就是以下两步:openpyxl读取Excel获取内容docx读写Word文件那我们开始吧!需...

    点击上方早起Python』关注并星标公众号

    第一时间接收最新Python干货!

    a687e4a41d134567f91c71742e97cb69.png

    前言

    在前几天的文章中我们讲解了如何从Word表格中提取指定数据并按照格式保存到Excel中,今天我们将再次以一位读者提出的真实需求来讲解如何使用Python从Excel中计算、整理数据并写入Word中,其实并不难,主要就是以下两步:
    • openpyxl读取Excel获取内容

    • docx读写Word文件

    那我们开始吧!

    需求确认

    首先来看下我们需要处理的Excel部分数据,因涉及隐私已经将数据皮卡丘化

    34590e6571b7090dac4763f48053ca4e.png

    可以看到数据非常多,并且还存在重复数据。而我们要做的就是对每一列的数据按照一定的规则进行计算、整理并使用Python自动填入到Word中,大致的要求如下

    0ae0c0692768e9434e2c24d2533c0388.png

    a88da0ac8bb82727c743f0cc9987302b.png

    上面仅是部分要求,真实需要填入word中的数据要更多!

    9b4605f792bb16374069db14f5399801.png

    除了对按照格式进行处理并存入Word中指定位置之外,还有一个需求:最终输出的word文件名还需要按照一定规则生成:

    36f1b7393f05cf753bc414a0fb2b3477.png

    OK,需求分析完毕,接下来看Python如何解决!

    Python实现

    首先我们使用Python对该Excel进行解析

    from openpyxl import load_workbook
    import os
    # 获取桌面的路径
    def GetDesktopPath():
        return os.path.join(os.path.expanduser("~"), 'Desktop')

    path = GetDesktopPath() + '/资料/' # 形成文件夹的路径便后续重复使用
    workbook = load_workbook(filename=path + '数据.xlsx')
    sheet = workbook.active # 获取当前页
    # 可以用代码获取数据范围,如果要批处理循环迭代也方便
    # 获取有数据范围
    print(sheet.dimensions)
    # A1:W10

    利用openpyxl读取单元格有以下几种用法

    cells = sheet['A1:A4']  # 返回A1-A4的4个单元格
    cells = sheet['A'# 获取A列
    cells = sheet['A:C'# 获取A-C列
    cells = sheet[5# 获取第5行
    # 注意如果是上述用cells获取返回的是嵌套元祖
    for cell in cells:
        print(cell[0].value) # 遍历cells依然需要取出元祖中元素才可以获取值
    # 获取一个范围的所有cell
    # 也可以用iter_col返回列
    for row in sheet.iter_rows(min_row=1, max_row=3,min_col=2, max_col=4):
        for cell in row:
            print(cell.value)

    明白了原理我们就可以解析获取Excel中的数据了

    # SQE
    SQE = sheet['Q2'].value
    # 供应商&制造商
    supplier = sheet['G2'].value
    # 采购单号
    C2_10 = sheet['C2:C10'# 返回cell.tuple对象
    # 利用列表推导式后面同理
    vC2_10 = [str(cell[0].value) for cell in C2_10]
    # 用set简易去重后用,连接,填word表用
    order_num = ','.join(set(vC2_10))
    # 用set简易去重后用&连接,word文件名命名使用
    order_num_title = '&'.join(set(vC2_10))
    # 产品型号
    T2_10 = sheet['T2:T10']
    vT2_10 = [str(cell[0].value) for cell in T2_10]
    ptype = ','.join(set(vT2_10))
    # 产品描述
    P2_10 = sheet['P2:P10']
    vP2_10 = [str(cell[0].value) for cell in P2_10]
    info = ','.join(set(vP2_10))
    info_title = '&'.join(set(vP2_10))
    # 日期
    # 用datetime库获取今日时间以及相应格式化
    import datetime
    today = datetime.datetime.today()
    time = today.strftime('%Y年%m月%d日')
    # 验货数量
    V2_10 = sheet['V2:V10']
    vV2_10 = [int(cell[0].value) for cell in V2_10]
    total_num = sum(vV2_10) # 计算总数量
    # 验货箱数
    W2_10 = sheet['W2:W10']
    vW2_10 = [int(cell[0].value) for cell in W2_10]
    box_num = sum(vW2_10)
    # 生成最终需要的word文件名
    title = f'{order_num_title}-{supplier}-{total_num}-{info_title}-{time}-验货报告'
    print(title)
    通过上面的代码,我们就成功的从Excel中提取出来数据,这样Excel部分就结束了,接下来进行word的填表啦,由于这里我们默认读取的word是.docx格式的,实际上读者的需求是.doc格式文件,所以windows用户可以用如下代码批量转化doc,前提是安装好win32com
    # pip install pypiwin32
    from win32com import client
    docx_path = path + '模板.docx'
    # doc转docx的函数
    def doc2docx(doc_path,docx_path):
        word = client.Dispatch("Word.Application")
        doc = word.Documents.Open(doc_path)
        doc.SaveAs(docx_path, 16)
        doc.Close()
        word.Quit()
        print('\n doc文件已转换为docx \n')
    if not os.path.exists(docx_path):
        doc2docx(docx_path[:-1], docx_path)
    不过在Mac下暂时没有好的解决策略,如果有思路欢迎交流,好了有docx格式文件后我们继续操作Word部分

    docx_path = path + '模板.docx'
    from docx import Document
    # 实例化
    document = Document(docx_path)
    # 读取word中的所有表格
    tables = document.tables
    # print(len(tables))
    # 15
    确定好每个表格数后即可进行相应的填报操作,table的用法和openpyxl中非常类似,注意索引和原生python一样都是从0开始
    tables[0].cell(11).text = SQE
    tables[1].cell(11).text = supplier
    tables[1].cell(21).text = supplier
    tables[1].cell(31).text = ptype
    tables[1].cell(41).text = info
    tables[1].cell(51).text = order_num
    tables[1].cell(71).text = time

    上面代码完成Word中这一部分表格

    8314ad37f85bec04b531953a594b935f.png

    我们继续用Python填写下一个表格

    for i in range(211):
        tables[6].cell(i, 0).text = str(sheet[f'T{i}'].value)
        tables[6].cell(i, 1).text = str(sheet[f'P{i}'].value)
        tables[6].cell(i, 2).text = str(sheet[f'C{i}'].value)
        tables[6].cell(i, 4).text = str(sheet[f'V{i}'].value)
        tables[6].cell(i, 5).text = str(sheet[f'V{i}'].value)
        tables[6].cell(i, 6).text = '0'
        tables[6].cell(i, 7).text = str(sheet[f'W{i}'].value)
        tables[6].cell(i, 8).text = '0'

    tables[6].cell(124).text = str(total_num)
    tables[6].cell(125).text = str(total_num)
    tables[6].cell(127).text = str(box_num)

    f627b51d01f82b3a0617baf4f2e1b6e9.png

    这里需要注意两个细节
    • word写入的数据需是字符串,所以从Excel获取的数据需要用str格式化

    • 表格可能存在合并等其他情况,因此你看到的行数和列数可能不是真实的,需要用代码不断测试。

    按照上面的办法,将之前从Excel中取出来的数据一一填充到Word中对应位置就大功告成!最后保存一下即可。
    document.save(path + f'{title}.docx')
    print('\n文件已生成')

    结束语

    回顾上面的过程,其实从需求和文件格式上看,这次文件的读写解析任务较复杂,码代码和思考时间会较久,所以当我们在考虑使用Python进行办公自动化之前需要想清楚这个问题:这次需要完成的任务是否工作量很多,或者以后长期需要进行,用Python是否可以解放双手?如果不是,实际上手动就可以完成,那么就失去了自动化办公的意义!

    注:本文使用的数据与源码可在后台回复自动化获取

    6dd10fecf28f8a72c9f4ad30d269bf60.png

    想学Python自动化测试?可以阅读下面的书,点赞+转发包邮送一本~b6e96ca2b783737662db702976a35a79.png

    往期精选(?猛戳可查看)47ea4f26e316e315a75ba788adcddad2.gifPython两招轻松爬取美团评论47ea4f26e316e315a75ba788adcddad2.gifNumPy进阶修炼|基础47ea4f26e316e315a75ba788adcddad2.gifNumPy进阶修炼|入门47ea4f26e316e315a75ba788adcddad2.gif用Python唱一首程序员版“惊雷”47ea4f26e316e315a75ba788adcddad2.gif重庆火锅哪家强,Python帮你探探店47ea4f26e316e315a75ba788adcddad2.gif玩转数据处理120题重制说明与下载

    47ea4f26e316e315a75ba788adcddad2.gifMatplotlib进阶修炼|实战

    63003afab008bf10189ad35caff9a395.png先有收获,再点在看!1f136faf768610268599d8fb09cd037a.gif
    展开全文
  • 在前几天的文章中我们讲解了如何从Word表格中提取指定数据并按照格式保存到Excel中,今天我们将再次以一位读者提出的真实需求来讲解如何使用Python从Excel中计算、整理数据并写入Word中,其实并不难,主要就是以下两...

    前言

    在前几天的文章中我们讲解了如何从Word表格中提取指定数据并按照格式保存到Excel中,今天我们将再次以一位读者提出的真实需求来讲解如何使用Python从Excel中计算、整理数据并写入Word中,其实并不难,主要就是以下两步:

    • openpyxl读取Excel获取内容
    • docx读写Word文件

    那我们开始吧!

    需求确认

    首先来看下我们需要处理的Excel部分数据,因涉及隐私已经将数据皮卡丘化
    在这里插入图片描述
    可以看到数据非常多,并且还存在重复数据。而我们要做的就是对每一列的数据按照一定的规则进行计算、整理并使用Python自动填入到Word中,大致的要求如下
    在这里插入图片描述
    上面仅是部分要求,真实需要填入word中的数据要更多!
    在这里插入图片描述
    除了对按照格式进行处理并存入Word中指定位置之外,还有一个需求:最终输出的word文件名还需要按照一定规则生成:
    在这里插入图片描述

    Python实现

    首先我们使用Python对该Excel进行解析

    from openpyxl import load_workbook
    import os
    # 获取桌面的路径
    def GetDesktopPath():
        return os.path.join(os.path.expanduser("~"), 'Desktop')
    
    path = GetDesktopPath() + '/资料/' # 形成文件夹的路径便后续重复使用
    workbook = load_workbook(filename=path + '数据.xlsx')
    sheet = workbook.active # 获取当前页
    # 可以用代码获取数据范围,如果要批处理循环迭代也方便
    # 获取有数据范围
    print(sheet.dimensions)
    # A1:W10
    

    利用openpyxl读取单元格有以下几种用法

    cells = sheet['A1:A4']  # 返回A1-A4的4个单元格
    cells = sheet['A'] # 获取A列
    cells = sheet['A:C'] # 获取A-C列
    cells = sheet[5] # 获取第5行
    # 注意如果是上述用cells获取返回的是嵌套元祖
    for cell in cells:
        print(cell[0].value) # 遍历cells依然需要取出元祖中元素才可以获取值
    # 获取一个范围的所有cell
    # 也可以用iter_col返回列
    for row in sheet.iter_rows(min_row=1, max_row=3,min_col=2, max_col=4):
        for cell in row:
            print(cell.value)
    

    明白了原理我们就可以解析获取Excel中的数据了

    # SQE
    SQE = sheet['Q2'].value
    # 供应商&制造商
    supplier = sheet['G2'].value
    # 采购单号
    C2_10 = sheet['C2:C10'] # 返回cell.tuple对象
    # 利用列表推导式后面同理
    vC2_10 = [str(cell[0].value) for cell in C2_10]
    # 用set简易去重后用,连接,填word表用
    order_num = ','.join(set(vC2_10))
    # 用set简易去重后用&连接,word文件名命名使用
    order_num_title = '&'.join(set(vC2_10))
    # 产品型号
    T2_10 = sheet['T2:T10']
    vT2_10 = [str(cell[0].value) for cell in T2_10]
    ptype = ','.join(set(vT2_10))
    # 产品描述
    P2_10 = sheet['P2:P10']
    vP2_10 = [str(cell[0].value) for cell in P2_10]
    info = ','.join(set(vP2_10))
    info_title = '&'.join(set(vP2_10))
    # 日期
    # 用datetime库获取今日时间以及相应格式化
    import datetime
    today = datetime.datetime.today()
    time = today.strftime('%Y年%m月%d日')
    # 验货数量
    V2_10 = sheet['V2:V10']
    vV2_10 = [int(cell[0].value) for cell in V2_10]
    total_num = sum(vV2_10) # 计算总数量
    # 验货箱数
    W2_10 = sheet['W2:W10']
    vW2_10 = [int(cell[0].value) for cell in W2_10]
    box_num = sum(vW2_10)
    # 生成最终需要的word文件名
    title = f'{order_num_title}-{supplier}-{total_num}-{info_title}-{time}-验货报告'
    print(title)
    

    通过上面的代码,我们就成功的从Excel中提取出来数据,这样Excel部分就结束了,接下来进行word的填表啦,由于这里我们默认读取的word是.docx格式的,实际上读者的需求是.doc格式文件,所以windows用户可以用如下代码批量转化doc,前提是安装好win32com

    # pip install pypiwin32
    from win32com import client
    docx_path = path + '模板.docx'
    # doc转docx的函数
    def doc2docx(doc_path,docx_path):
        word = client.Dispatch("Word.Application")
        doc = word.Documents.Open(doc_path)
        doc.SaveAs(docx_path, 16)
        doc.Close()
        word.Quit()
        print('\n doc文件已转换为docx \n')
    if not os.path.exists(docx_path):
        doc2docx(docx_path[:-1], docx_path)
    

    不过在Mac下暂时没有好的解决策略,如果有思路欢迎交流,好了有docx格式文件后我们继续操作Word部分

    docx_path = path + '模板.docx'
    from docx import Document
    # 实例化
    document = Document(docx_path)
    # 读取word中的所有表格
    tables = document.tables
    # print(len(tables))
    # 15
    

    确定好每个表格数后即可进行相应的填报操作,table的用法和openpyxl中非常类似,注意索引和原生python一样都是从0开始

    tables[0].cell(1, 1).text = SQE
    tables[1].cell(1, 1).text = supplier
    tables[1].cell(2, 1).text = supplier
    tables[1].cell(3, 1).text = ptype
    tables[1].cell(4, 1).text = info
    tables[1].cell(5, 1).text = order_num
    tables[1].cell(7, 1).text = time
    

    上面代码完成Word中这一部分表格
    在这里插入图片描述
    我们继续用Python填写下一个表格

    for i in range(2, 11):
        tables[6].cell(i, 0).text = str(sheet[f'T{i}'].value)
        tables[6].cell(i, 1).text = str(sheet[f'P{i}'].value)
        tables[6].cell(i, 2).text = str(sheet[f'C{i}'].value)
        tables[6].cell(i, 4).text = str(sheet[f'V{i}'].value)
        tables[6].cell(i, 5).text = str(sheet[f'V{i}'].value)
        tables[6].cell(i, 6).text = '0'
        tables[6].cell(i, 7).text = str(sheet[f'W{i}'].value)
        tables[6].cell(i, 8).text = '0'
    
    tables[6].cell(12, 4).text = str(total_num)
    tables[6].cell(12, 5).text = str(total_num)
    tables[6].cell(12, 7).text = str(box_num)
    

    在这里插入图片描述
    这里需要注意两个细节:

    • word写入的数据需是字符串,所以从Excel获取的数据需要用str格式化
    • 表格可能存在合并等其他情况,因此你看到的行数和列数可能不是真实的,需要用代码不断测试。

    按照上面的办法,将之前从Excel中取出来的数据一一填充到Word中对应位置就大功告成!最后保存一下即可。

    document.save(path + f'{title}.docx')
    print('\n文件已生成')
    

    参考链接 :
    Python办公自动化(二)|从Excel到Word :https://mp.weixin.qq.com/s/4VsLT6bVax5CPtTt4kCF4Q

    展开全文
  • 在前几天的文章中我们讲解了如何从Word表格中提取指定数据并按照格式保存到Excel中,今天我们将再次以一位读者提出的真实需求来讲解如何使用Python从Excel中计算、整理数据并写入Word中,其实并不难,主要就是以下两...
  • 今天我们将再次以一位读者提出的真实需求来讲解如何使用Python从Excel中计算、整理数据并写入Word中,其实并不难,主要就是以下两步:openpyxl读取Excel获取内容docx读写Word文件那我们开始吧!需求确认首先来看下...
  • 相信大家对Excel并不陌生,因为但凡了解Windows系统的童鞋,都知道WordExcel、PowerPoint是Windows的办公软件中最最常用的软件。但是大家对VBA了解的就会少很多,因为这个属于Excel的高级使用项目,对于喜欢写自动...
  • 最近刚接触python,找点小任务来...这个项目做了整整有一年,其中的开了无数次会议,定了无数次方案,所以也形成了大大小小的很多个文件(图纸,电子表格,word文档,图像)。现在的任务就是要一个很大文件夹中找出...
  • 全书分为6篇25章,介绍了Excel数据处理与分析方面的应用技巧,内容涉及Excel工作环境和基本操作、数据的输入和导入、数据整理和编辑、数据查询、分类汇总和合并计算等方面的使用技巧,以及数据透视表、模拟运算表、...
  • excel文件后台代码

    2015-10-08 15:20:00
    很多情况下,我们都需要从Excel获取数据来创建Word报表文档。首先在Excel中分析数据,然后将分析结果导出到Word文档中发布。技术实现方式:1、创建Word模板,用来作为数据分析结果发布平台。在Word模板中,在每个...
  • Excel技巧大全

    2015-05-06 07:21:37
    5. 将Word中的内容作为图片链接插入Excel表格中 30 6. 在独立的窗口中处理内嵌式图表 31 7. 在图表中显示隐藏数据 31 8. 在图表中增加文本框 31 9. 建立文本与图表文本框的链接 31 10. 给图表增加新数据系列 31 11. ...
  • Excel百宝箱

    2012-10-27 17:09:21
    【插入Flash动画】:将Flash动画插入工作表中并播放,自动获取Flash大小,可以自定义Flash的大小和位置,Flash动画嵌入工作表中 【提取Flash文件】:将嵌入Excel或者Word中的Flash文件提取出来,保存为Swf文件 【播放...
  • Excel VBA实用技巧大全 附书源码

    热门讨论 2010-10-08 18:59:24
    04092获取数据区域的最后一列列号 04093获取数据区域的最前一列列号 04094获取单元格的任何显示值 04095获取单元格的显示字符串 04096获取单元格文本字符串的一部分(之一) 04097获取单元格文本字符串的一部分(之...
  • Excel_VBA教程

    2014-09-22 11:36:34
    7.从EXCEL执行ACCESS任务 336 8.创建新ACCESS数据库 336 9.打开ACCESS窗体 338 10.打开ACCESS报表 343 11.运行ACCESS查询 345 12.运行选择查询 347 13.运行参数查询 348 14.调用ACCESS函数 350 15.获取ACCESS数据到...
  • Excel百宝箱8.0

    2011-06-07 21:32:17
    【生成系统图标】【获取内置命令】【修复Excel】【破解VBA密码】【删除空单元格】【转置选区】【按列倒置】【按列倒置】【字母大小写转换】【小写金额转大写】【大写金额转小写】【区域数据加密】【多区域复制】【按...
  • 109. 将WORD中的内容作为图片链接插入EXCEL表格中 61 110. 在独立的窗口中处理内嵌式图表 62 111. 在图表中显示隐藏数据 62 112. 在图表中增加文本框 63 113. 建立文本与图表文本框的链接 63 114. 给图表增加新数据...
  • Excel百宝箱9.0无限制破解版

    热门讨论 2012-02-03 19:05:29
    【插入Flash动画】:将Flash动画插入工作表中并播放,自动获取Flash大小,可以自定义Flash的大小和位置,Flash动画嵌入工作表中 【提取Flash文件】:将嵌入Excel或者Word中的Flash文件提取出来,保存为Swf文件 【播放...
  • 5. 将WORD中的内容作为图片链接插入EXCEL表格中 30 6. 在独立的窗口中处理内嵌式图表 31 7. 在图表中显示隐藏数据 31 8. 在图表中增加文本框 31 9. 建立文本与图表文本框的链接 31 10. 给图表增加新数据系列 31 11. ...
  • EXCEL集成工具箱V6.0

    2010-09-11 01:44:37
    隐藏选项卡,这个插件还模拟了一个Excel2003样式的菜单,目的就是方便那些从Excel2003转向使用2007或2010版的朋友使用。 ===================================================================================...
  • 12.1.5 在PowerPoint中创建图表,从Excel中复制数据 284 12.2 在网上展示图表 285 12.3 将图表导出为图形 286 12.3.1 使用VBA将图表导出为图像 286 12.3.2 使用Snag-it或OneNote捕获图表 286 12.3.3 将...
  • 12.1.5 在PowerPoint中创建图表,从Excel中复制数据 284 12.2 在网上展示图表 285 12.3 将图表导出为图形 286 12.3.1 使用VBA将图表导出为图像 286 12.3.2 使用Snag-it或OneNote捕获图表 286 12.3.3 将...
  • 109. 将WORD中的内容作为图片链接插入EXCEL表格中 61 110. 在独立的窗口中处理内嵌式图表 62 111. 在图表中显示隐藏数据 62 112. 在图表中增加文本框 63 113. 建立文本与图表文本框的链接 63 114. 给图表增加新数据...
  • 【插入Flash动画】:将Flash动画插入工作表中并播放,自动获取Flash大小,可以自定义Flash的大小和位置,Flash动画嵌入工作表中 【提取Flash文件】:将嵌入Excel或者Word中的Flash文件提取出来,保存为Swf文件 ...
  • 1、RPA自动从40—50个数据来源获取Excel、PDF、Word等格式文件 2、RPA自动检测这些数据的格式,不符合标准的文件将转化为用户设定的文件格式 3、RPA将转化后的数据自动录入到指定的系统中 4、最后RPA通过发布系统,...
  • 中文版Excel.2007图表宝典 2/2

    热门讨论 2012-04-06 19:01:36
    7.9.1 获取数据/209 7.9.2 创建选项按钮控件/209 7.9.3 创建城市列表/210 7.9.4 创建图表的数据区域/210 7.9.5 创建图表/211 第8章 图表制作方法和技巧/213 8.1 在图表中添加线条和背景/213 8.1.1 在图表中添加水平...
  •  ·自动控制功能强大的Excel工具:数据透视表、图表和高级筛选;  ·自动完成重复的任务;  ·使用自定义对话框创建Excel应用程序;  ·快速生成数百个Exoel个报表;  ·了解Exce12007中的变化对VBA宏的影响。 ...
  • 【生成斜线表头】Excel没有Word那样的斜线表头工具,本工具可以弥补此不足。包括单线、双线可选 【百家姓与字母序列】运行后可以在单元格中进行百家姓与字母填充,提升录入速度 【一键隐藏非使用区】对空白区域瞬间...

空空如也

空空如也

1 2 3 4 5 ... 7
收藏数 129
精华内容 51
关键字:

word自动从excel获取数据