精华内容
下载资源
问答
  • 将文本文档无法分割排列的数据自动转换成excel表格形式 转换成excel表格,条码扫描
  • EXCEL表格转换text文档,丢失格式
  • 如何将excel表格整体_转换word文档 如何将excel表格整体_转换word文档
  • 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时...希望能转换为下面这种格式的excel表格: 测试word文档读取 先测试一个word文档前1页的数据读取: from docx import ..

    本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

    作者:小小明

    来源:菜J学Python

    Python爬虫、数据分析、网站开发等案例教程视频免费在线观看

    https://space.bilibili.com/523606542

    需求

    有一个下面这种形式的word表格:

    如何用Python将Word文档转换为Excel表格

     

    希望能转换为下面这种格式的excel表格:

    如何用Python将Word文档转换为Excel表格

     

    测试word文档读取

    先测试一个word文档前1页的数据读取:

    from docx import Document
    
    doc = Document("编号02 质检员高级技师(一级)理论试卷.docx")
    for i, paragraph in enumerate(doc.paragraphs[:55]):
        print(i, paragraph.text)

    如何用Python将Word文档转换为Excel表格

     

    从读取效果上看,各行文本数据都能很顺利的获取到。

    匹配题型、题目和具体的选项

    现在我们需要做的是就是匹配题型、题目和具体的选项,观察可以发现规律:

    1. 题型以大写数字开头
    2. 题目以普通数字+.开头
    3. 选项以括号+字母开头

    额外需要注意的:

    开头几行文本也存在普通数字+.开头的,需要直接排除。

    第7题的题目,和第19题的选项存在一些特殊的空白字符需要排除,

    括号和小数点都同时存在半角和全角两种情况。

    对于需要注意的第二点:

    如何用Python将Word文档转换为Excel表格

     

    查看一下这2处的空白字符:

    doc.paragraphs[21].text

    '7.(\xa0\xa0)是第一家实施六西格玛管理的公司。\xa0'

    doc.paragraphs[49].text

    '(A)参数设计 (B)常量设计\u3000 (C)变量设计\u3000\u3000 (D)系统设计'

    发现分别是\xa0和\u3000。

    整理好大致思路,我组织一下处理代码:

    import re
    from docx import Document
    
    doc = Document("编号02 质检员高级技师(一级)理论试卷.docx")
    
    black_char = re.compile("[\s\u3000\xa0]+")
    
    chinese_nums_rule = re.compile("[一二三四]、(.+?)\(")
    title_rule = re.compile("\d+.")
    option_rule = re.compile("\([ABCDEF]\)")
    option_rule_search = re.compile("\([ABCDEF]\)[^(]+")
    
    
    # 从word文档的“一、单项选择题”开始遍历数据
    for paragraph in doc.paragraphs[5:25]:
        #  去除空白字符,将全角字符转半角字符,并给括号之间调整为中间二个空格
        line = black_char.sub("", paragraph.text).replace(
            "(", "(").replace(")", ")").replace(".", ".").replace("()", "(  )")
        # 对于空白行就直接跳过
        ifnot line:
            continue
        if title_rule.match(line):
            print("题目", line)
        elif option_rule.match(line):
            print("选项", option_rule_search.findall(line))
        else:
            chinese_nums_match = chinese_nums_rule.match(line)
            if chinese_nums_match:
                print("题型", chinese_nums_match.group(1))

    如何用Python将Word文档转换为Excel表格

     

    从目前测试结果来看没有问题。

    保存匹配到的数据到结构化字典

    现在我打算将当前匹配出来的文本数据存储成字典形式的结构化数据,字典结构的设计如下:

    如何用Python将Word文档转换为Excel表格

     

    根据上述设计完善代码:

    import re
    from docx import Document
    from collections import OrderedDict
    
    doc = Document("编号02 质检员高级技师(一级)理论试卷.docx")
    
    black_char = re.compile("[\s\u3000\xa0]+")
    
    chinese_nums_rule = re.compile("[一二三四]、(.+?)\(")
    title_rule = re.compile("\d+.")
    option_rule = re.compile("\([ABCDEF]\)")
    option_rule_search = re.compile("\([ABCDEF]\)[^(]+")
    
    # 保存最终的结构化数据
    question_type2data = OrderedDict()
    # 从word文档的“一、单项选择题”开始遍历数据
    for paragraph in doc.paragraphs[5:]:
        #  去除空白字符,将全角字符转半角字符,并给括号之间调整为中间一个空格
        line = black_char.sub("", paragraph.text).replace(
            "(", "(").replace(")", ")").replace(".", ".").replace("()", "(  )")
        # 对于空白行就直接跳过
        ifnot line:
            continue
        if title_rule.match(line):
            options = title2options.setdefault(line, [])
        elif option_rule.match(line):
            options.extend(option_rule_search.findall(line))
        else:
            chinese_nums_match = chinese_nums_rule.match(line)
            if chinese_nums_match:
                question_type = chinese_nums_match.group(1)
                title2options = question_type2data.setdefault(question_type, OrderedDict())
    

    遍历结构化字典并存储

    然后我们遍历结构化字典,将数据保存到pandas对象中:

    import pandas as pd
    
    result = []
    max_options_len = 0
    for question_type, title2options in question_type2data.items():
        for title, options in title2options.items():
            result.append([question_type, title, *options])
            options_len = len(options)
            if options_len > max_options_len:
                max_options_len = options_len
    df = pd.DataFrame(result, columns=[
                      "题型", "题目"]+[f"选项{i}"for i in range(1, max_options_len+1)])
    # 题型可以简化下,去掉选择两个字
    df['题型'] = df['题型'].str.replace("选择", "")
    df.head()
    

    结果:

    如何用Python将Word文档转换为Excel表格

     

    最终保存结果:

    df.to_excel("result.xlsx", index=False)

    完整代码

    最终完整代码:

    import pandas as pd
    import re
    from docx import Document
    from collections import OrderedDict
    
    doc = Document("编号02 质检员高级技师(一级)理论试卷.docx")
    
    black_char = re.compile("[\s\u3000\xa0]+")
    
    chinese_nums_rule = re.compile("[一二三四]、(.+?)\(")
    title_rule = re.compile("\d+.")
    option_rule = re.compile("\([ABCDEF]\)")
    option_rule_search = re.compile("\([ABCDEF]\)[^(]+")
    
    # 保存最终的结构化数据
    question_type2data = OrderedDict()
    # 从word文档的“一、单项选择题”开始遍历数据
    for paragraph in doc.paragraphs[5:]:
        #  去除空白字符,将全角字符转半角字符,并给括号之间调整为中间一个空格
        line = black_char.sub("", paragraph.text).replace(
            "(", "(").replace(")", ")").replace(".", ".").replace("()", "(  )")
        # 对于空白行就直接跳过
        ifnot line:
            continue
        if title_rule.match(line):
            options = title2options.setdefault(line, [])
        elif option_rule.match(line):
            options.extend(option_rule_search.findall(line))
        else:
            chinese_nums_match = chinese_nums_rule.match(line)
            if chinese_nums_match:
                question_type = chinese_nums_match.group(1)
                title2options = question_type2data.setdefault(
                    question_type, OrderedDict())
    
    result = []
    max_options_len = 0
    for question_type, title2options in question_type2data.items():
        for title, options in title2options.items():
            result.append([question_type, title, *options])
            options_len = len(options)
            if options_len > max_options_len:
                max_options_len = options_len
    df = pd.DataFrame(result, columns=[
                      "题型", "题目"]+[f"选项{i}"for i in range(1, max_options_len+1)])
    # 题型可以简化下,去掉选择两个字
    df['题型'] = df['题型'].str.replace("选择", "")
    df.to_excel("result.xlsx", index=False)
    

    最终得到的文件:

    如何用Python将Word文档转换为Excel表格

    展开全文
  • Excel表格完美转换word文档,非常实用
  • XML文件怎么转换成Excel表格文件

    千次阅读 2020-12-09 19:52:23
    XML文件怎么转换成Excel表格文件?如何将XML文件转换Excel?当我们需要将XML文件转换Excel文件时,该怎么操作才能将其变成Excel表格文件呢,XML文件怎么转换成Excel表格文件,下面就和小编一起来看看吧! 1、...

    XML文件怎么转换成Excel表格文件?如何将XML文件转换成Excel?当我们需要将XML文件转换成Excel文件时,该怎么操作才能将其变成Excel表格文件呢,XML文件怎么转换成Excel表格文件,下面就和小编一起来看看吧!

    1、首先打开需要转为Excel文件的XML文件所在文件夹位置;

    XML文件怎么转换成Excel表格文件

    2、再打开一个Excel表格文件,以Microsoft Excel为例,新建一个Excel文件;

    XML文件怎么转换成Excel表格文件

    3、然后拖动XML文件到Excel表格中;

    XML文件怎么转换成Excel表格文件

    4、接着在弹出的“打开友链XML”窗口中,选择其中一项,根据自己的需求进行选择;

    XML文件怎么转换成Excel表格文件

    5、点击【确定】之后就可以将XML文件转换成Excel文件了,在进行修改和保存之后,就可以得到一个Excel文件(.xlsx);

    XML文件怎么转换成Excel表格文件

    展开全文
  • 怎样可以把excel表格转换word文档

    千次阅读 2016-08-18 11:38:34
    通常只是需要excel的部分数据内容时,直接通过复制,然后粘贴到word文档中即可,但是如果需要将excel表格所以内容都转换word,那么复制操作就比较麻烦了,那么怎样可以快速将excel表格转换word文档呢?...

      在处理一些文档时,有时会遇到需要将excel表格内容全部放到word文档中,通常只是需要excel的部分数据内容时,直接通过复制,然后粘贴到word文档中即可,但是如果需要将excel表格所以内容都转换成word,那么复制操作就比较麻烦了,那么怎样可以快速将excel表格转换成word文档呢?


      通过文档的转换工具,可以将excel格式直接转为word文档,而且是将excel工作簿中的所有表格同时进行转换。
      首先在转换器中选择文件转word的转换类型,通过这个选项可以把我们常见的excel,ppt以及pdf文件转换成为word文档的格式。
      选择了转换的类型,就将需要转换的excel表格添加到转换器中,如果excel表格是打开的,那么需要将表格先关闭后,在添加到转换器。
      添加了转换的文件,选择好文件的输出目录,点开始转换,文件就会很快输出成一个PDF文件。可以在输出目录中找到,直接打开使用。


      还有就是手动将excel转换成为word文档,这种方法一次只能对excel工作簿中的一个工作表进行转换。首先打开excel表格,选择另存为,在另存为选项中选择保存的格式html的网页文件。保存后关闭该文件。
      接着用word打开刚刚另存为的网页文件。在打开窗口里,将文件类型选择为所有,就可以找到刚刚的保存的网页文件进行打开了。
      打开文件后,选择另存为命令,在保存的文件类型中设置为word类型的文档,然后保存就可以了。
    注意事项

      两种方法转换后的word文档在排版样式上是有很大差别的,这个需要根据情况来选择合适的转换方法。

    查看详细图片介绍:如何将excel表格快速转换成word文档

    展开全文
  • 如何将图片转成Excel表格

    千次阅读 2019-09-24 21:34:40
    abbyy finereader是款功能强大的OCR文字识别软件,我一般用来将截图转成Excel表格或者将图片转成Excel表格。 2. 截图转Excel表格 打开ABBYY Screenshot Reader 捕捉可以选择区域,然后点击右侧的转换图标。 ...

    1. 按

    ABBYY FineReader是款功能强大的OCR文字识别软件,我一般用其将截图转成Excel表格或者将图片转成Excel表格。

    2. 截图转Excel表格

    • 打开ABBYY Screenshot Reader
      在这里插入图片描述
    • 捕捉可以选择区域,然后点击右侧的转换图标。
      在这里插入图片描述
    • 选择表格所在的区域,然后按回车就行了。
      在这里插入图片描述

    3. 图片转Excel表格

    4. 工具下载和安装

    ABBYY FineReader 14.0.107.232 Enterprise:https://www.cnblogs.com/coco56/p/11577003.html

    展开全文
  • 如何将excel表格转换word文档.zip
  • 轻松将Excel表格完美转换Word文档.docx
  • 如何将excel表格转换word文档.doc 如何将excel表格转换word文档? Excel强大的制表功能让很多办公一族都忘不了它的方便与实用。可是在一些情况下,我们必须将Excel表格转换Word文档。当前普遍的做法是:先用...
  • TXT文本数据转换成Excel表格

    千次阅读 2020-03-05 10:42:53
    TXT文本数据转换成Excel表格  打开EXCEL-数据——获取外部数据——导入文本文件——找到文件点导入——选择分隔符号——下一步——(逗号打勾,空格打勾,其他打勾) ...
  • 记事本文档转成excel

    千次阅读 2020-12-17 15:44:30
    不知道大家的习惯是怎样的,我经常会需要记录的文字写在记事本文档里。但是,由于需要计算数据又要用到excel。比如下图: 我想算出总的价格,这个时候就要用到EXCEL了,但是常规复制到excel,之会占用A1的位置...
  • Word技巧\如何将excel表格转换word文档
  • 平时我们接触的pdf文件就有文档类、表格类、还有图文格式的,其中最麻烦的要数表格类了,因为是数据所以在转换的时候比较容易出错,那么我们怎么完整的将pdf转换成excel表格呢? 将pdf转换excel我选择用PDF转换...
  • 那该怎么版呢,毕竟excel表格与word是两种不同的格式,虽然excel表格内容可以直接复制到word中,但是如果内容较多,处理起来就没那么简单了,那除此之外如何将做好的excel表格转换word文档?  直接将表格转换...
  • Python实现Word表格转成Excel表格

    千次阅读 2019-07-22 15:59:16
    # 只能处理列数一致的表格,不一致的请在word文档下行) # 中处理好后,再运行程序 ws['A1'] = '国家' ws['B1'] = '专利号' ws['C1'] = '自己设置' ws['D1'] = '懂?' ws['E1'] = '5' ws['F1'] = '6' ws['G1'] =...
  • 如何将word文档转换成excel格式

    千次阅读 2016-08-19 14:32:39
    excel它直观清晰,处理数据时很方便,所以对于比较中要的表格文件,如果出现在word中,我们都会想办法将其转换excel,那么怎样word转换成excel表格格式呢? 今天我们不讲复制粘贴的方法,而是分享一种不易...
  • 有时为了日常工作的需求,可能会需要将表格转成其他格式的文档,比如Word,那么Excel应该如何操作才能转换Word文档呢?一起来看看。 方法1:首先用极速表格打开Excel文档后,点击文件选项卡中的另存为,或使用...
  • 如何批量将word转换成excel表格

    千次阅读 2016-10-18 15:40:45
    转换前的准备:批量将word转换成excel纯手动肯定是不行的,我们要先安装迅捷pdf转换器到我们的电脑中;安装好转换工具之后就可以开始转换了, 第一步:打开工具选择转换格式:文件转excel; 第二步:选择好
  • 如何将PDF表单转换成Excel表格

    千次阅读 2018-10-12 16:14:18
    静态PDF表单是没有交互元素的传统PDF文档,它带有空白横线和文本框,但我们无法直接点击进行填写。另一种PDF表单是交互式PDF表单,用于阅读PDF的用户与PDF所有者或PDF版权拥有者之间进行互动交流。 表单应用 在...
  • java List集合转Excel表格文档

    千次阅读 2017-10-20 11:31:24
    前阵子有朋友问我java将excel转成文档的方法,而最近公司刚好有个需求需要将数据转成excel文档。所以我就写了一个工具类,将数据对象转成excel文档。考虑到可能要传入不同类型的对象集合。为了能配合我那个朋友使用...
  • 如何pdf文件转换为excel表格

    千次阅读 2019-01-30 17:30:27
    可是pdf文件却无法直接进行编辑修改,当把excel表格转化为pdf文件进行保存,而查阅该文件时发现表格中的数据内容出现了错误需要修改。此时就又需要将pdf文件转换为excel表格,才可进行编辑修改表格内容。下面的文章...
  • 功能:word转换excel转换器是一款将word文件转换为Excel表格文件,操作灰常的方便。有了word转换excel转换器,您可以方便的将word文档转换为Excel表格,非常方便的将word里的表格文字、
  • 如何将对象转换成Excel表格输出?

    千次阅读 2018-07-21 13:34:13
    它提供了一组操纵Windows文档的Java API 目前比较成熟的是HSSF接口,处理MS Excel(97-2002)对象。它不象我们仅仅是用csv生成的没有格式的可以由Excel转换的东西,而是真正的Excel对象,你可以控制一些属性如shee....
  • 将长表格图片转Excel表格

    万次阅读 多人点赞 2021-07-07 00:43:00
    大家好,我是小小明。...现在希望将其识别后转成Excel表格。 经查询两张图片的分辨率分别为791×7616和791×7531,可见其长度非常宽。 百度AI接口 首先我们进入百度AI,查看开放能力-》文字识别-》表格文字识别: ...
  • 怎么把excel表格转换word格式

    千次阅读 2016-05-17 15:05:36
    工作中难免会有需要将Excel表格转换Word文档的时候,可能大多数人的做法是直接将excel表格复制到word里,可是粘到Word后表的格式全变了,还得重新进行调整格式,这也太麻烦了,所以今天小编叫大家可以直接转换并且...
  • 怎样PDF转换成Excel

    2014-07-21 15:10:35
    有了PDFExcel转换器,您可以方便的将PDF文档转换为EXCEL表格进行编辑,计算或者汇总。 因为有些PDF文档,只有部分页面含有表格。PDFExcel转换器支持设定转换页面范围,可以转换您所需要的PDF部分页面到EXCEL表格...
  • 把excel转换pdf表格的两种方法

    千次阅读 2016-04-20 15:49:52
    对于经常接触Office文档的用户,将编辑好的Excel数据表格转换纸质感的PDF电子书,是非常常见的做法,即便是这样很多转换问题还是让大家很烦恼,比如转换后的文件不完整,乱码,格式错乱等问题,那么怎样才能完美将...
  • 一款经典的dbf 转换为excel 表格的软件。经典,精悍,朴实无华。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 53,788
精华内容 21,515
关键字:

怎么把文档转成excel表格