精华内容
下载资源
问答
  • Python处理Word文档(.doc/.docx)——批量获取文档标题并以标题重命名文件 由于工作需要处理一批.doc文档,并且需要核对每个文档的标题,以标题重命名文件,之后将word文档批量转换成pdf。人工完成这些内容再文档...

    Python处理Word文档(.doc/.docx)——批量获取文档标题并以标题重命名文件

    由于工作需要处理一批.doc文档,并且需要核对每个文档的标题,以标题重命名文件,之后将word文档批量转换成pdf。人工完成这些内容再文档数量庞大的情况下耗时耗力,于是写了几个脚本来处理。

    需要安装python-docx,pywin32库。

    doc2docx.py

    Python有专门读取.docx的模块python_docx(只能读取.docx文件,不能读取.doc文件),因为只能处理docx文件,所以需要将doc转换成docx格式(直接修改文件后缀名是无效的呃。)

    import os
    from docx import Document 
    from docx.shared import Inches
    from win32com import client as wc
    word = wc.Dispatch("Word.Application")
    
    ul=r"D:\\docs\\sec-report\\test" #需要处理的文件所在文件夹目录
    filenamelist=os.listdir(ul)
    for y in xrange(len(filenamelist)): #for循环处理整个目录下的文件
        doc = word.Documents.Open(ul+"\\"+filenamelist[y])	
        rename=os.path.splitext(filenamelist[y]) #将文件名和后缀分割,用rename[0]只取文件名
        doc.SaveAs("D:\\docs\\sec-report\\test"+"\\"+"t"+rename[0]+".docx", 12) #12表示docx格式
    doc.Close()
    word.Quit() 
    

    getparagrahs.py

    获取word文档中的所有段落或者某一段落。

    #coding=utf-8
    import os
    import sys
    import docx
    import codecs
    from docx import Document 
    from docx.shared import Inches
    from win32com import client as wc
    reload(sys) #读取中文
    sys.setdefaultencoding("utf-8")
    word = wc.Dispatch("Word.Application")
    ul=r"D:\\docs\\sec-report\\test" 
    filenamelist=os.listdir(ul)
    for y in xrange(len(filenamelist)):
        doc = docx.Document(ul+"\\"+filenamelist[y])
        print (doc.paragraphs[0].text)
    

    getdoctitleAndrename.py

    获取word文档的标题,并以标题命名文件。

    from docx.shared import Inches
    from win32com import client as wc
    reload(sys)
    sys.setdefaultencoding("utf-8")
    word=wc.Dispatch("Word.Application")
    ul=r"D:\\docs\\sec-report\\test"#需要处理的文件所在文件夹目录
    filenamelist=os.listdir(ul)
    for y in xrange(len(filenamelist)):
        doc = word.Documents.Open(ul+"\\"+filenamelist[y])#为了使用SaveAs方法
        doc2=docx.Document(ul+"\\"+filenamelist[y])#为了使用paragraphs方法
        for p in doc2.paragraphs:
        	if p.style.name=="Title":#匹配文档格式,获取文档标题,Title改成Heading 1则获取一级标题
        		rename=p.text
        		print (filenamelist[y]+"重命名为:"+rename)
        		doc.SaveAs("D:\\docs\\sec-report\\test"+"\\"+rename+".docx", 12)
    doc.Close()
    word.Quit()
    
    展开全文
  • 支持按照文件夹去批量处理,也可以单独一个文件进行处理,并且可以自定义标识符 最近在开发一个答题类的小程序,到了录入试题进行测试的时候了,发现一个问题,试题都是word文档格式的,每份有100题左右,拿到的第一...
  • python实实现现word文文档档批批量量转转成成自自定定义义格格式式的的excel文文档档的的思思路路及及实实例例代代码码 这篇文章主要介绍了python实现word文档批量转成自定义格式的excel文档的解决思路及实例代码...
  • 支持按照文件夹去批量处理,也可以单独一个文件进行处理,并且可以自定义标识符 最近在开发一个答题类的小程序,到了录入试题进行测试的时候了,发现一个问题,试题都是word文档格式的,每份有100题左右,拿到的第一...
  • python处理word

    2020-04-23 09:53:09
    Python处理word主要用到下面两个库: 1.Python-docx 创建和更新word文档,适用新建word文档并编辑内容 官方文档 示例1 示例2 docxtpl 以模板方式快速填充word内容,适用基于相同模板批量生成word文档 docxtpl官方...

    Python处理word主要用到下面两个库:

    1.Python-docx

    创建和更新word文档,适用新建word文档并编辑内容
    官方文档
    示例1
    示例2

    docxtpl

    以模板方式快速填充word内容,适用基于相同模板批量生成word文档
    docxtpl官方文档
    Jinjia2模板
    最基本的示例
    使用Jinjia2语法示例
    word中excel示例

    展开全文
  • #同时修改好几个word文档,转换特定的内容 import re import docx doc1=docx.Document('example.docx') spam=['后勤','技术','行政'] for j in spam:  doc2=docx.Document()  for i in range(0,len(doc1....
  • python处理word转pdf

    2020-11-09 16:40:49
    当实现word文档转换未pdf格式时,单个文档单次执行没有任何问题,但是当将一个文件夹下的目录进行批量转换时,遇到报错: Traceback (most recent call last): File "e:/workspace/python/wordtopdf.py", line 33,...

    当实现word文档转换未pdf格式时,单个文档单次执行没有任何问题,但是当将一个文件夹下的目录进行批量转换时,遇到报错:

    Traceback (most recent call last):
      File "e:/workspace/python/wordtopdf.py", line 33, in <module>
        createpdf(filepath,pdfpath)
      File "e:/workspace/python/wordtopdf.py", line 9, in createpdf
        doc=word.Documents.Open(wordPath,ReadOnly=1)
      File "C:\Users\user1\AppData\Local\Programs\Python\Python38\lib\site-packages\win32com\client\__init__.py", line 474, in __getattr__
        return self._ApplyTypes_(*args)
      File "C:\Users\user1\AppData\Local\Programs\Python\Python38\lib\site-packages\win32com\client\__init__.py", line 467, in _ApplyTypes_
        self._oleobj_.InvokeTypes(dispid, 0, wFlags, retType, argTypes, *args),
    pywintypes.com_error: (-2147023174, 'RPC 服务器不可用。', None, None)

    解决方法:

    from time import sleep

    sleep(2) #在循环中加上这条代码

    原因:由于循环,当文件读写速度较快的时候,上一个word未关闭,下一个就打开,导致出现以上问题。

    代码:

    #pywin32,pip install pywin32
    from win32com.client import constants,gencache
    import os
    from time import sleep
    
    def createpdf(wordPath,pdfPath):
        word=gencache.EnsureDispatch("Word.Application")
        doc=word.Documents.Open(wordPath,ReadOnly=1)
        #转换方法
        doc.ExportAsFixedFormat(pdfPath,constants.wdExportFormatPDF)
        word.Quit()
    
    #单个文件转换
    # createpdf("E:/workspace/python/info.docx","E:/workspace/python/info.pdf")
    
    #多个文件转换
    # print(os.listdir(".")) #当前文件夹下面的所有文件
    wordfiles=[]
    for file in os.listdir("."):
        if file.endswith((".doc",".docx")):
            wordfiles.append(file)
    print(wordfiles)
    
    for file in wordfiles:
        filepath=os.path.abspath(file)
        index=filepath.rindex(".")
        pdfpath=filepath[:index]+".pdf"
        print(filepath)
        print(pdfpath)
        createpdf(filepath,pdfpath)
        sleep(2) 

     

    展开全文
  • #同时修改好几个word文档,转换特定的内容 import reimport docxdoc1=docx.Document('example.docx')spam=['后勤','技术','行政']for j in spam:  doc2=docx.Document()  for i in range(0,len(doc1.paragraphs))...

    #同时修改好几个word文档,转换特定的内容

    import re
    import docx
    doc1=docx.Document('example.docx')
    spam=['后勤','技术','行政']
    for j in spam:
      doc2=docx.Document()
      for i in range(0,len(doc1.paragraphs)):
        c=re.sub('销售',j,doc1.paragraphs[i].text)#第一个参数表示匹配的项,第二个参数表示要替换成的内容,第三个参数表示要被查找的文本字符串
        print(c)
        doc2.add_paragraph(c)
      doc2.save("{}.docx".format(j))

    转载于:https://www.cnblogs.com/shunguo/p/11399283.html

    展开全文
  • 可以进行单个文档或多个文档处理和合并,格式转化等,用于批量修改文档内容,批量转pdf或转图片等系列操作
  • word文件处理:要有批量重复的工作前提,word文档按每段来自定义处理,逻辑简单 小案例1 入门–批量通知客户黄金的价格(纯文字) from docx import Document from docx.enum.text import WD_ALIGN_PARAGRAPH from ...
  • 参考文章:上班摸鱼,先从批量处理 word 文档开始 !『附源码和数据集』 文章原来源:小张Python 文章原作者zeroing 原文写的很详细,可以移步学习 批量读取word表格内容,并整理到excel文件 处理背景如下,现有许多...
  • 有时候我们需要按照某种规则生成一种固定模板的word报告,python能够很好的完成这项工作。本文通过一个小示例说明一下如何通过Python实现自动生成word报告...处理word需要用到python-docx包,先pip安装 pip install pyt
  • Python代码教你批量将PDF转为Word

    千次阅读 2018-02-23 10:08:00
    很多时候在学习时发现许多文档都是PDF格式,PDF格式...so,我们给各位带来了一个免费简单快速的方法,手把手教你用Python批量处理PDF格式文件,获取自己想要的内容,存为word形式。 在实现PDF转Word功能之前,我...
  • python实现word转成自定义格式的excel文档(解决思路和代码) 支持按照文件夹去批量处理,也可以单独一个文件进行处理,并且可以自定义标识符。 最近在开发一个答题类的小程序,到了录入试题进行测试的时候了,发现...
  • Python批量修改文件名和文件类型

    千次阅读 2018-04-12 14:11:44
    os模块提供了丰富的方法来处理文件和目录,主要用到下面几个函数: os.walk() os.listdir() os.path.splitext() ...2. 批量创建递增序列的word文档 批量修改文件类型 最近再学习操作系统的过程中,需要下载网...
  • 写好了就可以批量处理!!!是不是很妙o( ̄︶ ̄)o 还好朋友会用一个sitemapX工具,把网页中的目标路径都写入到一个txt文件中。 调用的库: import time import re import urllib.request import os import pypand
  • 要做一项工作,内容是将一个word中的图表复制到多个(接近300个)word文档的末尾,不想一个个CTRL C+CTRL V,就想到了用程序来实现 我第一个想到的使用python来实现,由于技术太渣,尝试了多次,没能写出来,只记得...
  • 利用docxtpl、openpyxl...本文是我在实际处理问题时,通过查找资料改写成的方法,能够实现将已知EXL表格中的数据一一插入到Word模板里,再生成新的Word文档,存于指定的路径下。 二、docxtpl、openpyxl的安装 右键“开
  • 原文链接 Python批量处理Word文档(.doc/.docx)——批量获取文档标题并以标题重命名文件_Lee_Natuo的博客->CSDN博客 原文使用的是python2,在实际应用过程中修改了下代码.
  • Python操作Word

    2020-02-02 19:02:37
    然而python-docx可以跨平台使用,让你的脚本在不同的系统上都能够兼容,但是只能够操作docx(docx体积更小,处理响应速度更快) 现在我们看看两种方法对word进行操作的详情 win32com 我们写一个批量化请帖撰写的...
  • python自动化办公之HTML带格式写入word文档 看见朋友每天重复地从网页里把目录复制粘贴到word里,觉得很不智能。于是想到用Python的自动化办公功能,来解救他!比如,下面这个图就是HTML里的内容,我要把它提取出来...
  • python已有几个模块可处理word文档、excel表格、以及ppt演示文稿。首先,汇总列出各模块对不同版本文件的处理能力: docx模块:可读取、写入.docx文档(不支持.doc文档!!!) xlrd模块:可读取.xls、.xlsx表格 ...
  • pythonwordpdf转换总结

    2018-03-30 09:56:29
     pythonwordpdf转换总结 近期涉及到了关于doc文档读取的处理,也查了很久,为了便于大家使用,故集大成一下。Doc文档读取有如下几种:1、从doc读取文本 目前没有找到直接的方式,一般是先转为docx文件在处理。...
  • python编辑word与读Excel的经验 ...首先描述一下我打算实现的功能,我打算根据Excel表中的值,来对Word中相应的词进行替换,以达到自动化根据模板处理文档的功能。简单的来说就是批量Ctrl+H和重命名文件。 一、按照Ec...

空空如也

空空如也

1 2 3
收藏数 55
精华内容 22
关键字:

python批量处理word文档

python 订阅