精华内容
下载资源
问答
  • Java doc转docx源码

    2019-08-23 15:38:50
    Java程序实现word文档docdocx,maven项目架构,idea直接运行
  • vba 批量doc转docx,docx转doc,已好用
  • poi-tl实现根据模板生成合同和html转docdoc转docx的Demo,可以直接运行,jdk1.8, poi-tl 是新的1.6版本的,
  • doc转换docx

    2016-08-15 10:33:26
    doc文档中的内容复制到docx模板中,技术批量转换
  • 全注释版,win10下python3操作word,实现批量doc转docx。详细信息请关注vx:小试编程。
  • Word Doc批量转Docx

    2018-11-16 15:55:00
    Word Doc批量转Docx 批量把Word中Doc格式的文件 转换成Docx格式
  • doc转docx.exe

    2020-04-01 19:47:48
    此工具运用了os库和win32com模块,实现了一键对文件夹内的doc文件进行处理,并保存成docx文件,转换效率高,速度快,且使用方便。直接拖到exe程序到制定文件夹即可。
  • 让你在烦忙的学习生活中,给自己一些和自己相处的时间,也给自己一些和家人在一起的时间❤”win32com模块实现批量.doc转.docx本节课,小编带大家借助Python中的win32com模块,实现文件类型转换问题。话不多说,一起...
     ❤ 希望通过Python编程,替代你去做耗时耗力耗心的事情。

    让你在烦忙的学习生活中,给自己一些和自己相处的时间,

    也给自己一些和家人在一起的时间❤

    4bfffa2016ba47aed0488e05320ffd1f.gif

    win32com模块实现批量.doc转.docx

    本节课,小编带大家借助Python中的win32com模块,实现文件类型转换问题。话不多说,一起进入今天的知识小分享!



    819fedd69047194fc5779e3eb23d60bb.gif

    01 - 案例功能描述

    给定目录,存储所有从网上下载文件,现要求:

    1. 找到给定目录下所有.doc文件,包含子目录

    2. 批量操作将这些文件转成.docx结尾文件

    话不多说,一起来看看效果吧!



    02 - 创建.py文件

    在当前文件夹下创建.py文件,具体如下:


    aede49cac91909dd3e33bacf789f1b65.png

    03 - 案例实现步骤

      实现的基本步骤,如下:

    step1导入相关模块库。

    step2找到给定目录下所有.doc文件。

    step3:打开Word应用程序。

    step4将每个.doc文件转成.docx。

    step5查看结果。



    04 - 编写功能代码

    相关的部分核心代码如下:

    #第一部分:查找指定目录下所有的.doc结尾的文件def get_doc_files(path):    #判断路径合法性    if not os.path.exists(path):        print(path + "路径不存在,请核实!")        sys.exit()    #列表,用于存放所有的.doc格式的文件    all_doc_files = []    #通过遍历目录树形式,找到给定文件夹下所有.doc文件并放到列表中    for foldername, subfolders, filenames in os.walk(path):        print(filenames)        for file in filenames:            #获取".doc"后缀的word文件            if file.endswith(".doc"):                #print(file)                all_doc_files.append(os.path.join(foldername, file))    return all_doc_files#第二部分:将所有以.doc结尾的文件另存成.docx的def convert_to_docx(all_files):    '''将所有以.doc结尾的文件另存成.docx'''    #打开word应用程序    word_app = win32com.client.Dispatch("Word.Application")    #遍历所有的.doc文件,依次转成.docx格式的    for file in all_files:        #打开word文件        doc_file = word_app.Documents.Open(file)        #另存为后缀为".docx"的文件,其中参数12指docx文件        doc_file.SaveAs("{}x".format(file), 12)        print("正在转换中...")        #关闭原来word文件        doc_file.Close()    print("全部转换成功!")    #最后退出整个的Word程序    word_app.Quit()'''测试程序'''#准备路径path = "D:\\Programs\\Python图解\\批量操作word\\将给定目录下所有doc转成.docx\\我的下载"all_files = get_doc_files(path)convert_to_docx(all_files)

    05 - 运行效果

    点击观看效果:


    06 - 知识说明及扩展

    • 开始编码之前,应先安装win32模块。

    • 将来,还可以将word文件转成其它格式的。比如:.txt,.png,.xlsx类型的等等。基本的步骤和转成.docx是类似的,只不过在调用SaveAs()时,给定的那个数字是一样。.docx对应的是12。

    • 其它的每种类型对应的数字,请参见下图:

      2eece5fb700e0b8064f617a483011a76.png


    如:将一个.doc文件转成.txt,代码如下

    import win32comimport win32com.client#打开整个word程序word = win32com.client.Dispatch("Word.Application")# txt_path = "D:\\Programs\\Python图解\\批量操作word\\doc1.docx"txt_path = "D:\\Programs\\Python图解\\批量操作word\\doc1.docx"#加载要转换的那个文件到内存txt_file = word.Documents.Open(txt_path)#调用SaveAs()指令,存为".txt"的文件,其中2表示文本文件txt_file.SaveAs("doc1.txt", 2)print("正在转换中...")#关闭原来word文件txt_file.Close()#最后退出整个的Word程序word.Quit()

    点击查看运行效果:



    今天要和大家分享的内容就是这些,希望能帮助到您!




    a515ffa8082e5631657e36e7f5ccb26b.gif


    人与计算机最大的区别是:人有思想、懂感情,是一个不断学习进化的品种,并且大部分人都希望通过自己的努力,让自己和爱的人生活的更好。在这样一个被炒的铺天盖地的智能化时代,看到时代左右的人,才不会被时代所左右。


    来自:留给沿海地带,微信号:lml108

    6bd3f3ab7191069ab9fc67750dd21dc2.gif


    达内 Python办公自动化,给你的生活“加点料”!

    点击即刻免费试听课程,无需注册登陆任何帐号。

    网址:http://www.tmooc.cn/course/302822.shtml

    73520931d0a5bbcdffd48b16b3add850.gif

    展开全文
  • linux下doc转docx

    2021-02-23 15:09:46
    linux下doc转docx 你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。 安装 libreoffice yum install ...

    linux下doc转docx

    你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。

    安装 libreoffice

     yum install libreoffice-headless
     如果
     Error: source file could not be loaded
     应该是写出错了
     yum install libreoffice-writer
    

    使用

    soffice --help
    eg:
    soffice --headless --convert-to docx /www/asd.doc
    docx 目标类型
    /www/asd.doc  文件路径
    默认转换完成的文件会存在 /root/asd.docx
    
    eg:指定目录
    soffice --headless --convert-to docx --outdir /www  /www/asd.doc
    转换完成的文件会存在 /www/asd.docx
    
    

    不同于python调用win32api只能在Windows使用

    展开全文
  • doc文件转换docx文件,eclipse平台可以直接运行,java代码编写。
  • 本文讲述通过python实现将当前目录下的 .doc文档.pdf、.docx文档.pdf,以及.doc文档.docx(在python中,如需对word文档进行读写,只能读写docx格式的word文档)。 其中涉及到的知识点有如下几点: 通过win32...

    摘要

    本文讲述通过python实现多线程将当前目录下的 .doc文档转.pdf、.docx文档转.pdf,以及.doc文档转.docx(在python中,如需对word文档进行读写,只能读写docx格式的word文档)。
    其中涉及到的知识点有如下几点:

    1. 通过win32com模块对office文档进行格式转化
    2. 多线程的应用及控制

    模块说明

    1. threading:线程应用模块
    2. pythoncom:处理word应用,使其独立运行的api接口模块
    3. win32com:office文档处理模块,通过 “pip install pypiwin32” 安装
    import os, re
    import threading
    import pythoncom
    from win32com.client import DispatchEx
    

    定义main部分

    代码分析

    1. 在多线程程序中,因电脑性能不同,需控制线程最大并发数。以下为控制线程最大并发数的代码,用到 threading.Semaphore() 方法
    semaphore = threading.Semaphore(12)
    
    1. 定义线程锁。不同线程之间可能在输出面板同时输出,造成输出紊乱,如:
      线程1将输出:
      who am i in thread 1
      i am A
      线程2将输出:
      who am i in thread 2
      i am B
      线程同时运行时标准输出为:
      who am i in thread 1
      i am A
      who am i in thread 2
      i am B
      而线程同时运行时可能输出:
      who am i in thread 1
      who am i in thread 2
      i am B
      i am A
      以下为控制线程独立输出的代码,用到 threading.Lock() 方法
    lock = threading.Lock()
    
    1. 遍历指定目录下所有文件,其中 file 为文件名,a 为该文件路径, c 为该文件同一文件夹下的所有文件集
    for a, b, c in os.walk(pre):
        for file in c:
    
    1. 判断文件名后缀是否含有 .doc ,是则为 .doc 或者 .docx 文件,否则不处理
    if re.search('\.doc', file) != None:
    
    1. threading.Thread(target=, args=) 定义线程,target 参数指定线程运行的方法,args 参数传入运行方法的参数,start() 方法执行线程,DocToDocx和DocToPdf的作用下文中会具体说明
    threading.Thread(target=WordConvertToOther.DocToDocx, args=(pre + file,)).start()
    

    main代码

    if __name__ == '__main__':
        # 控制线程最大并发数为12
        semaphore = threading.Semaphore(12)
        # 线程锁
        lock = threading.Lock()
        # 当前脚本目录绝对路径
        pre = os.path.realpath('./') + '\\'
        for a, b, c in os.walk(pre):
            for file in c:
                if re.search('\.doc', file) != None:
                    # 将doc转存为docx
                    threading.Thread(target=WordConvertToOther.DocToDocx, args=(pre + file,)).start()
                    # 将doc、docx转存为pdf
                    # threading.Thread(target=WordConvertToOther.DocToPdf, args=(pre + file, )).start()
    

    定义doc转docx函数

    代码分析

    1. 使函数在最大线程限制下运行
    with semaphore:
    
    1. pythoncom.CoInitialize() 方法创建套间。pythoncom模块为线程和word对象创建一个套间,令其可以正常关联和执行。多线程运行office应用时需加入此模块方法,否则将出错,非多线程则不需要。之后的 pythoncom.CoUninitialize() 方法则用以释放套间资源
    pythoncom.CoInitialize()
    
    1. 通过 DispatchEx(‘Word.Application’) 方法启动office应用程序,相当于在windows下打开office
    word = DispatchEx('Word.Application')
    
    1. 通过 word.Documents.Open() 方法启动具体的某个文档文件
    doc = word.Documents.Open(docpath)
    
    1. doc.SaveAs() 为将打开的doc存储为docx的主要方法。其中 re.sub 方法将路径中文件名的doc替换为docx,FileFormat 指定保存的文件格式,等于 12 保存为docx、等于 17 保存为pdf
    doc.SaveAs(re.sub('.doc$', '.docx', docpath), FileFormat=12)
    
    1. 无论doc文档执行结果如何,都需让office应用程序关闭,否则将会在后台中继续运行,占用系统资源
    word.Quit()
    

    函数代码

        def DocToDocx(docpath):
            '''将doc转存为docx'''
            with semaphore:
            	lock.acquire()
                try:
                    # CoInitialize初始化,为线程和word对象创建一个套间,令其可以正常关联和执行
                    pythoncom.CoInitialize()
                    # 用DispatchEx()的方式启动MS Word或与当前已执行的MS Word建立连结
                    word = DispatchEx('Word.Application')
                    # 打开指定目录下doc文档
                    doc = word.Documents.Open(docpath)
                    # 将打开的doc文档存储为docx
                    doc.SaveAs(re.sub('.doc$', '.docx', docpath), FileFormat=12)
                    # 关闭doc文档
                    doc.Close()
                except:
                    # 报错则输出报错文件
                    print(docpath + ':无法打开')
                else:
                    # 无报错输出转换完成
                    print(os.path.basename(docpath) + " : 转换完成")
                finally:
                    # 关闭office程序
                    word.Quit()
                    # 释放资源
                    pythoncom.CoUninitialize()
                lock.release()
    

    定义doc转pdf函数

    函数代码

    这里与doc转docx类似,直接附上函数代码:

        def DocToPdf(docpath):
            '''将doc、docx转存为pdf'''
            with semaphore:
            	lock.acquire()
                try:
                    pythoncom.CoInitialize()
                    word = DispatchEx('Word.Application')
                    doc = word.Documents.Open(docpath)
                    doc.SaveAs(re.sub('\.doc.*', '.pdf', docpath), FileFormat=17)
                    doc.Close()
                except:
                    print(docpath + ':无法打开')
                else:
                    print(os.path.basename(docpath) + " : 转换完成")
                finally:
                    word.Quit()
                    pythoncom.CoUninitialize()
                lock.release()
    

    完整代码

    import os, re
    import threading
    import pythoncom
    from win32com.client import DispatchEx
    
    class WordConvertToOther:
        def DocToDocx(docpath):
            '''将doc转存为docx'''
            with semaphore:
            	lock.acquire()
                try:
                    # CoInitialize初始化,为线程和word对象创建一个套间,令其可以正常关联和执行
                    pythoncom.CoInitialize()
                    # 用DispatchEx()的方式启动MS Word或与当前已执行的MS Word建立连结
                    word = DispatchEx('Word.Application')
                    # 打开指定目录下doc文档
                    doc = word.Documents.Open(docpath)
                    # 将打开的doc文档存储为docx
                    doc.SaveAs(re.sub('.doc$', '.docx', docpath), FileFormat=12)
                    # 关闭doc文档
                    doc.Close()
                except:
                    # 报错则输出报错文件
                    print(docpath + ':无法打开')
                else:
                    # 无报错输出转换完成
                    print(os.path.basename(docpath) + " : 转换完成")
                finally:
                    # 关闭office程序
                    word.Quit()
                    # 释放资源
                    pythoncom.CoUninitialize()
                lock.release()
    
        def DocToPdf(docpath):
            '''将doc、docx转存为pdf'''
            with semaphore:
            	lock.acquire()
                try:
                    pythoncom.CoInitialize()
                    word = DispatchEx('Word.Application')
                    doc = word.Documents.Open(docpath)
                    doc.SaveAs(re.sub('\.doc.*', '.pdf', docpath), FileFormat=17)
                    doc.Close()
                except:
                    print(docpath + ':无法打开')
                else:
                    print(os.path.basename(docpath) + " : 转换完成")
                finally:
                    word.Quit()
                    pythoncom.CoUninitialize()
                lock.release()
    
    if __name__ == '__main__':
        # 控制线程最大并发数为12
        semaphore = threading.Semaphore(12)
        # 线程锁
        lock = threading.Lock()
        # 当前脚本目录绝对路径
        pre = os.path.realpath('./') + '\\'
        for a, b, c in os.walk(pre):
            for file in c:
                if re.search('\.doc', file) != None:
                    # 将doc转存为docx
                    # threading.Thread(target=WordConvertToOther.DocToDocx, args=(pre + file,)).start()
                    # 将doc、docx转存为pdf
                    threading.Thread(target=WordConvertToOther.DocToPdf, args=(pre + file, )).start()
    

    参考文献

    展开全文
  • python 3 | doc转docx

    千次阅读 2019-07-18 13:18:49
    python 3 | doc转docx 由于python 3 中 python-docx包只能对docx操作。 path_original 、path_final 为绝对路径,精确到.doc/.docx def doc_to_docx(path_original, path_final): if os.path.splitext(path_...

    python 3 | doc转docx

    由于python 3 中 python-docx包只能对docx操作。
    path_original 、path_final 为绝对路径,精确到.doc/.docx

    def doc_to_docx(path_original, path_final):
        if os.path.splitext(path_original)[1] == ".doc":
            word = client.Dispatch('Word.Application')
            print(path_original)
            doc = word.Documents.Open(path_original)  # 目标路径下的文件
            print(path_final)
            doc.SaveAs(path_final, 16)  # 转化后路径下的文件
            doc.Close()
            word.Quit()
        elif os.path.splitext(path_original)[1] == ".docx":
            shutil.copy(path_original, path_final)
    

    姊妹篇

    python 3| docx的读写 | excel的读 | word行中添加新的key-value - 我是一块小石头 - CSDN博客
    https://blog.csdn.net/stone_fall/article/details/96428915
    python 3 | doc转docx - 我是一块小石头 - CSDN博客
    https://blog.csdn.net/stone_fall/article/details/96428876
    Python 3 | txt转Excel | 用拼音+数字对各个数据元编码 | 读取多个文件夹内容 | import xlwt + xpinyin + os - 我是一块小石头 - CSDN博客
    https://blog.csdn.net/stone_fall/article/details/96428734

    展开全文
  • 直接将此函数代码粘贴即可使用 function docChangedocx() ... myDialog.Filters.Add("所有 WORD97-2003 文件", "*.doc", 1 ) myDialog.AllowMultiSelect=true myDialog.Show() for(var i=1;i<
  • Java代码实现doc后缀文件转换成docx后缀文件,eclipse下直接运行
  • python doc转docx pypiwin32

    千次阅读 2020-10-19 11:19:50
    参考
  • docdocx格式互工具

    2016-07-15 14:40:25
    从一个国外网站下载的,支持doc docx格式之间文件互,支持批量互,支持命令行转换,非常好用
  • Python doc转docx

    2020-02-03 19:21:41
    用python将Word文档中的doc格式转换成docx格式 from win32com import client as wc from glob import glob import os class DocToDocx: def __init__(self, file_name): """ 因为glob函数接收的是r'D:/Note/...
  • 文章目录一、学习目标:二、具体...上一篇刚学习了使用python将doc转docx,发展这个模块只能window使用,但是代码迁移到ecs上,如果报错。 历经搜索无数文章,总算找到了一个救星。 参考文章 二、具体步骤: 1、参考 ...
  • 将.DOC后缀的文档转换成.DOCX后缀的文档,便于后续进行合并分页或者其它作用
  • 此工程功能为doc/docx文档批量转换XML文档,附带源代码源代码。
  • 批量doc转docx方法,使用软件、插件

    千次阅读 2018-11-05 17:37:15
    本文介绍一种批量doc转docx的方法,使用相应的软件 1、软件下载,2个,一个是FileFormatConverters.exe,另一个是MigrationPlanningManager.exe,在以下链接下载 链接: ...
  • 涉及知识点:wordxml、xml字符串、doc转docx 此处主要试讲word文件转换,之前的替换只能替换正文,此处可进行全部替换,像脚注等,都可进行
  • Batch DOC and DOCX Converter是一个很好用的DOC转DOCX工具,可以将DOC格式的word文档转换为DOCX格式,也可以将DOCX格式转换为DOC格式,从而可以解决因为Office版本导致DOC/DOCX格式Wrod文档不兼容的问题,需要的...
  • 使用vba doc转docx

    2019-04-30 11:53:00
    创建vbs文件,doctodocx.vbs内容如下: '创建一个word对象 set wApp=CreateObject("word.Application") ...'一下三段代码主要是把文件名由doc转docx intPos = InStrRev(strDocName, ".") ...
  • python实现doc转docx,以及docx转html

    千次阅读 2020-04-08 21:50:54
    python里面实现doc转html貌似有点麻烦,这里先把doc转为docx,然后再转为html,代码...from pydocx import PyDocX # docx转html用 ''' doc文件转docx文件 fullpath:路径+文件名(不带后缀) 如:D:\\test\\文件1 '...
  • vbs脚本doc转docx

    2018-01-29 18:19:01
    还可以使用vbs--如下是doc转docx Dim FSO,s Set FSO=CreateObject("Scripting.FileSystemObject") Set AllF=FSO.GetFolder(fso.GetParentFolderName (WScript.ScriptFullName )) For Each file In
  • 主要介绍了java使用poi读取docdocx文件的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
  • 批量doc文件转docx文件的两种方法方法一第一种方法直接使用Office Migration Planning Manager (OMPM)。这个工具可以批量把doc文件转为docx文件。要声明的一点,这个工具比较适合IT相关从事者使用,或者懂得一些编程...
  • Java 使用jacob ppt文件pptx,doc转docx
  • 使用破解后的aspose.words for java,实现.doc文档转为.docx问题,不丢失任何文档内容

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 39,155
精华内容 15,662
关键字:

doc转docx

友情链接: 99273858qczs.zip