精华内容
下载资源
问答
  • ppt怎样转换为doc文件.doc
  • 用python将doc文件批量转为docx文件,用python将doc文件批量转为docx文件,
  • 易语言DOT文件转换为DOC文件源码,DOT文件转换为DOC文件
  • 易语言DOT文件转换为DOC文件.rar 易语言DOT文件转换为DOC文件.rar 易语言DOT文件转换为DOC文件.rar 易语言DOT文件转换为DOC文件.rar 易语言DOT文件转换为DOC文件.rar 易语言DOT文件转换为DOC文件.rar
  • 易语言源码DOT文件转换为DOC文件.rar 易语言源码DOT文件转换为DOC文件.rar 易语言源码DOT文件转换为DOC文件.rar 易语言源码DOT文件转换为DOC文件.rar 易语言源码DOT文件转换为DOC文件.rar 易语言源码DOT文件...
  • DOT文件转换为DOC文件.rar
  • pdf 转doc文件

    2010-11-23 21:18:27
    pdf 转doc文件pdf 转doc文件pdf 转doc文件pdf 转doc文件
  • 五子棋 doc 文件

    2010-12-17 10:40:44
    五子棋 doc 文件 可以很好的运行 ,可供 初学者 研究学习
  • pdf转为doc文件

    2010-05-18 22:37:02
    把pdf文件转为 doc文件把pdf文件转为 doc文件把pdf文件转为 doc文件把pdf文件转为 doc文件把pdf文件转为 doc文件把pdf文件转为 doc文件
  • doc文件转换为docx文件

    千次阅读 2020-12-13 23:48:30
    doc文件转换为docx文件doc文件和docx文件的区别代码实现 最近需要批处理word文档,处理过程中有部分文件是doc格式,所以需要写代码来将doc格式文件转换为docx格式文件。 doc文件和docx文件的区别 这部分参考了这个...

    doc文件转换为docx文件


    最近需要批处理word文档,处理过程中有部分文件是doc格式,所以需要写代码来将doc格式文件转换为docx格式文件。

    doc文件和docx文件的区别

    这部分参考了这个知乎链接: doc文件和docx文件的区别.的介绍,我自己暂时用到理解就是doc文件格式是以前word版本才使用的文件格式。
    前提:
    安装两个工具包,安装命令:
    pip install python-docx
    python -m pip install pypiwin32

    代码实现

    def doc_to_docx(file_dir):
        docfiles = []
        for root, dirs, files in os.walk(file_dir):
            for file in files:
                if os.path.splitext(file)[1] == '.doc':
                    docfiles.append(os.path.join(root, file))
            word = wc.Dispatch("Word.Application")  # 打开word应用程序
            for docfile in docfiles:
                doc = word.Documents.Open(docfile)  # 打开word文件
                doc.SaveAs('{}x'.format(docfile), 12)  # 另存为后缀为".docx"的文件,其中参数12指docx文件
                doc.Close()  # 关闭原来word文件
                os.remove(docfile)
            word.Quit()
            print("完成!")
    
    

    首先要导入win32的API包

    from win32com import client as wc
    

    接着,去到word文件夹里面去找到对应的doc格式的文件,其中os.path.splitext()方法切割文件名方便匹配对应格式文件

    docfiles = []
        for root, dirs, files in os.walk(file_dir):
            for file in files:
                if os.path.splitext(file)[1] == '.doc':  #切分文件名,匹配相应格式的文件
                    docfiles.append(os.path.join(root, file))
    

    解释一下,for root, dirs, files in os.walk(file_dir):
    三个变量分别是什么:

    变量名含义
    root表示正在遍历的文件夹的名字
    dirs记录正在遍历的文件夹下的子文件夹集合
    files记录正在遍历的文件夹中的文件集合

    然后,使用win32API接口打开word应用程序,开始文件格式的转换,这里记录一下document.savaAs2的转换方法的后缀格式参数有哪些,参考官方链接链接: saveAS方法参数.

    这里特别注意 doc.SaveAs(filename, 16)方法里面,必须第一个参数重新给定的文件名的格式后缀必须和后面数字参数给定的格式匹配,否则会报错。而且filename是指包含了源路径的文件路径名。

    名稱描述
    wdFormatDocument0Microsoft Office Word 97-2003年二進位檔案格式。
    wdFormatDOSText4Microsoft DOS 文字格式。
    wdFormatDOSTextLineBreaks5保留分行符號的 Microsoft DOS 文字。
    wdFormatEncodedText7編碼文字格式。
    wdFormatFilteredHTML10篩選的 HTML 格式。
    wdFormatFlatXML19儲存為單一的 XML 檔案開啟 XML 檔案格式。
    。。。。。。。。。
            word = wc.Dispatch("Word.Application")  # 打开word应用程序
            for docfile in docfiles:
                doc = word.Documents.Open(docfile)  # 打开word文件
                doc.SaveAs2('{}x'.format(docfile), 12)  # 另存为后缀为".docx"的文件,其中参数12指docx文件
                doc.Close()  # 关闭原来word文件
                os.remove(docfile)
            word.Quit()
    
    展开全文
  • 正则表达式doc 文件

    2008-10-14 17:34:48
    正则表达式 .doc 文件 正则表达式 .doc 文件 正则表达式 .doc 文件 正则表达式 .doc 文件
  • DOT文件转换为DOC文件
  • doc文件转为txt文件

    2021-01-07 14:30:31
    doc文件转为txt文件需要几步? 答:需要两步, 1.先将doc转为docx。因为python-docx只能处理docx的文件,而无法处理doc文档。docx本质是xml文件比doc更小些。这里需要的包为win32com,如果没有,则pip即可。 ...

    问,将大象放进冰箱需要几步?

    啊呸,串场了。将doc文件转为txt文件需要几步?

    答:需要两步,

    1.先将doc转为docx。因为python-docx只能处理docx的文件,而无法处理doc文档。docx本质是xml文件比doc更小些。这里需要的包为win32com,如果没有,则pip即可。

    import os
    from win32com import client as wc
    from docx import Document
    from tqdm import tqdm
    def doc2docx(origin_path, goal_path):
        """
        将doc转为docx
        """
        word = wc.Dispatch("Word.Application")
        # 不能用相对路径,用绝对路径
        # 需要处理的文件所在文件夹目录
        for i in os.listdir(origin_path):
            # 找出文件中以.doc结尾并且不以~$开头的文件(~$是为了排除临时文件的)
            if i.endswith('.doc') and not i.startswith('~$'):
                print(i)
                doc_path = os.path.join(origin_path, i)
                doc = word.Documents.Open(doc_path)
                # 将文件名与后缀分割
                rename = os.path.splitext(i)
                # 将文件另存为.docx
                save_path = os.path.join(goal_path, rename[0] + '.docx')
                doc.SaveAs(save_path, 12)  # 12表示docx格式
                doc.Close()
        word.Quit()

    2.将docx转为txt文本。这些需要python-docx,如果没有则pip就好。

    import os
    from win32com import client as wc
    from docx import Document
    from tqdm import tqdm
    def docx2txt(path):
        """
        将docx转为txt
        """
        txt_count = 1
        for i in os.listdir(path):
            if i.endswith('.docx') and not i.startswith('~$'):
                file_path = os.path.join(path, i)
                document = Document(file_path)
                txt_path = os.path.join(path, str(txt_count)+'.txt')
                f = open(txt_path, 'w', encoding='utf-8')
                for paragraph in tqdm(document.paragraphs):
                    f.write(paragraph.text.strip()+'\n')
                f.close()
                txt_count += 1

     

    展开全文
  • doc文件阅读器

    2013-04-21 02:33:04
    doc文件阅读器 直接解压,打开DOC文件即可
  • MAC新建doc文件

    2020-06-15 14:18:45
    解压之后按住command直接把App文件拖到访达的工具栏 这个文件的图标我是改成了doc的样子,如果恢复默认了的话随便找一个doc文档把图标替换一下就可以。以后创建文档就可以直接点击了
  • 如何不依赖插件,通过java代码使doc文件转换成docx文件?
  • 专利文件实例 doc

    2012-08-29 11:42:34
    专利文件实例 doc专利文件实例 doc专利文件实例 doc专利文件实例 doc专利文件实例 doc专利文件实例 doc专利文件实例 doc专利文件实例 doc专利文件实例 doc专利文件实例 doc专利文件实例 doc
  • Word-doc文件结构

    2014-01-09 10:46:12
    这是word-doc文件结构pdf,英文版,对分析word-doc文件结构有用。由于word-doc文件结构比较复杂,其它文档将在以后陆续上载。
  • DOC文件修复器

    2012-08-07 13:54:05
    DOC文件修复器,一个可以修复文件头损坏的DOC文档工具
  • PDF转换成DOC文件

    2009-11-19 10:34:36
    PDF转换成DOC文件,PDF转换成DOC文件,PDF转换成DOC文件
  • Android 读取Doc 文件

    2011-04-06 15:41:43
    Android上实现的读取DOC文件的程序,需要第三方jar,在压缩文件中一并送上。
  • wps文件怎样打开.doc

    2021-09-14 07:19:47
    wps文件怎样打开.doc
  • GB2312所有汉字doc文件

    2017-09-26 16:12:13
    GB2312所有汉字doc文件GB2312所有汉字doc文件GB2312所有汉字doc文件GB2312所有汉字doc文件GB2312所有汉字doc文件GB2312所有汉字doc文件
  • 文件管理DOC

    2020-12-11 14:00:05
    文件管理DOC致力于为大家提供学习、参考最实用的资源,对文件管理DOC有需要的朋友,赶快来下载吧!PS:可...该文档为文件管理DOC,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看
  • Java代码实现doc后缀文件转换成docx后缀文件,eclipse下直接运行
  • pdf文件转化为doc文件的工具,很好用的。不知道为什么,有时候pdf文件不用拷贝,也不能另存为doc文件,所以找了好久 终于找到了这个工具 ,与大家分享一下 呵呵
  • visual c++ vc操作编辑word文件 修改doc文件.zip
  • Excel doc文件密码找回

    2009-01-06 16:58:56
    Excel doc文件密码找回,非常方便,非常的快速找回Excel doc文件密码

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 524,171
精华内容 209,668
关键字:

怎样做doc文件