精华内容
下载资源
问答
  • spark doc文档

    2018-06-27 20:09:52
    spark doc文档spark doc文档spark doc文档spark doc文档
  • 新建 DOC 文档,新建doc文档怎么制表,matlab源码.zip
  • HBase配置文件与HBase doc文档
  • doc文档帮助 chm文件

    2009-03-24 17:25:34
    doc文档帮助,挺全的,在大家可以看看,多学习嘛doc文档帮助,挺全的,在大家可以看看,多学习嘛
  • 在VC中操作WORD文档,显示doc文档,修改doc文档,存盘,运行宏 在Visual C++操作WORD文档,显示doc文档,修改doc文档,存盘,运行宏
  • STL中文手册 doc文档

    2018-08-01 16:57:33
    stl中文手册 doc文档哦 stl中文手册 doc文档哦 stl中文手册 doc文档哦 stl中文手册 doc文档
  • PDF文件转换成DOC文档工具,转换出错率低。非常简单好用!
  • doc文件转为txt文件

    2021-01-07 14:30:31
    因为python-docx只能处理docx的文件,而无法处理doc文档。docx本质是xml文件比doc更小些。这里需要的包为win32com,如果没有,则pip即可。 import os from win32com import client as wc from docx import ...

    问,将大象放进冰箱需要几步?

    啊呸,串场了。将doc文件转为txt文件需要几步?

    答:需要两步,

    1.先将doc转为docx。因为python-docx只能处理docx的文件,而无法处理doc文档。docx本质是xml文件比doc更小些。这里需要的包为win32com,如果没有,则pip即可。

    import os
    from win32com import client as wc
    from docx import Document
    from tqdm import tqdm
    def doc2docx(origin_path, goal_path):
        """
        将doc转为docx
        """
        word = wc.Dispatch("Word.Application")
        # 不能用相对路径,用绝对路径
        # 需要处理的文件所在文件夹目录
        for i in os.listdir(origin_path):
            # 找出文件中以.doc结尾并且不以~$开头的文件(~$是为了排除临时文件的)
            if i.endswith('.doc') and not i.startswith('~$'):
                print(i)
                doc_path = os.path.join(origin_path, i)
                doc = word.Documents.Open(doc_path)
                # 将文件名与后缀分割
                rename = os.path.splitext(i)
                # 将文件另存为.docx
                save_path = os.path.join(goal_path, rename[0] + '.docx')
                doc.SaveAs(save_path, 12)  # 12表示docx格式
                doc.Close()
        word.Quit()

    2.将docx转为txt文本。这些需要python-docx,如果没有则pip就好。

    import os
    from win32com import client as wc
    from docx import Document
    from tqdm import tqdm
    def docx2txt(path):
        """
        将docx转为txt
        """
        txt_count = 1
        for i in os.listdir(path):
            if i.endswith('.docx') and not i.startswith('~$'):
                file_path = os.path.join(path, i)
                document = Document(file_path)
                txt_path = os.path.join(path, str(txt_count)+'.txt')
                f = open(txt_path, 'w', encoding='utf-8')
                for paragraph in tqdm(document.paragraphs):
                    f.write(paragraph.text.strip()+'\n')
                f.close()
                txt_count += 1

     

    展开全文
  • DOC文档转TXT文档工具

    2016-01-11 10:22:38
    DOC文档转TXT文档工具,可批量装DOC文档转为TXT文档,使用此工具不需要安装WORD
  • DOC文件修复器

    2012-08-07 13:54:05
    DOC文件修复器,一个可以修复文件头损坏的DOC文档工具
  • vbscrip教程doc文档

    2009-12-30 10:34:41
    vbscrip教程doc文档vbscrip教程doc文档vbscrip教程doc文档vbscrip教程doc文档vbscrip教程doc文档vbscrip教程doc文档vbscrip教程doc文档vbscrip教程doc文档
  • 用python将doc文件批量转为docx文件,用python将doc文件批量转为docx文件,
  • iText API doc文档

    2011-03-12 14:15:53
    iText API doc文档 iText API doc文档 iText API doc文档
  • MAC新建doc文件

    2020-06-15 14:18:45
    解压之后按住command直接把App文件拖到访达的工具栏 这个文件的图标我是改成了doc的样子,如果恢复默认了的话随便找一个doc文档把图标替换一下就可以。以后创建文档就可以直接点击了
  • htm转换成doc文档

    2017-08-25 14:54:01
    将htm文档转换成doc文件
  • 易语言DOT文件转换为DOC文件.rar 易语言DOT文件转换为DOC文件.rar 易语言DOT文件转换为DOC文件.rar 易语言DOT文件转换为DOC文件.rar 易语言DOT文件转换为DOC文件.rar 易语言DOT文件转换为DOC文件.rar
  • java 自己的doc文件生成 api说明文档工具,操作非常简便
  • 易语言源码DOT文件转换为DOC文件.rar 易语言源码DOT文件转换为DOC文件.rar 易语言源码DOT文件转换为DOC文件.rar 易语言源码DOT文件转换为DOC文件.rar 易语言源码DOT文件转换为DOC文件.rar 易语言源码DOT文件...
  • 谷粒商城doc文档.zip

    2021-01-15 16:48:36
    谷粒商城doc文档
  • 办公常用100个DOC文档,100个常用办公文档的模板。
  • J2ME环境配置DOC文档

    2009-07-20 21:35:07
    J2ME环境配置DOC文档J2ME环境配置DOC文档J2ME环境配置DOC文档J2ME环境配置DOC文档J2ME环境配置DOC文档J2ME环境配置DOC文档J2ME环境配置DOC文档J2ME环境配置DOC文档J2ME环境配置DOC文档J2ME环境配置DOC文档
  • AVI动画文件格式(DOC文档),各位有需要就下载吧
  • java读取doc文档

    2013-06-26 09:41:44
    java读取doc文档的一些小例子,供大家参考。
  • doc文档转PDF文件工具

    2013-03-14 15:53:11
    很好用的doc转pdf的工具,完美解决doc转图片格式的问题
  • java 自己的doc文件生成 api说明文档工具,操作非常简便,给有需要的朋友下载使用,至于使用方法自行探索,不过现在都直接用swagger了
  • 使用POI读写Word doc文件 Apache poi的hwpf模块是专门用来对word doc文件进行读写操作的。在hwpf里面我们使用HWPFDocument来表示一个word doc文档
  • doc文件转换为docx文件

    千次阅读 2020-12-13 23:48:30
    最近需要批处理word文档,处理过程中有部分文件doc格式,所以需要写代码来将doc格式文件转换为docx格式文件doc文件和docx文件的区别 这部分参考了这个知乎链接: doc文件和docx文件的区别.的介绍,我自己暂时...

    doc文件转换为docx文件


    最近需要批处理word文档,处理过程中有部分文件是doc格式,所以需要写代码来将doc格式文件转换为docx格式文件。

    doc文件和docx文件的区别

    这部分参考了这个知乎链接: doc文件和docx文件的区别.的介绍,我自己暂时用到理解就是doc文件格式是以前word版本才使用的文件格式。
    前提:
    安装两个工具包,安装命令:
    pip install python-docx
    python -m pip install pypiwin32

    代码实现

    def doc_to_docx(file_dir):
        docfiles = []
        for root, dirs, files in os.walk(file_dir):
            for file in files:
                if os.path.splitext(file)[1] == '.doc':
                    docfiles.append(os.path.join(root, file))
            word = wc.Dispatch("Word.Application")  # 打开word应用程序
            for docfile in docfiles:
                doc = word.Documents.Open(docfile)  # 打开word文件
                doc.SaveAs('{}x'.format(docfile), 12)  # 另存为后缀为".docx"的文件,其中参数12指docx文件
                doc.Close()  # 关闭原来word文件
                os.remove(docfile)
            word.Quit()
            print("完成!")
    
    

    首先要导入win32的API包

    from win32com import client as wc
    

    接着,去到word文件夹里面去找到对应的doc格式的文件,其中os.path.splitext()方法切割文件名方便匹配对应格式文件

    docfiles = []
        for root, dirs, files in os.walk(file_dir):
            for file in files:
                if os.path.splitext(file)[1] == '.doc':  #切分文件名,匹配相应格式的文件
                    docfiles.append(os.path.join(root, file))
    

    解释一下,for root, dirs, files in os.walk(file_dir):
    三个变量分别是什么:

    变量名含义
    root表示正在遍历的文件夹的名字
    dirs记录正在遍历的文件夹下的子文件夹集合
    files记录正在遍历的文件夹中的文件集合

    然后,使用win32API接口打开word应用程序,开始文件格式的转换,这里记录一下document.savaAs2的转换方法的后缀格式参数有哪些,参考官方链接链接: saveAS方法参数.

    这里特别注意 doc.SaveAs(filename, 16)方法里面,必须第一个参数重新给定的文件名的格式后缀必须和后面数字参数给定的格式匹配,否则会报错。而且filename是指包含了源路径的文件路径名。

    名稱描述
    wdFormatDocument0Microsoft Office Word 97-2003年二進位檔案格式。
    wdFormatDOSText4Microsoft DOS 文字格式。
    wdFormatDOSTextLineBreaks5保留分行符號的 Microsoft DOS 文字。
    wdFormatEncodedText7編碼文字格式。
    wdFormatFilteredHTML10篩選的 HTML 格式。
    wdFormatFlatXML19儲存為單一的 XML 檔案開啟 XML 檔案格式。
    。。。。。。。。。
            word = wc.Dispatch("Word.Application")  # 打开word应用程序
            for docfile in docfiles:
                doc = word.Documents.Open(docfile)  # 打开word文件
                doc.SaveAs2('{}x'.format(docfile), 12)  # 另存为后缀为".docx"的文件,其中参数12指docx文件
                doc.Close()  # 关闭原来word文件
                os.remove(docfile)
            word.Quit()
    
    展开全文
  • eclipselink doc文档

    2008-11-14 11:05:10
    eclipselink 1.0 doc 文档
  • 读取和创建doc文件

    2011-11-07 16:52:35
    读取和创建doc文档文件读取word文档

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 997,718
精华内容 399,087
关键字:

doc文档