精华内容
下载资源
问答
  • 2021-06-16 16:59:05

    1. 上传文件

    如iview中的:

    <Upload action="" :before-upload="handleBeforeUpload" accept=".doc, .docx">

          <Button  :loading="uploadLoading">上传文件</Button>

     </Upload>

    2. 读取doc文件内容

    先安装mammoth.js插件: npm i mammoth --save

    引用: import * as mammoth from 'mammoth'

    readFile (file) {

          const reader = new FileReader()

          reader.readAsArrayBuffer(file)

          reader.onload = e => {

            const data = reader.result

            mammoth.extractRawText({arrayBuffer: data}).then(r=>{

            console.log(r.value)

          })

          }

        },

     

    更多相关内容
  • 用python将doc文件批量转为docx文件,用python将doc文件批量转为docx文件,
  • 【Java】操作doc文件

    千次阅读 2018-01-03 15:47:34
    读取并修改doc文件内容

    读取txt文件

    在Java里要对文件进行操作,需要用到IO流。

       public static void main(String args[]){
            File f = new File("test.txt");
            try {
    // InputStream 处理的是字节流,用read()的话每次读取的是一个byte
                InputStream in  = new FileInputStream(f);
    // InputStreamReader 处理的是字符流,用read()的话每次读取一个字符
                InputStreamReader reader = new InputStreamReader(in,"gbk");
    // BufferReader 处理的是字符流,能够一行一行的读取文件
                BufferedReader bufReader = new BufferedReader(reader);
                int i = 1;
                String line ="";
    // readLine()每用一次读取一行
                while((line = bufReader.readLine()) != null){
                    System.out.println("第"+ i + "行:"+line);
                    ++i;
                }
            } catch (FileNotFoundException e) {
                e.printStackTrace();
            } catch (IOException e) {
                e.printStackTrace();
            }
    
        }

    输出:
    这里写图片描述

    操作doc文件

    读取doc文件如果也用上面的方法的话,中文就会出现乱码:
    这里写图片描述

    要用Java Apache POI才能对doc文件进行操作,使用POI从doc文件读取数据时主要有两种方式:通过WordExtractor读和通过HWPFDocument读。首先先在Maven中引入poi-scratchpad的jar包(如果是docx文件则引入poi-ooxml的jar包 )

    使用WordExtractor

    WordExtractor的功能相比HWPFDocument的功能是要少的,在使用WordExtractor读文件时我们只能读到文件的文本内容和基于文档的一些属性,至于文档内容的属性等是无法读到的,并且WordExtractor无法修改doc文件。使用WordExtractor读取文件内容:

    public static void main(String args[]){
            File f = new File("test.doc");
            try {
                InputStream in = new FileInputStream(f);
                WordExtractor ex = new WordExtractor(in);
                System.out.println(ex.getText());
            } catch (FileNotFoundException e) {
                e.printStackTrace();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }

    这里写图片描述

    使用HWPFDocument

    因为我主要是为了修改doc文件的内容,所以用HWPFDocument。将文档中的中文字全部去除:

    public static void main(String args[]){
            File f = new File("test.doc");
            try {
                InputStream in = new FileInputStream(f);
                HWPFDocument ex = new HWPFDocument(in);
                Range range = ex.getRange();
                 /**
                 * 匹配中文字符 [\\u4e00-\\u9fa5]
                 * 中文标点符号,、; \\uff1b|\\uff0c|\\u3001
                 * 括号内容(包括括号) (\\(.*\\))
                 */ 
                Pattern pattern = Pattern.compile("[\\u4e00-\\u9fa5]|\\uff1b|\\uff0c|\\u3001|(\\(.*\\))",Pattern.CASE_INSENSITIVE);
                Matcher matcher = pattern.matcher(range.text());
                OutputStream os = new FileOutputStream(f);
             // 找到中文字符并替换为“” 即删除
                while (matcher.find( )) {
                    range.replaceText(matcher.group(),"");
                }
             // 将修改后的内容重新写入文档中
                ex.write(os);
                os.close();
                in.close();
            } catch (FileNotFoundException e) {
                e.printStackTrace();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }

    修改前:
    这里写图片描述

    修改后:
    这里写图片描述

    做这个功能是为了背单词,而一个文档5500个单词,308页内容,一个一个删除中文太麻烦了,所以想到了用代码实现

    参考资料:http://www.jb51.net/article/101910.htm

    展开全文
  • Python 批量转化doc文件为docx文件

    千次阅读 2021-12-06 16:55:09
    使用Python转化doc文件转化为docx文件,可处理多文件

    因Python处理中对文件的格式要求,需把doc文件转化为docx文件,详解如下:

    import os
    from win32com import client as wc
    import time
    #  注意:目录的格式必须写成双反斜杠
    path="C:\\Users\\wbl\\Desktop\\pythonProject1\\"  # 使用绝对地址(可更改)
    files=[]
    for file in os.listdir(path):
        # 找出文件中以.doc结尾并且不以~$开头的文件(~$是为了排除临时文件)
        if file.endswith('.doc') and not file.startswith('~$'): 
            files.append(path+file)
            for file in files:
                word = wc.Dispatch("Word.Application")
                print("已处理文件:"+files[0])
                # 打开文件
                doc = word.Documents.Open(files[0])
                # 将文件另存为.docx
                doc.SaveAs("{}x".format(files[0]), 12)    # 12表示docx格式
                doc.Close()
                # 删除原doc文件
                os.remove(files[0])
                # 在files数组中删除第一个文件地址(已处理的文件地址)
                del files[0]
                word.Quit()
                time.sleep(0.5) # 暂停0.5秒
    

    对time.sleep()语句的解释:
     time.sleep() 函数推迟调用线程的运行,可通过参数secs指秒数,表示进程挂起的时间。

    使用原因:

    for循环中,上一个进程刚想执行word.Quit()时,下一个进程就已经开始执行到wc.Dispatch(‘Word.Application’),前后矛盾,导致打开不了,使程序报错:“AttributeError: <unknown>.Open”

    欢迎大家批评指正~

    展开全文
  • doc文件转换为docx文件

    千次阅读 2020-12-13 23:48:30
    doc文件转换为docx文件doc文件和docx文件的区别代码实现 最近需要批处理word文档,处理过程中有部分文件是doc格式,所以需要写代码来将doc格式文件转换为docx格式文件。 doc文件和docx文件的区别 这部分参考了这个...

    doc文件转换为docx文件


    最近需要批处理word文档,处理过程中有部分文件是doc格式,所以需要写代码来将doc格式文件转换为docx格式文件。

    doc文件和docx文件的区别

    这部分参考了这个知乎链接: doc文件和docx文件的区别.的介绍,我自己暂时用到理解就是doc文件格式是以前word版本才使用的文件格式。
    前提:
    安装两个工具包,安装命令:
    pip install python-docx
    python -m pip install pypiwin32

    代码实现

    def doc_to_docx(file_dir):
        docfiles = []
        for root, dirs, files in os.walk(file_dir):
            for file in files:
                if os.path.splitext(file)[1] == '.doc':
                    docfiles.append(os.path.join(root, file))
            word = wc.Dispatch("Word.Application")  # 打开word应用程序
            for docfile in docfiles:
                doc = word.Documents.Open(docfile)  # 打开word文件
                doc.SaveAs('{}x'.format(docfile), 12)  # 另存为后缀为".docx"的文件,其中参数12指docx文件
                doc.Close()  # 关闭原来word文件
                os.remove(docfile)
            word.Quit()
            print("完成!")
    
    

    首先要导入win32的API包

    from win32com import client as wc
    

    接着,去到word文件夹里面去找到对应的doc格式的文件,其中os.path.splitext()方法切割文件名方便匹配对应格式文件

    docfiles = []
        for root, dirs, files in os.walk(file_dir):
            for file in files:
                if os.path.splitext(file)[1] == '.doc':  #切分文件名,匹配相应格式的文件
                    docfiles.append(os.path.join(root, file))
    

    解释一下,for root, dirs, files in os.walk(file_dir):
    三个变量分别是什么:

    变量名含义
    root表示正在遍历的文件夹的名字
    dirs记录正在遍历的文件夹下的子文件夹集合
    files记录正在遍历的文件夹中的文件集合

    然后,使用win32API接口打开word应用程序,开始文件格式的转换,这里记录一下document.savaAs2的转换方法的后缀格式参数有哪些,参考官方链接链接: saveAS方法参数.

    这里特别注意 doc.SaveAs(filename, 16)方法里面,必须第一个参数重新给定的文件名的格式后缀必须和后面数字参数给定的格式匹配,否则会报错。而且filename是指包含了源路径的文件路径名。

    名稱描述
    wdFormatDocument0Microsoft Office Word 97-2003年二進位檔案格式。
    wdFormatDOSText4Microsoft DOS 文字格式。
    wdFormatDOSTextLineBreaks5保留分行符號的 Microsoft DOS 文字。
    wdFormatEncodedText7編碼文字格式。
    wdFormatFilteredHTML10篩選的 HTML 格式。
    wdFormatFlatXML19儲存為單一的 XML 檔案開啟 XML 檔案格式。
    。。。。。。。。。
            word = wc.Dispatch("Word.Application")  # 打开word应用程序
            for docfile in docfiles:
                doc = word.Documents.Open(docfile)  # 打开word文件
                doc.SaveAs2('{}x'.format(docfile), 12)  # 另存为后缀为".docx"的文件,其中参数12指docx文件
                doc.Close()  # 关闭原来word文件
                os.remove(docfile)
            word.Quit()
    
    展开全文
  • 浏览器在线预览文件(支持pdf、excel、ppt、doc、jpg、png格式) PS:excel、ppt、doc格式只支持公网地址,如:http://xxx/x.odc
  • 用python将doc文件转换成docx文件

    千次阅读 2022-01-17 16:30:46
    用python3将doc文件批量转换成docx文件
  • 安装完成office 2016 后,*.doc文档右键只有编辑,没有打开。 遇到 .doc 文档之后不能直接调用 word 程序打开,且使用 office 自带修复工具未能修复。 解决方法 用注册表方式为*.doc文档创建 打开选项;将*.docx的...
  • doc文件转为txt文件

    千次阅读 2021-01-07 14:30:31
    doc文件转为txt文件需要几步? 答:需要两步, 1.先将doc转为docx。因为python-docx只能处理docx的文件,而无法处理doc文档。docx本质是xml文件比doc更小些。这里需要的包为win32com,如果没有,则pip即可。 ...
  • 如何不依赖插件,通过java代码使doc文件转换成docx文件?
  • Java实现DOC文件转DOCX文件

    千次阅读 2021-10-09 09:28:20
    1.文件较小少于500段,使用spire.doc.free转化 <dependency> <groupId>e-iceblue</groupId> <artifactId>spire.doc.free</artifactId> <version>3.9.0</version> &...
  • .net NPOI读写Doc文件

    千次阅读 2020-06-06 17:44:49
    1、NuGet安装NPOI ...XWPFDocument doc = new XWPFDocument(stream); foreach (var para in doc.Paragraphs) { string text = para.ParagraphText; //获得文本 if(text.Trim()!="") Console.WriteLine(text);
  • .doc文件不显示word图标的解决方法

    千次阅读 2021-08-18 13:26:54
    第一步:按win+r键,弹出运行框...第四步:找到HKEY_CLASSES_ROOT文件,找到其分支下的.doc和.docx文件,删除,退出注册表编辑器。 第五步:选择一个.doc和.docx文件,右键,打开方式选择word,始终选择这种方式。 ...
  • .doc文件不显示word图标

    千次阅读 2020-03-30 16:54:16
    .doc文件不显示word图标 前两天出现了.doc文件不显示图标的问题(空白,有点像.txt文件) (图是网上随便找的,因为一不小心弄好了,忘记截图了。 附图源链接:https://www.jb51.net/office/word/552687.html) ...
  • Python百度文库爬虫之doc文件

    千次阅读 2020-04-27 21:55:55
    Python百度文库爬虫之doc文件 说明:此文件是在爬取txt文件下的基础进行的,因此重复内容会一笔带过,不懂请看前面爬取txt文件链接 对于文件的所有类型,我都会用一篇文章进行说明,链接: Python百度文库爬虫之...
  • html 显示doc文件

    千次阅读 2018-12-17 15:25:32
    获取绝对路径会直接下载文件 寻求解决办法 1.JS获取word文档内容到html页面  ActiveXObject只支持ie,其他浏览器并不适用 2.https://blog.csdn.net/qxianx/article/details/81317894 &lt;iframe style=&...
  • 用Python将doc文件批量转为docx文件

    万次阅读 2017-12-28 14:50:54
    工具下载地址http://download.csdn.net/download/zzti_erlie/10177909使用指南选中输入...文件路径前后有空格不影响程序的运行 1. 点击右边的按钮,在弹出的对话框中选中文件即可 示例:C:/Users/Administrator/Desk
  • python大批量读写.doc文件的解决方案

    万次阅读 2017-12-22 14:57:31
    最近在做深度学习的项目,需要解析并处理几百个数量级的.doc文件。众所周知,python读写.txt文档可以说一路畅通无阻,不管你中文是什么格式;python在读写.docx文档时,也比较畅通,最多你需要在命令行安装python-...
  • java读取.doc文件

    千次阅读 2019-04-09 23:13:24
    需要的jar包: poi-3.17.jar poi-scratchpad-3.17.jar poi-ooxml-3.17.jar poi-ooxml-schemas-3.17.jar 下载地址: ...缺点:虽然两种方式都能读取,但只能读取doc文件,无法读取docx文件
  • vba实现doc文件批量转docx文件

    千次阅读 2019-06-10 15:00:26
    vba批量转换doc为docx说明 随便找一个word文件打开,同时按住Alt+F11,会出现如图所示界面: 在左边空白处右击,依次... Sub doc2docx() 'doc文件转docx文件 Dim myDialog As FileDialog, oFile As Varian...
  • js 移动端 下载 doc文件

    千次阅读 2019-07-22 11:31:31
    一:这种情况的话安卓会打开浏览器下载该文件,苹果的会打开页面 <a href=javascript:downloadfile("url....文件.doc</a> function downloadfile(hrefurl) { var url= hrefurl; var agent = ...
  • Java读取TXT文本文件乱码解决方案.doc

    热门讨论 2011-02-13 23:49:33
    Java读取TXT文本文件乱码解决方案.doc
  • 前面写了很多利用python-docx批量处理word文件的教程,但是python-docx不支持doc格式,因此如何将doc文件转为docx文件就是一个需要解决的问题,如果文件少可以另存为,如何文件多呢,因此需要一个doc批量转docx的...
  • 先展示下基本的效果,首先我们只有一个doc文件,与python的代码: 我这里用的是doc的word文档,文档内表格如下: 通过python读取后打印: 我这里没有专门按照表格内往excel中写,只是随意写了几个数据: 因为根据...
  • python读取doc/docx文件

    万次阅读 2019-06-09 00:40:24
    仅此记录python读取doc/docx文件的方法,和常用简单的open txt文件完全不同(版本python 3.6 Win10) docx 使用docx包,python为其专用接口,python-docx,使用 pip install python-docx 安装即可,本人第一次...
  • 使用POI读写word doc文件

    千次阅读 2018-07-25 10:44:06
    目录 1&nbsp;... 读word doc文件 1.1&nbsp;&nbsp;&nbsp;&nbsp; 通过WordExtractor读文件 1.2&nbsp;&nbsp;&nbsp;&nbsp; 通过HWPFDocument读文件 2&nbsp;&
  • java 通过poi操作word(doc文件

    千次阅读 2019-03-07 15:58:08
    通过POI类库实现word文档的创建。 思路: 通过自定义变量名,利用替换的方式...b)、目前支持DOC格式,不支持DOCX格式。 1、需要新建一个word模版,在需要输入数据的地方填入: ${变量名} 变量名称根据自行...
  • 1,当在门户网站的下载专区下载doc文件时,直接打开生成压缩包形式,并且解压过后不是对应得doc文档,如下截图所示:2.解决方法: 2.1 将部署root包下web.xml文档打开 2.2 将文档中标注的zip改成docx。 2.3改好后...
  • 内含: PrintShare破解版;从PrintShare中提取的惠普打印机驱动、PDF库文件DOC文件
  • 今天突然碰到我的Microsoft Office 2010无法打开.doc文件的问题,出现如下图的错误: 开始以为文件损坏了,由于文件比较重要,不甘心就这么算了,就试着打开其他的word文档,发现docx可以打开,但doc文件都无法...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 595,196
精华内容 238,078
关键字:

如何编辑doc文件