精华内容
下载资源
问答
  • C#操作Word文档(根据模板生成文档、替换内容、插入表格等)
  • POI读取word文档的文字内容和图片内容

    千次下载 热门讨论 2014-09-04 13:55:55
    POI读取word文档的文字内容和图片内容
  • java读取word文档里面的内容(包括doc和docx格式)

    千次阅读 热门讨论 2019-11-30 20:19:47
    java读取word文档里面的内容(包括doc和docx格式) java读取word文档里面的内容(包括doc和docx格式),使用POI架包 使用的POI架包如下 poi-3.16.jar poi-examples-3.16.jar poi-excelant-3.16.jar poi-ooxml-3.16.jar ...

    java读取word文档里面的内容(包括doc和docx格式)

    java读取word文档里面的内容(包括doc和docx格式),使用POI架包

    使用的POI架包如下
    poi-3.16.jar
    poi-examples-3.16.jar
    poi-excelant-3.16.jar
    poi-ooxml-3.16.jar
    poi-ooxml-schemas-3.16.jar
    poi-scratchpad-3.16.jar

    目前POI的最新发布版本是3.10_FINAL.该版本保护的jar包有:
    在这里插入图片描述
    很多人都困惑POI那么多Jar到底应该导入哪一个。

    实际上很多时候我们只利用POI来操作Excel。甚至只用xls这一种格式。

    那么就没有必要全部都导入了。具体应该使用哪个JAR包请参考以下内容:
    在这里插入图片描述

    当我们只要使用xls格式时、只要导入poi-version-yyyymmdd.jar就可以了。

    当我们还要使用xlsx格式、还要导入poi-ooxml-version-yyyymmdd.jar。

    至于poi-ooxml-schemas-version-yyyymmdd.jar这个jar基本不太会用到的。

    当我们需要操作word、ppt、viso、outlook等时需要用到poi-scratchpad-version-yyyymmdd.jar。

    读取word文档中,doc后缀的文件

    直接上代码

    //读取word文档中,doc后缀的文件
    	public static List<String> searchWordDoc(String fileUrl){
    		List<String> docList = new ArrayList<String>();
    		String content=null;
    		//读取字节流,读取文件路径
    		InputStream input = null;
    		try {
    			input = new FileInputStream(new File(request.getSession().getServletContext().getRealPath(fileUrl)));
    			WordExtractor wex = new WordExtractor(input);
    			content = wex.getText();
    			//System.out.println(content);
    			docList.add(content);
    		} catch (Exception e) {
    			e.printStackTrace();
    		}
    		return docList;
    	}
    
    

    将文件路径传进来,最后得到的使一个List集合,是一行一行的读取,每一行的内容对应List的下标

    读取word文档中,docx后缀的文件

    直接上代码

    	public static List<String> searchWordDocX(String fileUrl){
    		//读取文件路径
    		OPCPackage opcPackage = null;
    		String content = null;
    		List<String> docxList = new ArrayList<String>();
    		try {
    			opcPackage = POIXMLDocument.openPackage(request.getSession().getServletContext().getRealPath(fileUrl));
    			XWPFDocument xwpf = new XWPFDocument(opcPackage);
    			POIXMLTextExtractor poiText = new XWPFWordExtractor(xwpf);
    			content = poiText.getText();
    			docxList.add(content);
    		} catch (IOException e) {
    			e.printStackTrace();
    		}
    		return docxList;
    	}
    
    

    将文件路径传进来,最后得到的使一个List集合,是一行一行的读取,每一行的内容对应List的下标

    最后附上jar包下载位置

    百度网盘:https://pan.baidu.com/s/1Y4BLto_mEUkS7Xhx1GJmzA
    提取码:vor5

    展开全文
  • java修改Word文档内容

    千次阅读 2019-01-30 12:15:47
    需要的jar包: poi-3.8-20120326.jar poi-scratchpad-3.8-20120326....创建word文档模板: 修改内容代码: public static void CreatWordByModel(String tmpFile, Map<String, String> contentMa...

    需要的jar包:

            poi-3.8-20120326.jar

            poi-scratchpad-3.8-20120326.jar

    创建word文档模板:

     

    修改内容代码:

       public static void CreatWordByModel(String  tmpFile, Map<String, String> contentMap, String exportFile) throws Exception{
      
            InputStream in = null;   
            in = new FileInputStream(new File(tmpFile));  
            
            HWPFDocument document = null;
            document = new HWPFDocument(in);
            // 读取文本内容
            Range bodyRange = document.getRange();
            System.out.println(bodyRange.toString());
            System.out.println(bodyRange.text());
            // 替换内容
            for (Map.Entry<String, String> entry : contentMap.entrySet()) {
                bodyRange.replaceText("${" + entry.getKey() + "}", entry.getValue());
            }
    
            //导出到文件
            try {
            	ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();
                document.write((OutputStream)byteArrayOutputStream);
                OutputStream outputStream = new FileOutputStream(exportFile);
                outputStream.write(byteArrayOutputStream.toByteArray());
                outputStream.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }

     

    测试代码:

        public static void main(String[] args) throws Exception {
            Map map=new HashMap();
            map.put("name","刁某某");
            map.put("age","24");
            map.put("sex","男");
            CreatWordByModel("G:/docModel.doc",map,"G:/downWord.doc");
        }

     

    测试结果:

     

    展开全文
  • 快速批量修改word文档内容

    千次阅读 2020-11-01 17:32:37
    这里写自定义目录标题快速批量修改word文档内容用到的库具体修改的需求1.批量替换标题中“[ ]”的内容2.批量替换word表格的内容(两个表格的替换的内容相同)3.保存时文件名的替换(文件名与文档标题相同)...

    快速批量修改word文档内容

    在工作中可能经常遇到需要对word中同一位置的内容进行批量修改或者替换,如果数据量小,手动改一改就可以了,但是遇到大量的修改,再用手动修改的方法的话,工作量就变得很大了,重复的复制粘贴也极容易出错,所以接下来给大家介绍一个用Python实现批量修改word文档内容的方法。给定一个word,然后批量替换并保存。

    用到的库

    doc

    具体修改的需求

    1.批量替换标题中“[ ]”里的内容

    2.批量替换word表格里的内容(两个表格里的替换的内容相同)

    3.保存时文件名的替换(文件名与文档标题相同)

    其他处理

    将需要替换的文件名和表格内容分别放在两个txt文档

    代码实现

    1.导包

    from docx import Document
    

    包就不做介绍了。

    2.读取两个txt文档

    with open("D:\\测试报告\\filename.txt",encoding='utf8') as fp:
        filename=fp.read().split("\n")
        fp.close()
    with open("D:\\测试报告\\chengxu.txt",encoding='utf8') as fp:
        chengxu=fp.read().split("\n")
        fp.close()
    

    因为txt文档里的内容是一行一个数据,所以我们用split方法制定分隔符为换行符进行切片,文件打开后记得关闭,不关闭就会导致文件一直被占用,无法进行其他操作。

    3.使用Document()方法读取模板word文档

    doc=Document("D:\\测试报告\\XXXX分析系统[XXXXXX接口需求0720]新业务测试报告.docx")
    

    4.修改文档标题

    for i in range(len(filename)):
        paragraphs=doc.paragraphs #获取文档对象
        paragraphs[1].text="[{}]开发测试报告".format(filename[i])
        runs=paragraphs[1].runs  #字体信息都包含在runs对象里
        title=runs[0] #runs是一个列表对象
        title.font.name='宋体'
        title.font.bold=True #字体加粗
        title.font.size=203200
    

    循环遍历读取txt里的标题,获取word文档的段落对象,因为需要修改的标题在第二行
    ,所以用paragraphs[1].text来表示第二行的内容。这里用了format方法来进行格式化。因为要保证修改后的内容的格式与原来的一样,所以在这之前先获得了标题的字体信息,现在直接对修改后的标题自字体的类型和大小进行赋值即可。

    5.修改表格里的内容

    tables=doc.tables #获取表格对象
    tables[1].cell(1,0).text="1、	{}".format(chengxu[i]) #赋值需要替换的表格内容
    tables[2].cell(8,2).text="{}".format(chengxu[i]) #赋值需要替换的表格内容
    tables[1]._cells[5].paragraphs[0].runs[0].font.name='宋体'
    tables[1]._cells[5].paragraphs[0].runs[0].font.size=114300
    

    tables[1]表示word里的第二个表格,cell(1,0)表示表格的第2行第1列,其他同理。_cells[5]表示第五个单元格。

    6.文档的保存

    doc.save("D:\\测试报告\\XXXX分析系统[{}]新业务测试报告.docx".format(filename[i]))
    

    7.最后效果

    在处理成百上千的文档时就很方便了。

    完整代码

    
    from docx import Document
    
    with open("D:\\测试报告\\filename.txt",encoding='utf8') as fp:
        filename=fp.read().split("\n")
        fp.close()
    with open("D:\\测试报告\\chengxu.txt",encoding='utf8') as fp:
        chengxu=fp.read().split("\n")
        fp.close()
        
    doc=Document("D:\\测试报告\\XXXX分析系统XXXXXX接口需求0720]新业务测试报告.docx")
    for i in range(len(filename)):
        paragraphs=doc.paragraphs
        paragraphs[1].text="[{}]开发测试报告".format(filename[i])
        runs=paragraphs[1].runs
        title=runs[0]
        title.font.name='宋体'
        title.font.bold=True
        title.font.size=203200
        tables=doc.tables
        tables[1].cell(1,0).text="1、	{}".format(chengxu[i])
        tables[2].cell(8,2).text="{}".format(chengxu[i])
        tables[1]._cells[5].paragraphs[0].runs[0].font.name='宋体'
        tables[1]._cells[5].paragraphs[0].runs[0].font.size=114300
        doc.save("D:\\测试报告\\结果\\XXXX分析系统[{}]新业务测试报告.docx".format(filename[i]))
    
    展开全文
  • Java 读取Word文档中的文本内容

    万次阅读 2019-04-25 16:53:26
    这篇文章将介绍如何使用Free Spire.Doc for Java组件Java应用程序中读取Word文档的文本内容。Free Spire.Doc for Java提供了两种方法来读取Word文档中的内容,一种是直接获取文档中的所有文本内容,另一种是遍历...

    这篇文章将介绍如何使用Free Spire.Doc for Java组件在Java应用程序中读取Word文档的文本内容。Free Spire.Doc for Java提供了两种方法来读取Word文档中的内容,一种是直接获取文档中的所有文本内容,另一种是遍历文档的每个段落,然后获取段落中的文本,下面将逐一介绍这两种方法。

    Word文档如下:

    导入jar文件

    在开始前,我们需要导入jar文件。下载Free Spire.Doc for Java并解压缩,然后从lib文件夹下,导入Spire.Doc.jar包到你的Java应用程序中。

    (对于maven工程,可以在pom.xml文件中添加对Free Spire.Doc for Java的依赖,参考这篇文章:如何通过Maven仓库安装Spire Java系列组件)

    示例代码

    方法一 直接获取所有文本

    Document类的getText()方法,支持直接获取整个Word文档的所有文本,两行代码就能搞定。

    import com.spire.doc.*;
    
    import java.io.IOException;
    
    public class TextReader {
        public static void main(String[] args) throws IOException {
            //加载Word文档
            Document doc = new Document("Input.docx");
    
            //获取文本
            System.out.println(doc.getText());
        }
    }

    方法二 遍历段落获取文本

    这种方式方法比方法一更加灵活,除了可以获取指定段落的文本外,还可以获取段落的其他属性比如字体、字体大小、对齐方式等。

    import com.spire.doc.*;
    import com.spire.doc.documents.Paragraph;
    
    import java.io.IOException;
    
    public class ParagraphReader {
        public static void main(String[] args) throws IOException {
            //加载Word文档 
            Document doc = new Document("Input.docx");
    
            //遍历文档中的节和段落,获取每个段落的文本         
            for(int i = 0; i < doc.getSections().getCount(); i++) {
                Section section = doc.getSections().get(i);
                for (int j = 0; j < section.getParagraphs().getCount(); j++) {
                    Paragraph paragraph = section.getParagraphs().get(j);
                    System.out.println(paragraph.getText());
                }
            }
        }
    }
    读取结果(内容太长,没有截全):

     

    展开全文
  • 使用POI读取word文档内容

    万次阅读 2017-05-14 22:59:33
    word doc文件2中方式 1.1 通过WordExtractor读文件(WordExtractor内部进行信息读取时还是通过HWPFDocument来获取的。) 1.2 通过HWPFDocument读文件 ...hwpf里面我们使用HWPFDocument来表示一个word doc文
  • 多个Word文档中查找指定文件内容

    万次阅读 热门讨论 2016-08-09 13:20:41
    文档内容检索工具版本已更新,下面的下载地址链接已更新 实现了简单的Word文档查找的功能,可指定多个关键词多个Word文档中对关键词进行查找,功能比较简单,能够查找到匹配的文字,并统计匹配关键词的个数。...
  • 用我们自己指定的word模板,生成新的word,代码填写内容到新的word中,可以插入图片、插入文件、插入音频、视频,有不懂的可以联系我。运行已编译成功,希望大家学习。
  • python批量修改word文档内容

    千次阅读 2020-04-28 17:17:47
    批量word文档内容 用到的python模块 pip install python-docx 脚本内容 #!/usr/bin/env python # -*- coding: utf-8 -*- import os import docx import sys #需替换文档目录 path = u'G:\文档修改' #自动创建 tlog ...
  • C# 读取并显示word文档中的内容

    万次阅读 2019-03-17 18:33:26
    我想将信道模型的介绍以及分析的情况,都C#的程序设计中进行实现。然后就想到了将word文档直接显示到...要加入word文档,就需要”解决方案资源管理器”的”引用”中加入”Microsoft Word 12.0 Object Library ”...
  • C# 读取Word文档中的文本内容

    万次阅读 2018-04-13 18:01:10
    这篇文章将介绍如何使用C#读取Word文档中的全部或指定段落的文本内容
  • Springboot 项目freemarker导出word文档(文档内容包括数据以及服务器图片) 前些天有需求要完成导出word文档功能,基础数据导出word文档,网上也能搜到很多源代码,但是我这边要求是服务器上的图片(只给出服务器图片...
  • 有时候我们编辑word文档的时候需要利用一些图形来完成操作,那么应该如何画图呢,下面就由小编来为大家讲解讲解如何在word文档中画图。 首先我们把需要编辑的word文档打开,或者新建一个空白的文档来进行学习。...
  • 这里有两个项目一个是下载的,一个是打开wrod文档的比较简单可以合成使用
  • Word文档批量替换工具

    万次阅读 2019-07-01 11:25:01
    日常工作中可能会碰到这样的情况,就是需要批量替换一些文件的内容,如合同、产品说明、ISO认证标准化文档(质量手册、程序文件、管理手册)、项目推广方案等,先做批量替换,再进行修改,可以节省大量时间。...
  • JS获取word文档内容到html页面

    万次阅读 2017-12-12 16:12:36
    <!DOCTYPE html> <title>Title var w = new ActiveXObject('Word.Application'); var docText; var obj;
  • 复制文档内容这个功能太常见啦,微软word中实现这个功能很简单,只需要复制和粘贴就行了。这篇文章的主要目的是记录如何用C#来实现复制一个Word文档的部分或全部内容到另一个Word文档,废话不多说,下面开始。第一...
  • python实现word文档内容替换

    千次阅读 2020-07-09 23:51:31
    利用win32com模块对.doc文档转为docx from win32com import client as wc import os import docx import sys def help(): print("Format: python py_file path+filename.doc/.docx A/B/C a/b/c\n" "eg: ...
  • 使用poi组件自动填充模板word内容和图片.
  • Java导出Word文档的实现

    万次阅读 多人点赞 2020-10-18 16:17:13
    日常的开发工作中,我们时常会遇到导出Word文档报表的需求,比如公司的财务报表、医院的患者统计报表、电商平台的销售报表等等。 导出Word方式多种多样,通常有以下几种方式: 1. 使用第三方Java工具类库Hutool...
  • 经常做Oa系统的人,难免经常遇到word文档处理的问题,现在针对已经存在的word文档,需要添加水印,设置保护信息,防止别人下载后更改文档内容
  • Android 使用模板生成Word文档,支持手机直接查看word,很强大、直接拿来用
  • word多个文档替换内容

    万次阅读 热门讨论 2018-09-05 14:51:57
    替换文件夹下所有文档内容,需要替换的文档不能打开,采用宏进行批量替换,亲测成功,测试是word2016 根据简书作者改编https://www.jianshu.com/p/9d348b8015b6?utm_campaign=maleskine&amp;utm_content=note...
  • Word类生成word文档(可批量生成)

    热门讨论 2012-05-13 10:42:57
    利用Word类生成word文档,简洁的代码,不一样的效果,可以批量生产word文档
  • Python修改Word文档内容和插入图片

    千次阅读 2021-02-25 21:25:43
    代码如下 #!/usr/bin/python # coding:utf-8 import docx def main(): filepath = 'test.docx' filepath1 = 'wtest.docx' newdocx = docx.Document(filepath) table = newdocx.tables for oTable in table: ...
  • WinForm嵌入Word文档控件开发

    热门讨论 2013-06-04 10:41:34
    因为看到论坛中很多人想把Word文档中嵌入WinForm中,虽然WebBrowser控件可以实现这个功能,但是使用这个控件不能对Word进行很好的控制,这个资源通过自定义控件来实现嵌入Word文档,大家可以下载下来研究下的
  • (Word学习交流群:180627193)一位朋友问到,如何一次性批量替换多个word文档中的同一内容。其实,实现多个Word文档的字符进行批量替换的方法有多种。(www.itblw.com)  第一种方法,可以利用第三方软件:...
  • 今天做表格时打算把word文档里的文字复制到excel单元格里时发现复制不了,经过一番操作最终解决了。方法如下:WPS下的文档默认的后缀是.docx,如果用WPS打开的文档后缀.doc则只为只读模式,因此无法编辑和复制,这时...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 398,707
精华内容 159,482
关键字:

如何在word文档里找内容