精华内容
下载资源
问答
  • 使用POI读取word文档

    2015-11-15 14:22:00
    最近在给客户做系统的时候,用户提出需求,要能够导入 word 文件,现在 microsoft word 几个版本 97、2003、2007的,这三个版本存储数据的格式上都相当大的差别,而现在 97 基本上已经退出市场,几乎没有人用...

    使用POI 读取word 文档(word 2003和2007)

    最近在给客户做系统的时候,用户提出需求,要能够导入 word 文件,现在 microsoft word 有好几个版本 97、2003、2007的,这三个版本存储数据的格式上都有相当大的差别,而现在 97 基本上已经退出市场,几乎没有人用这个版本了, 所以在我们的系统中只考虑 2003 版本和 2007 版本的,因为我们只要求能够读取 word 中的文字内容即可,其中的文字样式、图片等信息可以忽略,也不用直接操作 word 文件, 所以我们选择 用 apache 的 POI 进行读取。

     

        读取 2003 版本(.doc)的word文件相对来说比较简单,只需要 poi-3.5-beta6-20090622.jar 和 poi-scratchpad-3.5-beta6-20090622.jar 两个 jar 包即可, 而 2007 版本(.docx)就麻烦多,我说的这个麻烦不是我们写代码的时候麻烦,是要导入的 jar 包比较的多,有如下 7 个之多:  1. openxml4j-bin-beta.jar  2. poi-3.5-beta6-20090622.jar  3. poi-ooxml-3.5-beta6-20090622.jar  4 .dom4j-1.6.1.jar  5. geronimo-stax-api_1.0_spec-1.0.jar  6. ooxml-schemas-1.0.jar  7. xmlbeans-2.3.0.jar 其中 4-7 是 poi-ooxml-3.5-beta6-20090622.jar 所依赖的 jar 包(在 poi-bin-3.5-beta6-20090622.tar.gz 中的 ooxml-lib 目录下可以找到)。

     

        编写代码之前我们得先下载所需要的 jar 包, 我们只需下载 poi-bin-3.5-beta6-20090622.tar.gz 和openxml4j-bin-beta.jar 即可,因为所需要的其他 jar 包都能在 poi-bin-3.5-beta6-20090622.tar.gz 中找到, 下面是下载地址: poi-bin-3.5-beta6-20090622.tar.gz:http://apache.etoak.com/poi/dev/bin/poi-bin-3.5-beta6-20090622.tar.gz openxml4j-bin-beta.jar:http://mirror.optus.net/sourceforge/o/op/openxml4j/openxml4j-bin-beta.jar       下方是读取 word 文件的 Java 代码,值得注意的是: POI 在读取 word 文件的时候不会读取 word 文件中的图片信息, 还有就是对于 2007 版的 word(.docx), 如果 word 文件中有表格,所有表格中的数据都会在读取出来的字符串的最后。

    1. import java.io.File;  
    2. import java.io.FileInputStream;  
    3. import java.io.InputStream;  
    4.   
    5. import org.apache.poi.POIXMLDocument;  
    6. import org.apache.poi.POIXMLTextExtractor;  
    7. import org.apache.poi.hwpf.extractor.WordExtractor;  
    8. import org.apache.poi.openxml4j.opc.OPCPackage;  
    9. import org.apache.poi.xwpf.extractor.XWPFWordExtractor;  
    10.   
    11. /** 
    12.  * POI 读取 word 2003 和 word 2007 中文字内容的测试类<br /> 
    13.  * @createDate 2009-07-25 
    14.  * @author Carl He 
    15.  */  
    16. public class Test {  
    17.     public static void main(String[] args) {  
    18.         try {  
    19.             //word 2003: 图片不会被读取  
    20.               InputStream is = new FileInputStream(new File("c://files//2003.doc"));  
    21.             WordExtractor ex = new WordExtractor(is);  
    22.             String text2003 = ex.getText();  
    23.             System.out.println(text2003);  
    24.   
    25.             //word 2007 图片不会被读取, 表格中的数据会被放在字符串的最后  
    26.             OPCPackage opcPackage = POIXMLDocument.openPackage("c://files//2007.docx");  
    27.             POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);  
    28.             String text2007 = extractor.getText();  
    29.             System.out.println(text2007);  
    30.               
    31.         } catch (Exception e) {  
    32.             e.printStackTrace();  
    33.         }  
    34.     }  
    35. }  

      如果想下载完整的示例代码,可以到这里下载,这个 rar 包中有 POI 读取word 2003 和 word 2007 所需要的全部 jar 包 和 word 2003、word 2007 示例文件。

    ========仅供分享==========

    转载于:https://www.cnblogs.com/xm1-ybtk/p/4966521.html

    展开全文
  • 知识点:增加文件可以以独立的窗口打开,例Word文档在Word中打开 修正:新增知识点默认分类的可能出错,以“全部数据库”的方式显示时,缺省数据库以外的分类被选取仍可能出错 版本2.6.1.0更新时间:不详 增加批量...
  • ldr r1, =0x7ff /*根据 2410 芯片手册,INTSUBMSK 11位可用 */ ldr r0, =INTSUBMSK Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com) str r1, [r0] # endif ...
  • 了以上的几个问题,我就一直在想,到底是怎么样才能是算学英语是更快更理想的方式?学语言的基本要点是听说读写。这个各种语言的学习方法已经定义过不知道多少次了,在此就不在说明。听和说是最难的,要对一个单词...
  • 现在main.c command.h这几个文件,任何一个改了都会重编main.o。但是这里还有一个问题,如果修改了command.h,在command.h中加入#include "pub.h",这时: 1-再make,由于command.h改了,这时会重编main.o,并且会...
  • 没有过,接收发一个word文档,但是电脑没有安装office的烦恼? 现在你不用再烦恼了,只要网络,你就可以不用再安装任何程序 最近发现onenote是很不错的电子笔记本,决定向人推荐。结果发现对方使用的XP...

        你有没有过,接收发一个word文档,但是电脑没有安装office的烦恼?

        现在你不用再烦恼了,只要有网络,你就可以不用再安装任何程序

     

        最近发现onenote是个很不错的电子笔记本,决定向人推荐。结果发现对方使用的XP系统,无法安装office 2013,折腾几次发现最高安装版本原来只是office 2010.

        偶像要是不用安装你就可以使用office,那该有多方便。

        现在有了微软的onedrive,你就可以了。

        1. 注册一个live号:https://onedrive.live.com/about/zh-cn/ 

        2. 登录你就可以看到

        3. 咱选择一个大家都很熟悉的word,然后就可以看到一个神奇的word online,是不是很神奇,现在你就可以在线使用word了。在不同的机器上,只要登录onedrive就可以随时访问。

     

         哈哈,这还不是我最想推荐的,我最想推荐的当属onenote。onenote作为一个电子笔记本,可以实现我们笔记本所有的功能哦。不信你试试!

     

    转载于:https://www.cnblogs.com/aaronday/p/3565344.html

    展开全文
  • 毕业有感精选5篇 毕业有感1 忽而今夏,今日周六,记得大一大二大三时,现在这个时期应该是期末,所以都跑逸夫楼自习,就有几个周六遇到逸夫楼的教室里几层楼里面都有学生和老师在教室,当时还在想今天周六这些人都...
  • 知识点:增加文件可以以独立的窗口打开,例Word文档在Word中打开 修正:新增知识点默认分类的可能出错,以“全部数据库”的方式显示时,缺省数据库以外的分类被选取仍可能出错 版本2.6.1.0更新时间:不详 增加批量...
  • 知识点:增加文件可以以独立的窗口打开,例Word文档在Word中打开 修正:新增知识点默认分类的可能出错,以“全部数据库”的方式显示时,缺省数据库以外的分类被选取仍可能出错 版本2.6.1.0更新时间:不详 增加批量...
  • SVN客户端用户使用手册

    千次下载 热门讨论 2007-07-17 14:06:51
    如果是word文档的话,选择diff之后,系统会打开一个word文档,并在其中标出修改后的版本与修改前何不同。如图4.1 图4.1 (2)查看日志 如果想查看一文件的日志,例如soc_1,右键单击这文件,选择show log...
  • 比Mestrec上了一个档次,但是功能方面,好像还没有完善,因此到目前位置,我觉得还是有必要对Mestrec的使用方法做一下总结,毕竟现在大部分人都在用Mestrec,而且网上还没有一个像样的教程,有几个教程都没有涉及到...
  • 之前从网上下载到邢树军兄弟译的pdf版本,邢的这个版本用起来以下方面不便: 1.文件较大。 2.打开之后总是提示播放某首歌,很烦。 3.源代码和图形采用了大量的图片,不方便学习者直接复制到matlab中进行调试学习...
  • 软件良好的便携性,绿色版本可以直接放到U盘运行;密码保护、自动备份等多种措施保证您数据的安全;类似Baidu的一键搜索,便于您快速查找自己的海量个人信息;集成类似Word的文字处理器,您可以随时书写日记、备忘...
  • 论文检测系统软件,免费分享 反抄袭

    千次下载 热门讨论 2012-03-03 12:25:30
    提交您的有效论文,请不要上传无用文档,每IP仅2次检测机会,您的检测结果将以word文档的方式发送到您的邮箱里。 5 中国搜文章照妖镜 http://www.zhongguosou.com/ 文章照妖镜不但可用来分析文章抄袭的程度,...
  • 通常,提出的问题在几个小时内就能得到有效答复。多年来,我通过这个论坛获得了许多与Axure相关的知识,也很高兴能在论坛里帮助他人。当一款工具成为我工作的必需品时,好的技术支持就显得格外重要。因此,Axure官方...
  • 首先,ANSI C++是在十年前的技术条件下开发的,因此它不支持现在的概念(如Unicode字符串和生成XML文档),某些古老的语法结构是为以前的编译器设计的(如成员函数的声明和定义是分开的)。其次,Microsoft同时还试图...
  • 这本书现在市面上已经无售了,但还好,这本书很全的电子版本,从网上可以下载。提醒大家注意,这本书总共14章,最后一章叫做“SOCKET类的设计和实现”。网上常见的一电子版本是380K左右的CHM格式的版本。只有前8...
  • 公司年会大屏幕抽奖

    2018-09-25 15:06:14
    更新:每场活动现在有独特的活动签到连接,不会出现串场的问题了 2017.8.8 更新:可以修改管理员密码 更新:增加开幕墙 更新:增加闭幕墙 更新:大屏幕右上角二维码增加中等大小的显示(3种大小状态,适合各种场景使用...
  • C++MFC教程

    热门讨论 2013-05-21 13:37:15
    我很难说得清楚,也很难下一个定义(谁在嘘我),我下面从不同的几个方面讲解一下,希望大家看了后一点了解。 1、消息的组成:一个消息由一个消息名称(UINT),和两个参数(WPARAM,LPARAM)。当用户进行了输入...
  • vc++ 应用源码包_6

    热门讨论 2012-09-15 14:59:46
    独立打包,保证可解压,内含大量源码,网上搜集...在MFC应用程序中浏览PDF、Word文档文件 vcdialog 自绘对话框。 vc编程:自动停靠窗体,吸附窗体 OnMoving事件处理。 vc基于HTTP协议断点续传和多线程下载源代码 VC...
  • 而且现在有很多像八爪鱼、火车头这些可以定制的爬虫软件,还有一些自学习的爬虫框架。所以我觉得爬虫这一块只要稍微学下,了解下即可 我建议如果是python的话,了解urllib(http请求),requests(http请求),lxml...
  • vc++ 应用源码包_5

    热门讨论 2012-09-15 14:45:16
    独立打包,保证可解压,内含大量源码,网上搜集...在MFC应用程序中浏览PDF、Word文档文件 vcdialog 自绘对话框。 vc编程:自动停靠窗体,吸附窗体 OnMoving事件处理。 vc基于HTTP协议断点续传和多线程下载源代码 VC...
  • vc++ 应用源码包_1

    热门讨论 2012-09-15 14:22:12
    在MFC应用程序中浏览PDF、Word文档文件 vcdialog 自绘对话框。 vc编程:自动停靠窗体,吸附窗体 OnMoving事件处理。 vc基于HTTP协议断点续传和多线程下载源代码 VC满屏开满玫瑰花 VC然输入框出现气球提示 调用...
  • vc++ 应用源码包_2

    热门讨论 2012-09-15 14:27:40
    在MFC应用程序中浏览PDF、Word文档文件 vcdialog 自绘对话框。 vc编程:自动停靠窗体,吸附窗体 OnMoving事件处理。 vc基于HTTP协议断点续传和多线程下载源代码 VC满屏开满玫瑰花 VC然输入框出现气球提示 调用...
  • vc++ 应用源码包_4

    热门讨论 2012-09-15 14:38:35
    在MFC应用程序中浏览PDF、Word文档文件 vcdialog 自绘对话框。 vc编程:自动停靠窗体,吸附窗体 OnMoving事件处理。 vc基于HTTP协议断点续传和多线程下载源代码 VC满屏开满玫瑰花 VC然输入框出现...
  • 通过查看EmEditor的安装目录,可以发现,EmEditor有几个配置文件,理论上应该可以通过修改配置文件来达到配置EmEditor的目 的。然而,打开配置文件一看,如果您用过Vim,配置过Vim的话,会发现EmEditor的配置文件...
  • vc++ 应用源码包_3

    热门讨论 2012-09-15 14:33:15
    在MFC应用程序中浏览PDF、Word文档文件 vcdialog 自绘对话框。 vc编程:自动停靠窗体,吸附窗体 OnMoving事件处理。 vc基于HTTP协议断点续传和多线程下载源代码 VC满屏开满玫瑰花 VC然输入框...
  • 我试了试,还好我的Python基础和调试能力还不错,基本上代码都调试过一遍,很多高大上的 "理论+推导",在我眼中变成了几个 "加减乘除+循环",我想这不就是像我这样的程序员想要的入门教程么? 很多程序员说机器学习 ...
  • 我试了试,还好我的Python基础和调试能力还不错,基本上代码都调试过一遍,很多高大上的 "理论+推导",在我眼中变成了几个 "加减乘除+循环",我想这不就是像我这样的程序员想要的入门教程么? 很多程序员说机器学习 ...

空空如也

空空如也

1 2 3
收藏数 50
精华内容 20
关键字:

word文档现在有几个版本