精华内容
下载资源
问答
  • java 读取word

    热门讨论 2011-06-03 08:49:54
    这是一个用java编写的程序实例 用来读取word内容
  • java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报错找不到注册,比较诡异,...

    java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报错找不到注册,比较诡异,我曾经在不同的机器上试过,操作方法完全一致,有的机器不报错,有的报错,去他们论坛找高人解决也说不出原因,项目部署用它有点玄;itxt好像写很方便但是我查了好久资料没有见到过关于读的好办法。经过一番选择还是折中点采用rtf最好,毕竟rtf是开源格式,不需要借助任何插件,只需基本IO操作外加编码转换即可。rtf格式文件表面看来和doc没啥区别,都可以用word打开,各种格式都可以设定。

    ----- 实现的功能:读取rtf模板内容(格式和文本内容),替换变化部分,形成新的rtf文档。

    ----- 实现思路:模板中固定部分手动输入,变化的部分用$info$表示,只需替换$info$即可。

    1、采用字节的形式读取rtf模板内容

    2、将可变的内容字符串转为rtf编码

    3、替换原文中的可变部分,形成新的rtf文档

    主要程序如下:

    /**

    * 将制定的字符串转换为rtf编码

    */

    public String bin2hex(String bin) {

    char[] digital = "0123456789ABCDEF".toCharArray();

    StringBuffer sb = new StringBuffer("");

    byte[] bs = bin.getBytes();

    int bit;

    for (int i = 0; i < bs.length;i++) {

    bit = (bs[i] & 0x0f0) >> 4;

    sb.append("\\'");

    sb.append(digital[bit]);

    bit = bs[i] & 0x0f;

    sb.append(digital[bit]);

    }

    return sb.toString();

    }

    /**

    * 字节形式读取rtf模板内容

    */

    public String readByteRtf(InputStream ins, String path){

    String sourcecontent = "";

    try{

    ins = new FileInputStream(path);

    byte[] b = new byte[1024];

    if (ins == null) {

    System.out.println("源模板文件不存在");

    }

    int bytesRead = 0;

    while (true) {

    bytesRead = ins.read(b, 0, 1024); // return final read bytes counts

    if(bytesRead == -1) {// end of InputStream

    System.out.println("读取模板文件结束");

    break;

    }

    sourcecontent += new String(b, 0, bytesRead); // convert to string using bytes

    }

    }catch(Exception e){

    e.printStackTrace();

    }

    }

    以上为核心代码,剩余部分就是替换,从新组装java中的String.replace(oldstr,newstr);方法可以实现,在这就不贴了。源代码部分详见附件。运行源代码前提:

    c盘创建YQ目录,将附件中"模板.rtf"复制到YQ目录之下,运行OpreatorRTF.java文件即可,就会在YQ目录下生成文件名如:21时15分19秒_cheney_记录.rtf 的文件。。。。。文件名是在程序中指定的呵呵。由于是由商业软件中拆分出的demo所以只是将自己原来的写的程序分离,合并在一个java文件中,所以有的方法在示例程序中看似多余,没有必要那么麻烦。

    对于替换部分需要循环的特例程序,我不好拆分,里面很容易暴露商业软件的东西,所以就不贴了,有需要的话可以加我QQ或者MSN,一起讨论呵呵。附件传了半天也没有传上去,没有办法只有这样搞了呵呵。模板文件附件无法存放,需要的直接联系呵呵。其实直接看以下的java程序部分,就会明白

    /**

    * 以下部分是java源代码

    */

    package com;

    import java.io.File;

    import java.io.FileInputStream;

    import java.io.FileWriter;

    import java.io.IOException;

    import java.io.InputStream;

    import java.io.PrintWriter;

    import java.text.SimpleDateFormat;

    import java.util.Date;

    public class OperatorRTF {

    /**

    * 字符串转换为rtf编码

    * @param content

    * @return

    */

    public String strToRtf(String content){

    char[] digital = "0123456789ABCDEF".toCharArray();

    StringBuffer sb = new StringBuffer("");

    byte[] bs = content.getBytes();

    int bit;

    for (int i = 0; i < bs.length; i++) {

    bit = (bs[i] & 0x0f0) >> 4;

    sb.append("\\'");

    sb.append(digital[bit]);

    bit = bs[i] & 0x0f;

    sb.append(digital[bit]);

    }

    return sb.toString();

    }

    /**

    * 替换文档的可变部分

    * @param content

    * @param replacecontent

    * @param flag

    * @return

    */

    public String replaceRTF(String content,String replacecontent,int flag){

    String rc = strToRtf(replacecontent);

    String target = "";

    /*if(flag==0){

    target = content.replace("$time$",rc);

    }*/

    if(flag==0){

    target = content.replace("$timetop$",rc);

    }

    if(flag==1){

    target = content.replace("$info$",rc);

    }

    if(flag==2){

    target = content.replace("$idea$",rc);

    }

    if(flag==3){

    target = content.replace("$advice$",rc);

    }

    if(flag==4){

    target = content.replace("$infosend$",rc);

    }

    return target;

    }

    /**

    * 获取文件路径

    * @param flag

    * @return

    */

    public String getSavePath() {

    String path = "C:\\YQ";

    File fDirecotry = new File(path);

    if (!fDirecotry.exists()) {

    fDirecotry.mkdirs();

    }

    return path;

    }

    /**

    * 半角转为全角

    */

    public String ToSBC(String input){

    char[] c = input.toCharArray();

    for (int i = 0; i < c.length; i++){

    if (c[i] == 32){

    c[i] = (char) 12288;

    continue;

    }

    if (c[i] < 127){

    c[i] = (char) (c[i] + 65248);

    }

    }

    return new String(c);

    }

    public void rgModel(String username, String content) {

    // TODO Auto-generated method stub

    /*  构建生成文件名 targetname:12时10分23秒_username_记录.rtf */

    Date current=new Date();

    SimpleDateFormat sdf=new java.text.SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

    String targetname = sdf.format(current).substring(11,13) + "时";

    targetname += sdf.format(current).substring(14,16) + "分";

    targetname += sdf.format(current).substring(17,19) + "秒";

    targetname += "_" + username +"_记录.rtf";

    /* 字节形式读取模板文件内容,将结果转为字符串 */

    String strpath = getSavePath();

    String sourname = strpath+"\\"+"模板.rtf";

    String sourcecontent = "";

    InputStream ins = null;

    try{

    ins = new FileInputStream(sourname);

    byte[] b = new byte[1024];

    if (ins == null) {

    System.out.println("源模板文件不存在");

    }

    int bytesRead = 0;

    while (true) {

    bytesRead = ins.read(b, 0, 1024); // return final read bytes counts

    if(bytesRead == -1) {// end of InputStream

    System.out.println("读取模板文件结束");

    break;

    }

    sourcecontent += new String(b, 0, bytesRead); // convert to string using bytes

    }

    }catch(Exception e){

    e.printStackTrace();

    }

    /* 修改变化部分 */

    String targetcontent = "";

    /**

    * 拆分之后的数组元素与模板中的标识符对应关系

    * array[0]:timetop

    * array[1]:info

    * array[2]:idea

    * array[3]:advice

    * array[4]:infosend

    */

    String array[] = content.split("~");

    /**

    * 2008年11月27日:更新模板之后时间无需自动填充

    */

    /*String nowtime = sdf.format(current).substring(0,4) + "年";

    nowtime += sdf.format(current).substring(5,7) + "月";

    nowtime += sdf.format(current).substring(8,10) + "日";*/

    for(int i=0;i

    /*if(i==0){

    targetcontent = documentDoc.replaceRTF(sourcecontent,nowtime,i);

    }else{

    targetcontent = documentDoc.replaceRTF(targetcontent,array[i-1],i);

    }*/

    if(i==0){

    targetcontent = replaceRTF(sourcecontent, array[i], i);

    }else{

    targetcontent = replaceRTF(targetcontent, array[i], i);

    }

    }

    /* 结果输出保存到文件 */

    try {

    FileWriter fw = new FileWriter(getSavePath()+"\\" + targetname,true);

    PrintWriter out = new PrintWriter(fw);

    if(targetcontent.equals("")||targetcontent==""){

    out.println(sourcecontent);

    }else{

    out.println(targetcontent);

    }

    out.close();

    fw.close();

    System.out.println(getSavePath()+"  该目录下生成文件" + targetname + " 成功");

    } catch (IOException e) {

    // TODO Auto-generated catch block

    e.printStackTrace();

    }

    }

    public static void main(String[] args) {

    // TODO Auto-generated method stub

    OperatorRTF oRTF = new OperatorRTF();

    /**

    * 被替换内容以"~"符号分割,处理的时候将其拆分为数组即可

    */

    String content = "2008年10月12日9时-2008年10月12日6时~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法";

    oRTF.rgModel("cheney",content);

    }

    }

    展开全文
  • Java读取Word文档

    2016-04-12 16:56:38
    Java读取Word文档
  • java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报错找不到注册,比较诡异,...

    java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报错找不到注册,比较诡异,我曾经在不同的机器上试过,操作方法完全一致,有的机器不报错,有的报错,去他们论坛找高人解决也说不出原因,项目部署用它有点玄;itxt好像写很方便但是我查了好久资料没有见到过关于读的好办法。经过一番选择还是折中点采用rtf最好,毕竟rtf是开源格式,不需要借助任何插件,只需基本IO操作外加编码转换即可。rtf格式文件表面看来和doc没啥区别,都可以用word打开,各种格式都可以设定。

    ----- 实现的功能:读取rtf模板内容(格式和文本内容),替换变化部分,形成新的rtf文档。

    ----- 实现思路:模板中固定部分手动输入,变化的部分用$info$表示,只需替换$info$即可。

    1、采用字节的形式读取rtf模板内容

    2、将可变的内容字符串转为rtf编码

    3、替换原文中的可变部分,形成新的rtf文档

    主要程序如下:

    /**

    * 将制定的字符串转换为rtf编码

    */

    public String bin2hex(String bin) {         char[] digital = "0123456789ABCDEF".toCharArray();         StringBuffer sb = new StringBuffer("");         byte[] bs = bin.getBytes();         int bit;         for (int i = 0; i < bs.length;i++) {             bit = (bs[i] & 0x0f0) >> 4;

    sb.append("\\'");             sb.append(digital[bit]);             bit = bs[i] & 0x0f;             sb.append(digital[bit]);         }         return sb.toString();     }

    /**

    * 字节形式读取rtf模板内容

    */

    public String readByteRtf(InputStream ins, String path){

    String sourcecontent = "";   try{     ins = new FileInputStream(path);     byte[] b = new byte[1024];           if (ins == null) {                System.out.println("源模板文件不存在");           }           int bytesRead = 0;           while (true) {               bytesRead = ins.read(b, 0, 1024); // return final read bytes counts               if(bytesRead == -1) {// end of InputStream                System.out.println("读取模板文件结束");                break;               }               sourcecontent += new String(b, 0, bytesRead); // convert to string using bytes            }   }catch(Exception e){    e.printStackTrace();   }

    }

    以上为核心代码,剩余部分就是替换,从新组装java中的String.replace(oldstr,newstr);方法可以实现,在这就不贴了。源代码部分详见附件。运行源代码前提:

    c盘创建YQ目录,将附件中"模板.rtf"复制到YQ目录之下,运行OpreatorRTF.java文件即可,就会在YQ目录下生成文件名如:21时15分19秒_cheney_记录.rtf 的文件。。。。。文件名是在程序中指定的呵呵。由于是由商业软件中拆分出的demo所以只是将自己原来的写的程序分离,合并在一个java文件中,所以有的方法在示例程序中看似多余,没有必要那么麻烦。

    对于替换部分需要循环的特例程序,我不好拆分,里面很容易暴露商业软件的东西,所以就不贴了,有需要的话可以加我QQ或者MSN,一起讨论呵呵。附件传了半天也没有传上去,没有办法只有这样搞了呵呵。模板文件附件无法存放,需要的直接联系呵呵。其实直接看以下的java程序部分,就会明白

    /**

    * 以下部分是java源代码

    */

    package com;

    import java.io.File;

    import java.io.FileInputStream;

    import java.io.FileWriter;

    import java.io.IOException;

    import java.io.InputStream;

    import java.io.PrintWriter;

    import java.text.SimpleDateFormat;

    import java.util.Date;

    public class OperatorRTF {

    /**

    * 字符串转换为rtf编码

    * @param content

    * @return

    */

    public String strToRtf(String content){

    char[] digital = "0123456789ABCDEF".toCharArray();

    StringBuffer sb = new StringBuffer("");

    byte[] bs = content.getBytes();

    int bit;

    for (int i = 0; i < bs.length; i++) {

    bit = (bs[i] & 0x0f0) >> 4;

    sb.append("\\'");

    sb.append(digital[bit]);

    bit = bs[i] & 0x0f;

    sb.append(digital[bit]);

    }

    return sb.toString();

    }

    /**

    * 替换文档的可变部分

    * @param content

    * @param replacecontent

    * @param flag

    * @return

    */

    public String replaceRTF(String content,String replacecontent,int flag){

    String rc = strToRtf(replacecontent);

    String target = "";

    /*if(flag==0){

    target = content.replace("$time$",rc);

    }*/

    if(flag==0){

    target = content.replace("$timetop$",rc);

    }

    if(flag==1){

    target = content.replace("$info$",rc);

    }

    if(flag==2){

    target = content.replace("$idea$",rc);

    }

    if(flag==3){

    target = content.replace("$advice$",rc);

    }

    if(flag==4){

    target = content.replace("$infosend$",rc);

    }

    return target;

    }

    /**

    * 获取文件路径

    * @param flag

    * @return

    */

    public String getSavePath() {

    String path = "C:\\YQ";

    File fDirecotry = new File(path);

    if (!fDirecotry.exists()) {

    fDirecotry.mkdirs();

    }

    return path;

    }

    /**

    * 半角转为全角

    */

    public String ToSBC(String input){

    char[] c = input.toCharArray();

    for (int i = 0; i < c.length; i++){

    if (c[i] == 32){

    c[i] = (char) 12288;

    continue;

    }

    if (c[i] < 127){

    c[i] = (char) (c[i] + 65248);

    }

    }

    return new String(c);

    }

    public void rgModel(String username, String content) {

    // TODO Auto-generated method stub

    /*  构建生成文件名 targetname:12时10分23秒_username_记录.rtf */

    Date current=new Date();

    SimpleDateFormat sdf=new java.text.SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

    String targetname = sdf.format(current).substring(11,13) + "时";

    targetname += sdf.format(current).substring(14,16) + "分";

    targetname += sdf.format(current).substring(17,19) + "秒";

    targetname += "_" + username +"_记录.rtf";

    /* 字节形式读取模板文件内容,将结果转为字符串 */

    String strpath = getSavePath();

    String sourname = strpath+"\\"+"模板.rtf";

    String sourcecontent = "";

    InputStream ins = null;

    try{

    ins = new FileInputStream(sourname);

    byte[] b = new byte[1024];

    if (ins == null) {

    System.out.println("源模板文件不存在");

    }

    int bytesRead = 0;

    while (true) {

    bytesRead = ins.read(b, 0, 1024); // return final read bytes counts

    if(bytesRead == -1) {// end of InputStream

    System.out.println("读取模板文件结束");

    break;

    }

    sourcecontent += new String(b, 0, bytesRead); // convert to string using bytes

    }

    }catch(Exception e){

    e.printStackTrace();

    }

    /* 修改变化部分 */

    String targetcontent = "";

    /**

    * 拆分之后的数组元素与模板中的标识符对应关系

    * array[0]:timetop

    * array[1]:info

    * array[2]:idea

    * array[3]:advice

    * array[4]:infosend

    */

    String array[] = content.split("~");

    /**

    * 2008年11月27日:更新模板之后时间无需自动填充

    */

    /*String nowtime = sdf.format(current).substring(0,4) + "年";

    nowtime += sdf.format(current).substring(5,7) + "月";

    nowtime += sdf.format(current).substring(8,10) + "日";*/

    for(int i=0;i

    /*if(i==0){

    targetcontent = documentDoc.replaceRTF(sourcecontent,nowtime,i);

    }else{

    targetcontent = documentDoc.replaceRTF(targetcontent,array[i-1],i);

    }*/

    if(i==0){

    targetcontent = replaceRTF(sourcecontent, array[i], i);

    }else{

    targetcontent = replaceRTF(targetcontent, array[i], i);

    }

    }

    /* 结果输出保存到文件 */

    try {

    FileWriter fw = new FileWriter(getSavePath()+"\\" + targetname,true);

    PrintWriter out = new PrintWriter(fw);

    if(targetcontent.equals("")||targetcontent==""){

    out.println(sourcecontent);

    }else{

    out.println(targetcontent);

    }

    out.close();

    fw.close();

    System.out.println(getSavePath()+"  该目录下生成文件" + targetname + " 成功");

    } catch (IOException e) {

    // TODO Auto-generated catch block

    e.printStackTrace();

    }

    }

    public static void main(String[] args) {

    // TODO Auto-generated method stub

    OperatorRTF oRTF = new OperatorRTF();

    /**

    * 被替换内容以"~"符号分割,处理的时候将其拆分为数组即可

    */

    String content = "2008年10月12日9时-2008年10月12日6时~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法";

    oRTF.rgModel("cheney",content);

    }

    }

    展开全文
  • Java读取Word表格内容

    2018-06-09 22:07:28
    通过Java读取word表格中的内容,将内容存到数据库中,将Word中的图片存到硬盘中
  • Java读取Word文档页数

    2017-10-19 10:19:59
    里面包含一个word转pdf的jar,和一个读取pdf的jar。可以实现Java读取Word文档的页数。
  • java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报错找不到注册,比较诡异,...

    java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报错找不到注册,比较诡异,我曾经在不同的机器上试过,操作方法完全一致,有的机器不报错,有的报错,去他们论坛找高人解决也说不出原因,项目部署用它有点玄;itxt好像写很方便但是我查了好久资料没有见到过关于读的好办法。经过一番选择还是折中点采用rtf最好,毕竟rtf是开源格式,不需要借助任何插件,只需基本IO操作外加编码转换即可。rtf格式文件表面看来和doc没啥区别,都可以用word打开,各种格式都可以设定。

    ----- 实现的功能:读取rtf模板内容(格式和文本内容),替换变化部分,形成新的rtf文档。

    ----- 实现思路:模板中固定部分手动输入,变化的部分用$info$表示,只需替换$info$即可。

    1、采用字节的形式读取rtf模板内容

    2、将可变的内容字符串转为rtf编码

    3、替换原文中的可变部分,形成新的rtf文档

    主要程序如下:

    public String bin2hex(String bin) {

    char[] digital = "0123456789ABCDEF".toCharArray();

    StringBuffer sb = new StringBuffer("");

    byte[] bs = bin.getBytes();

    int bit;

    for (int i = 0; i < bs.length;i++) {

    bit = (bs[i] & 0x0f0) >> 4;

    sb.append("\\'");

    sb.append(digital[bit]);

    bit = bs[i] & 0x0f;

    sb.append(digital[bit]);

    }

    return sb.toString();

    }

    public String readByteRtf(InputStream ins, String path){

    String sourcecontent = "";

    try{

    ins = new FileInputStream(path);

    byte[] b = new byte[1024];

    if (ins == null) {

    System.out.println("源模板文件不存在");

    }

    int bytesRead = 0;

    while (true) {

    bytesRead = ins.read(b, 0, 1024); // return final read bytes counts

    if(bytesRead == -1) {// end of InputStream

    System.out.println("读取模板文件结束");

    break;

    }

    sourcecontent += new String(b, 0, bytesRead); // convert to string using bytes

    }

    }catch(Exception e){

    e.printStackTrace();

    }

    return sourcecontent ;

    }

    以上为核心代码,剩余部分就是替换,从新组装java中的String.replace(oldstr,newstr);方法可以实现,在这就不贴了。源代码部分详见附件。

    运行源代码前提:

    c盘创建YQ目录,将附件中"模板.rtf"复制到YQ目录之下,运行OpreatorRTF.java文件即可,就会在YQ目录下生成文件名如:21时15分19秒_cheney_记录.rtf 的文件。

    package com;

    import java.io.File;

    import java.io.FileInputStream;

    import java.io.FileWriter;

    import java.io.IOException;

    import java.io.InputStream;

    import java.io.PrintWriter;

    import java.text.SimpleDateFormat;

    import java.util.Date;

    public class OperatorRTF {

    public String strToRtf(String content){

    char[] digital = "0123456789ABCDEF".toCharArray();

    StringBuffer sb = new StringBuffer("");

    byte[] bs = content.getBytes();

    int bit;

    for (int i = 0; i < bs.length; i++) {

    bit = (bs[i] & 0x0f0) >> 4;

    sb.append("\\'");

    sb.append(digital[bit]);

    bit = bs[i] & 0x0f;

    sb.append(digital[bit]);

    }

    return sb.toString();

    }

    public String replaceRTF(String content,String replacecontent,int flag){

    String rc = strToRtf(replacecontent);

    String target = "";

    if(flag==0){

    target = content.replace("$timetop$",rc);

    }

    if(flag==1){

    target = content.replace("$info$",rc);

    }

    if(flag==2){

    target = content.replace("$idea$",rc);

    }

    if(flag==3){

    target = content.replace("$advice$",rc);

    }

    if(flag==4){

    target = content.replace("$infosend$",rc);

    }

    return target;

    }

    public String getSavePath() {

    String path = "C:\\YQ";

    File fDirecotry = new File(path);

    if (!fDirecotry.exists()) {

    fDirecotry.mkdirs();

    }

    return path;

    }

    public String ToSBC(String input){

    char[] c = input.toCharArray();

    for (int i = 0; i < c.length; i++){

    if (c[i] == 32){

    c[i] = (char) 12288;

    continue;

    }

    if (c[i] < 127){

    c[i] = (char) (c[i] + 65248);

    }

    }

    return new String(c);

    }

    public void rgModel(String username, String content) {

    // TODO Auto-generated method stub

    Date current=new Date();

    SimpleDateFormat sdf=new java.text.SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

    String targetname = sdf.format(current).substring(11,13) + "时";

    targetname += sdf.format(current).substring(14,16) + "分";

    targetname += sdf.format(current).substring(17,19) + "秒";

    targetname += "_" + username +"_记录.rtf";

    String strpath = getSavePath();

    String sourname = strpath+"\\"+"模板.rtf";

    String sourcecontent = "";

    InputStream ins = null;

    try{

    ins = new FileInputStream(sourname);

    byte[] b = new byte[1024];

    if (ins == null) {

    System.out.println("源模板文件不存在");

    }

    int bytesRead = 0;

    while (true) {

    bytesRead = ins.read(b, 0, 1024); // return final read bytes counts

    if(bytesRead == -1) {// end of InputStream

    System.out.println("读取模板文件结束");

    break;

    }

    sourcecontent += new String(b, 0, bytesRead); // convert to string using bytes

    }

    }catch(Exception e){

    e.printStackTrace();

    }

    String targetcontent = "";

    String array[] = content.split("~");

    for(int i=0;i

    if(i==0){

    targetcontent = replaceRTF(sourcecontent, array[i], i);

    }else{

    targetcontent = replaceRTF(targetcontent, array[i], i);

    }

    }

    try {

    FileWriter fw = new FileWriter(getSavePath()+"\\" + targetname,true);

    PrintWriter out = new PrintWriter(fw);

    if(targetcontent.equals("")||targetcontent==""){

    out.println(sourcecontent);

    }else{

    out.println(targetcontent);

    }

    out.close();

    fw.close();

    System.out.println(getSavePath()+" 该目录下生成文件" + targetname + " 成功");

    } catch (IOException e) {

    // TODO Auto-generated catch block

    e.printStackTrace();

    }

    }

    public static void main(String[] args) {

    // TODO Auto-generated method stub

    OperatorRTF oRTF = new OperatorRTF();

    String content = "2008年10月12日9时-2008年10月12日6时~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法";

    oRTF.rgModel("cheney",content);

    }

    }

    使用POI读取word文件的表格数据的示例:

    4f2f809fc58cb03ebc80cbb21ef004cd.png

    package com.poi.world;

    import java.io.FileInputStream;

    import org.apache.poi.hwpf.HWPFDocument;

    import org.apache.poi.hwpf.usermodel.Paragraph;

    import org.apache.poi.hwpf.usermodel.Range;

    import org.apache.poi.hwpf.usermodel.Table;

    import org.apache.poi.hwpf.usermodel.TableCell;

    import org.apache.poi.hwpf.usermodel.TableIterator;

    import org.apache.poi.hwpf.usermodel.TableRow;

    import org.apache.poi.poifs.filesystem.POIFSFileSystem;

    public class POI_Word{

    public static void main(String[] args){

    try {

    String[] s=new String[20];

    FileInputStream in=new FileInputStream("D:\\mayi.doc");

    POIFSFileSystem pfs=new POIFSFileSystem(in);

    HWPFDocument hwpf=new HWPFDocument(pfs);

    Range range =hwpf.getRange();

    TableIterator it=new TableIterator(range);

    int index=0;

    while(it.hasNext()){

    Table tb=(Table)it.next();

    for(int i=0;i

    //System.out.println("Numrows :"+tb.numRows());

    TableRow tr=tb.getRow(i);

    for(int j=0;j

    //System.out.println("numCells :"+tr.numCells());

    // System.out.println("j :"+j);

    TableCell td=tr.getCell(j);

    for(int k=0;k

    //System.out.println("numParagraphs :"+td.numParagraphs());

    Paragraph para=td.getParagraph(k);

    s[index]=para.text().trim();

    index++;

    }

    }

    }

    }

    // System.out.println(s.toString());

    for(int i=0;i

    System.out.println(s[i]);

    }

    } catch (Exception e) {

    e.printStackTrace();

    }

    }

    }

    展开全文
  • java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报错找不到注册,比较诡异,...

    java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报错找不到注册,比较诡异,我曾经在不同的机器上试过,操作方法完全一致,有的机器不报错,有的报错,去他们论坛找高人解决也说不出原因,项目部署用它有点玄;itxt好像写很方便但是我查了好久资料没有见到过关于读的好办法。经过一番选择还是折中点采用rtf最好,毕竟rtf是开源格式,不需要借助任何插件,只需基本IO操作外加编码转换即可。rtf格式文件表面看来和doc没啥区别,都可以用word打开,各种格式都可以设定。

    ----- 实现的功能:读取rtf模板内容(格式和文本内容),替换变化部分,形成新的rtf文档。

    ----- 实现思路:模板中固定部分手动输入,变化的部分用$info$表示,只需替换$info$即可。

    1、采用字节的形式读取rtf模板内容

    2、将可变的内容字符串转为rtf编码

    3、替换原文中的可变部分,形成新的rtf文档

    主要程序如下:

    /**

    * 将制定的字符串转换为rtf编码

    */

    public String bin2hex(String bin) {

    char[] digital = "0123456789ABCDEF".toCharArray();

    StringBuffer sb = new StringBuffer("");

    byte[] bs = bin.getBytes();

    int bit;

    for (int i = 0; i < bs.length;i++) {

    bit = (bs[i] & 0x0f0) >> 4;

    sb.append("\\'");

    sb.append(digital[bit]);

    bit = bs[i] & 0x0f;

    sb.append(digital[bit]);

    }

    return sb.toString();

    }

    /**

    * 字节形式读取rtf模板内容

    */

    public String readByteRtf(InputStream ins, String path){

    String sourcecontent = "";

    try{

    ins = new FileInputStream(path);

    byte[] b = new byte[1024];

    if (ins == null) {

    System.out.println("源模板文件不存在");

    }

    int bytesRead = 0;

    while (true) {

    bytesRead = ins.read(b, 0, 1024); // return final read bytes counts

    if(bytesRead == -1) {// end of InputStream

    System.out.println("读取模板文件结束");

    break;

    }

    sourcecontent += new String(b, 0, bytesRead); // convert to string using bytes

    }

    }catch(Exception e){

    e.printStackTrace();

    }

    }

    以上为核心代码,剩余部分就是替换,从新组装java中的String.replace(oldstr,newstr);方法可以实现,在这就不贴了。源代码部分详见附件。运行源代码前提:

    c盘创建YQ目录,将附件中"模板.rtf"复制到YQ目录之下,运行OpreatorRTF.java文件即可,就会在YQ目录下生成文件名如:21时15分19秒_cheney_记录.rtf 的文件。。。。。文件名是在程序中指定的呵呵。由于是由商业软件中拆分出的demo所以只是将自己原来的写的程序分离,合并在一个java文件中,所以有的方法在示例程序中看似多余,没有必要那么麻烦。

    对于替换部分需要循环的特例程序,我不好拆分,里面很容易暴露商业软件的东西,所以就不贴了,有需要的话可以加我QQ或者MSN,一起讨论呵呵。附件传了半天也没有传上去,没有办法只有这样搞了呵呵。模板文件附件无法存放,需要的直接联系呵呵。其实直接看以下的java程序部分,就会明白

    /**

    * 以下部分是java源代码

    */

    package com;

    import java.io.File;

    import java.io.FileInputStream;

    import java.io.FileWriter;

    import java.io.IOException;

    import java.io.InputStream;

    import java.io.PrintWriter;

    import java.text.SimpleDateFormat;

    import java.util.Date;

    public class OperatorRTF {

    /**

    * 字符串转换为rtf编码

    * @param content

    * @return

    */

    public String strToRtf(String content){

    char[] digital = "0123456789ABCDEF".toCharArray();

    StringBuffer sb = new StringBuffer("");

    byte[] bs = content.getBytes();

    int bit;

    for (int i = 0; i < bs.length; i++) {

    bit = (bs[i] & 0x0f0) >> 4;

    sb.append("\\'");

    sb.append(digital[bit]);

    bit = bs[i] & 0x0f;

    sb.append(digital[bit]);

    }

    return sb.toString();

    }

    /**

    * 替换文档的可变部分

    * @param content

    * @param replacecontent

    * @param flag

    * @return

    */

    public String replaceRTF(String content,String replacecontent,int flag){

    String rc = strToRtf(replacecontent);

    String target = "";

    /*if(flag==0){

    target = content.replace("$time$",rc);

    }*/

    if(flag==0){

    target = content.replace("$timetop$",rc);

    }

    if(flag==1){

    target = content.replace("$info$",rc);

    }

    if(flag==2){

    target = content.replace("$idea$",rc);

    }

    if(flag==3){

    target = content.replace("$advice$",rc);

    }

    if(flag==4){

    target = content.replace("$infosend$",rc);

    }

    return target;

    }

    /**

    * 获取文件路径

    * @param flag

    * @return

    */

    public String getSavePath() {

    String path = "C:\\YQ";

    File fDirecotry = new File(path);

    if (!fDirecotry.exists()) {

    fDirecotry.mkdirs();

    }

    return path;

    }

    /**

    * 半角转为全角

    */

    public String ToSBC(String input){

    char[] c = input.toCharArray();

    for (int i = 0; i < c.length; i++){

    if (c[i] == 32){

    c[i] = (char) 12288;

    continue;

    }

    if (c[i] < 127){

    c[i] = (char) (c[i] + 65248);

    }

    }

    return new String(c);

    }

    public void rgModel(String username, String content) {

    // TODO Auto-generated method stub

    /*  构建生成文件名 targetname:12时10分23秒_username_记录.rtf */

    Date current=new Date();

    SimpleDateFormat sdf=new java.text.SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

    String targetname = sdf.format(current).substring(11,13) + "时";

    targetname += sdf.format(current).substring(14,16) + "分";

    targetname += sdf.format(current).substring(17,19) + "秒";

    targetname += "_" + username +"_记录.rtf";

    /* 字节形式读取模板文件内容,将结果转为字符串 */

    String strpath = getSavePath();

    String sourname = strpath+"\\"+"模板.rtf";

    String sourcecontent = "";

    InputStream ins = null;

    try{

    ins = new FileInputStream(sourname);

    byte[] b = new byte[1024];

    if (ins == null) {

    System.out.println("源模板文件不存在");

    }

    int bytesRead = 0;

    while (true) {

    bytesRead = ins.read(b, 0, 1024); // return final read bytes counts

    if(bytesRead == -1) {// end of InputStream

    System.out.println("读取模板文件结束");

    break;

    }

    sourcecontent += new String(b, 0, bytesRead); // convert to string using bytes

    }

    }catch(Exception e){

    e.printStackTrace();

    }

    /* 修改变化部分 */

    String targetcontent = "";

    /**

    * 拆分之后的数组元素与模板中的标识符对应关系

    * array[0]:timetop

    * array[1]:info

    * array[2]:idea

    * array[3]:advice

    * array[4]:infosend

    */

    String array[] = content.split("~");

    /**

    * 2008年11月27日:更新模板之后时间无需自动填充

    */

    /*String nowtime = sdf.format(current).substring(0,4) + "年";

    nowtime += sdf.format(current).substring(5,7) + "月";

    nowtime += sdf.format(current).substring(8,10) + "日";*/

    for(int i=0;i

    /*if(i==0){

    targetcontent = documentDoc.replaceRTF(sourcecontent,nowtime,i);

    }else{

    targetcontent = documentDoc.replaceRTF(targetcontent,array[i-1],i);

    }*/

    if(i==0){

    targetcontent = replaceRTF(sourcecontent, array[i], i);

    }else{

    targetcontent = replaceRTF(targetcontent, array[i], i);

    }

    }

    /* 结果输出保存到文件 */

    try {

    FileWriter fw = new FileWriter(getSavePath()+"\\" + targetname,true);

    PrintWriter out = new PrintWriter(fw);

    if(targetcontent.equals("")||targetcontent==""){

    out.println(sourcecontent);

    }else{

    out.println(targetcontent);

    }

    out.close();

    fw.close();

    System.out.println(getSavePath()+"  该目录下生成文件" + targetname + " 成功");

    } catch (IOException e) {

    // TODO Auto-generated catch block

    e.printStackTrace();

    }

    }

    public static void main(String[] args) {

    // TODO Auto-generated method stub

    OperatorRTF oRTF = new OperatorRTF();

    /**

    * 被替换内容以"~"符号分割,处理的时候将其拆分为数组即可

    */

    String content = "2008年10月12日9时-2008年10月12日6时~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法";

    oRTF.rgModel("cheney",content);

    }

    }

    展开全文
  • java读取word2003

    2013-05-14 16:22:34
    java读取word2003,很好用的额
  • java 读取 word

    2009-11-07 10:40:00
    import java.io.File;import java.io.FileInputStream;import org.textmining.text.extraction.WordExtractor;public class WordReader { public static String readDoc(String doc) throws Exception {
  • 主要介绍了使用Java读取Word文件的简单例子分享,包括读取word文件的表格数据的示例,需要的朋友可以参考下
  • Java读取了Word文档,尽管在线上介绍了许多插件poi,java2Word,jacob,itext等,但poi无法读取格式(新的API估算行似乎仍处于研究阶段如何读取Word文档啊,txt可以读取文件路径file =新文件(“ E:/aaa.txt”)。...
  • java读取word-excel-ppt文件代码2019-05-08编程之家收集整理的这篇文章主要介绍了java读取word-excel-ppt文件代码,编程之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。WORD:import org.apache.lucene....
  • public class ReadDocumentProperty {public static void main(String[]args){//加载文档Document doc = new Document("SetProperty.docx");//读取内置文档属性System.out.println("标题: " + doc.getBuilt...
  • 在Android读取Word文件时,在网上查看时可以用tm-extractors,但好像没有提到怎么读取Word文档中字体的颜色,字体,上下标等相关的属性。但由于需要,要把doc文档中的内容(字体,下划线,颜色等)读取应用到android中...
  • java 读取 word poi用到的jar包文件
  • java 读取 word pdf 等

    2012-05-18 23:28:44
    JAVA读取WORD,EXCEL,POWERPOINT,PDF文件的方法
  • 用 poi 读取word文件 。老是报错org.apache.poi.poifs.filesystem.NotOLE2FileException: Invalid header signature; read 0xC9D33C3A6D6F7246, expected 0xE11AB1A1E011CFD0 - Your file appears not to be a valid...
  • Java读取word文件

    2017-08-19 10:24:37
    Java读取word文件需要使用Apache poi.jar,可以在这里下载点击打开链接 代码如下: package com.ssh.util; import java.io.File; import java.io.FileInputStream; import java.io.InputStream; import org....
  • java的函数代码如下: private void readWord2007() { try { OPCPackage oPCPackage = POIXMLDocument.openPackage("e:/test.docx"); XWPFDocument xwpf = new XWPFDocument(oPCPackage); POIXMLTextExtractor ex =...
  • Java读取word中表格

    2018-03-13 17:09:00
    因为要新建一个站,公司要把word表格的部分行列存到数据库中。之前用java操作过excel,本来打算用... 但还是把java读取word中表格的方法写一下,先上代码。 public static void testWord(String filePath){ ...
  • public classDocRead {/*** @Description: POI 读取 word * @create: 2019-07-27 9:48 * @update logs *@throwsException*/ private static int maxx = 10000;//判断编码格式方法 private staticString get_code...
  • import com.spire.doc.*;import com.spire.doc.documents.Paragraph;import com.spire.doc.fields.Comment;import ...import javax.imageio.ImageIO;import java.awt.image.RenderedIm...
  • java读取word-excel-ppt文件代码更新时间:2009年04月27日 17:56:54 作者:OFFICE文档使用POI控件,PDF可以使用PDFBOX0.7.3控件,完全支持中文,用XPDF也行,不过感觉PDFBOX比较好,而且作者也在更新。水平有限,万...
  • JAVA操作word Java 操作Microsoft Word 之jacob(1) Java 操作Microsoft Word 之jacob(1) JJaavvaa操操作作MMiiccrroossooffttWWoorrdd之之jjaaccoobb(11) 现在我们一起来看看用J1ava如何操作Microsoft Word jacob...
  • java读取word,excel,pdf等文本
  • [Java] Java读取Word文档

    2017-08-16 11:28:00
    最近需要做一些NLP 方面的工作,使用的是Java,在此总结一下使用Java读取Word(.doc)格式文件的方法。 Apache基金会非常厉害,开源工具包POI就可以处理微软家的文档,甚至包括Excel和PowerPoint。我们就使用POI来做...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,661
精华内容 664
关键字:

java读取word

java 订阅