精华内容
下载资源
问答
  • 解决java中html转word文档,转成功后的word文档在断网情况下无法显示图片问题

             前一段时间遇到一个问题,就是将html转成word文档,里面有图片,表格,和各种形式的文字。刚开始的做法是将html代码取出来,然后以留的形式进行保存,后缀名为.doc。当我转成之后发现一切完美,但是图片出现了问题:

            1.图片大小、像素有问题。

           2.(最严重的)图片存在word的是一个链接而已。

           当我们在断网的情况下(或者拷贝到两一台电脑上)打开word文档的时候 实际上看到的图片是一个链接,也就是说图片转化的不成功。

          其实从本质上来说,我们可以看一下转化之后所谓的word文档的格式,(点击另存为,看文件类型)发现其实转化之后的文档的文件类型仍然是.html的格式。只有当我们再次另存为并且选择文件类型为.doc格式的时候 才能做到真正意义上的转化,并且图片不会出现上述问题。原因大致是html转word的时候中间会经过一步处理,先将html的文件转成了xml文件,然后在转成.doc格式,同时将html的图片转成了Base64编码的格式(替换了图片的链接)存在了xml文件里。(我们可以打开将任意一篇.doc格式的word文档另存为成.xml文档后分析带有图片的那部分代码。)

          于是乎浏览网上各种大神的解决办法,发现并没有一个很好的解决方法。网上的关于html转化word的解决办法总结起来有以下几种情况:

           1.用ASPOSE.WORDS控件来处理。(涉及到了asp。。还有神马控件。。扩展性太差,,果断不深入这个方法。废弃之。)

           2.把html文件里面的图片转成Base64格式存储。

           好像是涉及到了上面所叙述的html转word的原理部分,但是那是word做的事,鬼知道当我们在选择将word另存为.doc格式的时候word做了什么操作。。。。我们都知道html标签里的图片形式为:<img src="xxxxxxx" />  将图片转成Base64编码容易,但是并不是将Base64编码的图片简单的放到src=“xxxxx”里面就行了,需要能让word读懂。  转成能让word读懂的格式就更不容易了(也就是前文提到的那个xml文件)。因为图片有很多格式(.jpg/.png等等),还要涉及到word里特殊的标签(类似这种<img src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAADIA..." />)。。。。 所以在尝试了之后也放弃了。

          3.用POI 这个jar包 

    说这个的更是扯。 Apache的POI对图片的处理不友好,甚至有的版本根本就不支持。在入坑很久之后,果断放弃。。。

          4. javacdoc 的包  

            亲测 不可以。以上4中方法是网上讨论最多的,我从09年的帖子一直翻到17年的,总结下来的。。发现并没有找到解决办法。。最后不得已,决定自己解析html文档,转化word。最终成功转化,实现了自己想要的结果。实现起来也很简单,只是解析了一下word而已。

          5.利用freemaker模板。

          这个可以解决,但是要大动干戈。实际开发的过程中不会因为一点问题就换模板的。这样不利于开发和维护。

    解决思路:

          设法解决转成word的时候另存为时候看到的文件类型不是.html格式的就ok,这样的话就不会以图片链接的形式放在word里面。

    解决办法:(相关demo和jar包后面会给出)

         1.先 用jsoup的包将html格式化。(此处用于解析html代码。方便后面用itext包调用)

         2.利用iText的jar包,这个jar包是转化pdf用到的,但是转化成word也能用。保存后在word里面的文件类型是.rtf格式的。能够完美解决问题。

    成功后的结果:

       

    文件类型:

          


    Demo地址: 

    http://download.csdn.net/download/wht21888/10120532

    (年少无为,卖码为生,需要一点点资源币。委屈   具体的方式在Demo里有,有什么问题或者你有更好的方式  欢迎加QQ:749938275 一起讨论)


        

         







         



    展开全文
  • 首先需要安装 pandoc 程序,pypandoc 是用来调用该程序来完成工作的。 工具获取: 小蓝枣的csdn资源仓库 ...# 转换生成word文档的位置 pypandoc.convert_file(html_path, 'docx', outputfile=word_path)

    首先需要安装 pandoc 程序,pypandoc 是用来调用该程序来完成工作的。
    工具获取:
    小蓝枣的csdn资源仓库
    在这里插入图片描述
    转换代码如下:

    # -*- coding:utf-8 -*-
    import pypandoc
    
    # html文档的位置
    html_path = r"C:\Users\Administrator\Desktop\html_to_word\sonar.html"
    # 转换生成word文档的位置
    word_path = r"C:\Users\Administrator\Desktop\html_to_word\sonar.docx"
    
    pypandoc.convert_file(html_path, 'docx', outputfile=word_path)
    

    在这里插入图片描述
    原文档:
    在这里插入图片描述
    转化后效果图:
    在这里插入图片描述
    原文档:
    在这里插入图片描述
    转化后效果图:
    在这里插入图片描述
    喜欢的点个赞❤吧!

    展开全文
  • Word文档的使用技巧

    2019-07-31 11:55:18
    Word文档是我们办公最常使用的一种文档格式,但是很多没有经验的朋友对word的操作还不是很了解,下面就分享一些word中的常用操作方法给大家。 一、删除word文档空白页: 1、在需要删除的空白页最顶上用Delete键删除 ...

    在这里插入图片描述
    Word文档是我们办公最常使用的一种文档格式,但是很多没有经验的朋友对word的操作还不是很了解,下面就分享一些word中的常用操作方法给大家。

    一、删除word文档空白页:

    1、在需要删除的空白页最顶上用Delete键删除

    2、但如果空白页上方是表格或者图片,用这种方法就比较困难了

    3、我的方法是选中空白页的回车字符,一定要选中!

    4、然后在字符上点击鼠标右键,选择段落;

    5、在段落中将行距设置为固定值1磅。然后空白页就会自然消失啦!

    二、如何在word文档中打钩:

    首先先输入文字,接着利用快捷键Alt+41420直接打出勾号,需要注意的是,41420要用数字键盘输入,也就是键盘右手边的小键盘,而不是字母键盘上方的数字。

    然后单击进入【带圈字符】功能;

    设置选项里面有样式的选择,这里我们选【缩小文字】,圈号选择正方形方框。点击确定。这样就完成了方框打勾的制作。

    三、如何将word打印成pdf:

    想要将word打印机成pdf格式只需要安装一个pdf虚拟打印机就可以了。百度就能下载。

    下载好之后单击配置设定按钮,然后设置一下打印格式。

    然后打开word文档单击打印按钮就行了。

    四、如何在word文档中生成目录:

    1、打开文档,单击“插入”,选择“页眉和页脚”中的“页码“,选择页码格式插入;

    2、设置标题样式—确定目录级数;

    3、 设置标题样式—找到各级标题:

    4、设置标题样式—设置各级标题:

    5、设置标题样式—设置各级标题样式:

    设置完成之后插入目录就可以了。

    展开全文
  • 网上用的比较多的两种方法是: 1、在行距选项中,将行距设置为固定值,设置值置为1磅;这种方法成功过也失败过。...最后,自己找到了一种方法:直接拉动右下角的正方形表格调整标志,稍微往上拉,直到最后空白页消失

    网上用的比较多的两种方法是:

    1、在行距选项中,将行距设置为固定值,设置值置为1磅;这种方法成功过也失败过。

    2、在替换选项中,选择更多,再在特殊格式中选择手动分页符后,点击全部替换;这种方法也不是每次都有效。

    最后,自己找到了一种方法:直接拉动右下角的正方形表格调整标志,稍微往上拉,直到最后空白页消失

    展开全文
  • Word文档的基础教程

    2018-10-11 16:51:16
    Word文档是我们办公最常使用的一种文档格式,但是很多没有经验的朋友对word的操作还不是很了解,下面就分享一些word中的常用操作方法给大家。 一、关于F键的快捷操作 [F1]键:帮助 ...
  • 动机 之前项目里遇到一个需求,需要前端上传一个word文档,然后后端提取出该文档的指定...搜索了好一会儿,在npm上发现了一个叫做adm-zip的包,这个包可以解压缩word文档,原来word文档也是可以解压缩的,之前一直不...
  • 前言 Word2007的“表格工具”功能区提供了大多数创建表格所需的工具。不论是看起来漂亮还是用起来方便的表格。自然地,Word2007并不能完成所有的工作。它来自你的创意,由你决定。然而,当创意陷入僵局,有时功能区...
  • word文档的边框线不能保存,在网上查了一下都没有解决办法。我自己琢磨,现在问题已解决,把办法分享给大家。
  • (1)word表格前面有一行文字描述,当表格行数或内容增多时,该一行文字描述被挤到表格后面了。 (2)word表格行数或内容增多时,表格压在了页脚上面。 2、问题产生原因 (1)至今不清楚为何? (2)由word...
  • 使用环境(蓝色粗体字为特别注意内容) 1、软件环境: Win7 Ultimate...众所周知,Word表格分页的方法如下: Step1:选择表格,右键表格属性。 指定高度的选项去掉,选上允许跨页断行。 经过以上设置之后,应该...
  • 今天写文档的时候,表格的字写的有点多,末尾处的字都被盖住了,就像这样 解决办法 先在表格里面右键,选择表格属性 然后按照这个标准来设置 点击确定后,问题就解决了!
  • 想用C#打开一个word文档,然后把word拆分成若干个新的word,原来word含有图片、表格,生成的新word是要保存原来的图片和表格等各种格式。文档打开了 问题是怎么定位? 例如 每次查找到":" 就要生成一个生成新...
  • 如何去掉word文档中的空格空行

    千次阅读 2008-11-12 09:08:00
    一、去掉表格和格式为了版面的整齐,网页文档都是以表格的形式存在的,只是一般情况下表格的颜色被设为无色或表格宽度被设为0,所以我们在网页上看不到表格。另外,网页文档中换行用的都是手动换行符,还有对字体等...
  • 如果空白面是最后一页,且鼠标在第一行,可选“格式”-“段落”,将这一行的行距设为固定值1磅,该空白页将自动消失。2.先显示分页符,即在Word的左下角调整到“普通视图”状态,这时分页符就出现了,直接删除即可。3...
  • Word转PDF表格边框横线丢失

    万次阅读 2019-12-16 08:26:25
    工作环境(蓝色粗体字为特别注意内容)1,系统环境:Win...在处理word文档,将word转为PDF的时候,一般有两种方式:①Word-》打印选择PDF打印机,②直接通过PDF插件转换。下面来简单介绍一下这两种方法。 一、PDF打印...
  • Word表格多行内容转成一列的技巧方法主要是借助Word中“文字与表格相互转换”功能与“高级替换”功能的配合使用,具体步骤如下:1.将表格转换成文字选定整个表格后,执行“表格→转换→表格转换成文字”,在弹出的...
  • word中将空格替换为 This article will explain how to display the first page of your Microsoft Word documents (e.g. .doc, .docx, etc...) as images in a web page programatically. I have scou...
  • word 保存文档崩溃 文件丢失

    万次阅读 2011-03-01 19:40:00
    今天改word文档,保存后,突然整个文档崩溃,然后发现整个文档不翼而飞,回收站里也没有,都快把人急死了,网上查了解决方法,总算是把文档给弄回来了,不然东西可就白做了。  word文档在编辑过程中会...
  • 回答:用Word来保存网页,最大的好处就是...一般步骤:1、复制要收集网页的内容2、粘贴到Word文档中,保存3、有时可能要去除多余表格和对一些丢失的图片进行处理。去除多余表格的技巧一般有:1、只要文字部分的,...
  • 今天遇到非常奇怪的问题用poi操作word中的表格后遇到的一些问题,记录下来,希望...样式发生了改变,更奇怪的是,我用本地word对其改变列宽的操作合并单元格立马消失 记录下来,那位兄弟遇到和我一样的问题,一起...
  • 它在网页中是“换行符”,注意换行不换...这种符号是手动换行符(L),可以在WORD文档中的替换对话框-高级-特殊字符中看到,一般如果文本是直接从网页上COPY下来的话,都带着手动换行符,要使它消失,只需全部替换成...
  • 适用于: Word 2016, Word 2013, Word 2010, Word Online, Word Starter, Word Starter ...Word 提供了用于查找文档中的特定内容的多个选项。您可以搜索和替换文本、 图像、 标题、 书签、 或某些类型的格式,如段落
  • Michael CorningMicrosoft Corporation 2002年10月 适用于: Microsoft® Word 2002 Microsoft Visual Studio® .NET摘要:学习如何在 Microsoft Office Visual Basic for Applications (VBA) 程序...Word 文档快速序
  • WORD 出错无法打开】元素结束标记中的名称必须与开始标记中的元素类型相匹配_yezizhangxinya的博客-CSDN博客_元素结束标记中的名称必须与开始标记的元素类型相匹配使用工具 Rebuilder 修复提示问题不同:还好我...
  • 我从别的文档中复制表格到自己的文档中,表格就自动带上蓝色底色了,试了很多方法,像底纹选无色什么的,都用了 解决方法: 选定表格,执行“格式|显示格式”,在右边窗口找到“表格样式”单击出现“表格自动套用...
  • public void completeTableBorder(Document doc){ for(Table table:(Iterable<Table>)doc.getChildNodes(NodeType.TABLE, true)){ //设置表格居中 table.setAlignment(TableAlignment.C...
  • WORD中插入表格我们已经在多篇文章中进行描述了,现在我们需要做的是对插入的表格进行单元格行列的合并。 在网上找了很久,发现都是行的合并,关于列的合并没有找到,于是我就只能自己写了,代码如下: Sub ...
  • 最近有个需求,需要在网站上增加一个功能,当管理员点击这个按钮时,程序会前往某个网站(以下简称A)以会员身份登录下载一份word(doc格式)的数据,当然,由于这是A网站提供的数据,肯定会有其水印,关键字,网站图片...
  • Word 2003 长篇文档排版技巧

    千次阅读 2012-09-03 08:38:11
    简介 市场部经常要出各种分析报告,一写就是洋洋洒洒几...制作目录也是出力不讨好的事,尽管小王知道Word中有插入目录的功能,可是尝试了几次就弃之不用了,原因是系统总是提示有错误。现在只能手工输入目录,加班加点

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,702
精华内容 1,480
关键字:

word文档表格消失