精华内容
下载资源
问答
  • 使用java框架POI将word转换成html格式

    千次阅读 2013-04-09 18:48:46
    HWPFDocument wordDocument = new HWPFDocument(input); WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument()); ...
    import java.io.ByteArrayOutputStream;
    import java.io.File;
    import java.io.FileInputStream;
    import java.io.FileNotFoundException;
    import java.io.FileOutputStream;
    import java.io.IOException;
    import java.io.InputStream;
    import java.io.OutputStream;
    
    import javax.xml.parsers.DocumentBuilderFactory;
    import javax.xml.parsers.ParserConfigurationException;
    import javax.xml.transform.OutputKeys;
    import javax.xml.transform.Transformer;
    import javax.xml.transform.TransformerException;
    import javax.xml.transform.TransformerFactory;
    import javax.xml.transform.dom.DOMSource;
    import javax.xml.transform.stream.StreamResult;
    
    import org.apache.poi.hwpf.HWPFDocument;
    import org.apache.poi.hwpf.converter.PicturesManager;
    import org.apache.poi.hwpf.converter.WordToHtmlConverter;
    import org.apache.poi.hwpf.usermodel.PictureType;
    import org.w3c.dom.Document;
    
    public class WordToHtml {
    
    	/**
    	 * @param args
    	 * @throws IOException 
    	 * @throws ParserConfigurationException 
    	 * @throws TransformerException 
    	 */
    	public static void main(String[] args) throws IOException, ParserConfigurationException, TransformerException {
    		        final String path = "d:/temp/";
    		        final String file = "1.doc";
    		        InputStream input = new FileInputStream(path + file);
    		        HWPFDocument wordDocument = new HWPFDocument(input);
    		        WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
    		        wordToHtmlConverter.setPicturesManager(new PicturesManager() {
    		            public String savePicture(byte[] content, PictureType pictureType, String suggestedName, float widthInches, float heightInches) {
    		                File file = new File(path + suggestedName);
    		            	try {
    							OutputStream os = new FileOutputStream(file);
    							os.write(content);
    							os.close();
    						} catch (FileNotFoundException e) {
    							// TODO Auto-generated catch block
    							e.printStackTrace();
    						} catch (IOException e) {
    							// TODO Auto-generated catch block
    							e.printStackTrace();
    						}
    		            	return path + suggestedName;
    		            }
    		        });
    		        wordToHtmlConverter.processDocument(wordDocument);
    		        Document htmlDocument = wordToHtmlConverter.getDocument();
    		        File htmlFile = new File(path + "1.html");
    		        OutputStream outStream = new FileOutputStream(htmlFile);
    		        DOMSource domSource = new DOMSource(htmlDocument);
    		        StreamResult streamResult = new StreamResult(outStream);
    		 
    		        TransformerFactory tf = TransformerFactory.newInstance();
    		        Transformer serializer = tf.newTransformer();
    		        serializer.setOutputProperty(OutputKeys.ENCODING, "utf-8");
    		        serializer.setOutputProperty(OutputKeys.INDENT, "yes");
    		        serializer.setOutputProperty(OutputKeys.METHOD, "html");
    		        serializer.transform(domSource, streamResult);
    		        outStream.close();
    
    	}
    
    }
    


    展开全文
  • 不管是为了方便阅读、不会编写代码,还是什么其它原因,我的答案是:用为什么我会说迅捷PDF转换器可以把Word转换成HTML格式,那是因为在该软件的“PDF转换其他文件”菜单中,里面的“文件转HTML”,其中文件就包含...

    如何将Word转换成HTML?这还真是我工作这么多年来头一次见到这样的提问。不管是为了方便阅读、不会编写代码,还是什么其它原因,我的答案是:用

    为什么我会说迅捷PDF转换器可以把Word转换成HTML格式,那是因为在该软件的“PDF转换成其他文件”菜单中,里面的“文件转HTML”,其中文件就包含Word文档。

    下面是具体方法:

    第一步,打开进入迅捷PDF转换器界面,在软件界面左侧列表中选择“PDF转换成其他文件”,然后在下拉菜单中选择“文件转HTML”模式。

    c96ea9c8fc5fe3729f25d4ccfebd21f4.png

    第二步,添加要转换的Word文档,点击“添加文件”可以在弹出的对话框中选择相应Word文档打开;点击“添加文件夹”中,在弹出的对话框中添加相应Word文件夹即可将文件夹中全部内容全部添加到软件列表中;用鼠标选中要转换的Word拖拽到迅捷PDF转换器界面中。

    6d47f1442a37c41295a84f77ed71e9a7.png

    第三步,在软件界面右上角点击输出目录即可设置转换后文件的储存位置,可以保存在原文件夹内;也可以选择自定义,点击文件夹图标,在弹出的对话框中设置储存路径即可。然后点击“开始转换”将Word转换成HTML即可。

    228376561a9a177d11f135af61480d6c.png

    以上是如何将Word转换成HTML教程,希望可以帮助到您。轻松转换文档格式,迅捷PDF转换器是一个好用PDF转换器,是办公文档中好用的格式转换工具,想要完成体验它的功能的话可以前往

    除了将Word转换成HTML外,我们还可以将Excel转换成PDF格式,方法参考延伸阅读就可以了。

    展开全文
  • 原标题: Word格式文档如何在线转HTML格式日常工作中,如果我们要进行文字的编辑一般使用的都是Word文档,它不仅能够保存Text文本,还可以保存文本的格式等等。那么如果我们需要将Word文档上的内容展示在网页上,该...

    原标题: Word格式文档如何在线转HTML格式

    日常工作中,如果我们要进行文字的编辑一般使用的都是Word文档,它不仅能够保存Text文本,还可以保存文本的格式等等。那么如果我们需要将Word文档上的内容展示在网页上,该怎么做呢?其实直接将Word转换成HTML就可以了,那么该如何将Word转换为HTML呢?

    想要将Word文档转成HTML网页格式其实特别简单,只需要利用第三方软件就能实现,现在科技越发的发达,这种简单的文件格式转换有很多种解决方法,下面小编就简单的介绍一种利用在线转换器来将Word转成HTML的方法,希望能帮到大家。

    一、百度搜索“WWW.onlinedo.cn”,然后找到官方网址点击进入。

    e4d57d3dcf81f15d28bed08c54fccb70.png

    二、进入网站首页后点击菜单栏中的“文件格式转换”-“Word转HTML”.

    e4b9141969f1fe4af173593215579c5c.png

    三、然后在此页面选择“点击添加文件”,注意文件大小不可超过5M,如果文件带有密码请及时解除密码再做此操作。

    c6aa354a03dcc123bb1c682b19d507a3.png

    四、添加文件后,点击“开始转换”。

    383fb52c41515260b89a6ff8af5af93b.png

    五、转换过程中需要一点时间缓冲,请耐心等候。

    60820160a2dbfc2badd380445f186bd1.png

    六、转换成功后可选择“预览”或者“下载”,注意必须登录后才能进行此操作哦。

    责任编辑:

    展开全文
  • Word文件转换成HTML格式

    千次阅读 2017-11-28 16:51:48
    首先引用:Microsoft.Office.Interop.Word.dll 若果 是.net 4.0以上版本添加... // 将word文件中的数据读取为html语句 public static string DocToHtml(object wordFileName) { //在此处放置用户代码以初始化页面

    首先引用:Microsoft.Office.Interop.Word.dll

    若果 是.net 4.0以上版本添加引用,如果不是4.0以上版本可能没有这个,可以网上下载一个Microsoft.Office.Interop.Word.dll。

           // 将word文件中的数据读取为html语句
            public static string DocToHtml(object wordFileName)
            {
                //在此处放置用户代码以初始化页面 
                Word.Application word = new Word.Application();
                Type wordType = word.GetType();
                Word.Documents docs = word.Documents;
                //打开文件 
                Type docsType = docs.GetType();
                Word.Document doc = (Word.Document)docsType.InvokeMember("Open", System.Reflection.BindingFlags.InvokeMethod, null, docs, new Object[] { wordFileName, true, true });
                //转换格式,另存为 
                Type docType = doc.GetType();
                string wordSaveFileName = wordFileName.ToString();
                string strSaveFileName = wordSaveFileName.Substring(0, wordSaveFileName.Length - 3) + "html";
                object saveFileName = (object)strSaveFileName;
                docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod, null, doc, new object[] { saveFileName, Word.WdSaveFormat.wdFormatFilteredHTML });
                docType.InvokeMember("Close", System.Reflection.BindingFlags.InvokeMethod, null, doc, null);
                //退出 Word 
                wordType.InvokeMember("Quit", System.Reflection.BindingFlags.InvokeMethod, null, word, null);
                return saveFileName.ToString();
            }


    例如:   <asp:FileUpload ID="fu_NewsContent" runat="server" />

           if (fu_NewsContent.HasFile)
            {
                    string fileName = fu_NewsContent.PostedFile.FileName;
                    int extendNameIndex = fileName.LastIndexOf(".");
                    string extendName = fileName.Substring(extendNameIndex);
                    if (extendName == ".doc")
                    {
                        string serverPath = Server.MapPath("~/UploadFiles/WordFiles/" + DateTime.Now.Year + "/" + DateTime.Now.Month + "/" + DateTime.Now.Day + "/");
                        if (!Directory.Exists(serverPath))
                            Directory.CreateDirectory(serverPath);   //创建路径
                        DateTime now = DateTime.Now;
                        string fileTime = now.ToString("yyyyMMddHHmmss") + now.Millisecond.ToString() + extendName;
                        fileName = serverPath + fileTime;
                        fu_NewsContent.PostedFile.SaveAs(fileName);   //保存word
    
                        string workHtml = CommonHelp.WordToHtml.DocToHtml(fileName);//转换
                        StreamReader fread = new StreamReader(workHtml, System.Text.Encoding.GetEncoding("gb2312"));
                        string ssRead = fread.ReadToEnd();
                        ssRead = ssRead.Replace("src=\"", "src=\"/UploadFiles/WordFiles/" + DateTime.Now.Year + "/" + DateTime.Now.Month + "/" + DateTime.Now.Day + "/");
                        string News_Content = Encoding.Default.GetBytes(ssRead);
                        string News_FileUrl = "/UploadFiles/WordFiles/" + DateTime.Now.Year + "/" + DateTime.Now.Month + "/" + DateTime.Now.Day + "/" + fileTime;
                        fread.Close();
                        fread.Dispose();
                    }
                    else               
                      return;  
             }



    展开全文
  • 迅捷PDF转换器将Word转换成PDF的格式非常方便,有了这款软件,可以轻松的将Word转换成PDF格式的文件,并且能够很好的保存原文件中文本、图片、排版等,能最大限度的对不同格式的文件进行转换。迅捷word转换成pdf转换...
  • 我们工作或者学习中常常遇到将Word转换成... 迅捷word转换成pdf转换器是一款完全免费、无需安装、无需下载的Word转换成PDF在线转换软件,界面简单明了,功能稳定,支持批量转换,操作起来非常方便,完美支持WordPD
  • 那么这就要使用专门的软件了,今天小编就给大家分享个方法是关于怎么把word转换成pdf?下面就一起看看介绍吧!  根据小编的亲身试验,我觉得最好用的就是迅捷PDF转换器了,针对不同内容、不同样式
  • 有时候因为工作需要,同一份资料可能需要多种格式的配合,这就必须要求我们把word转换成其他格式文件,那么如何把word转换成pdf格式呢,下面就让小编详细的给大家做个介绍吧。  迅捷PDF转换器是专业的PDF转换器之...
  • 大家在使用office2003Word文档的时候发现打不开docx格式的文档,这个时候就需要把docx格式转换成doc格式再打开了,只要把docx文档另存为doc格式就可以用office2003Word文档打开了哦,下面就和小编一起来看看具体怎么...
  • 为什么会想起来将上传的word文档转换成html格式呢?设想,如果一个系统需要发布在页面的文章都是来自word文档,一般会执行下面的流程:使用word打开文档,Ctrl+A,进入发布文章页面,Ctrl+V。看起来也不麻烦,但是,...
  • 有个博友写的比较详细,参考地址:...将Word转Html的原理是这样的: 1、客户上传Word文档到服务器 2、服务器调用OpenOffice程序打开上传的Word文档 3、OpenOffice将Word文档另存为Html格式
  • word转html(支持doc和docx)以及word分割同一格式多个word文件,包含所需的jar(pom.xml)
  • 相信经常上网的不难发现,现在网上的文件大多数都是PDF格式的,因为有时候为了文件的安全性以及文件的大小和美观性考虑,我们不得不需要将Word转换成PDF格式,可是转换文件的方法有很多,大部分人使用的都不一样,...
  • 自己做了一个小网站,... 这是今天解决的一个问题:如何将Word转换成PDF格式文档  相信一定对在线PDF转换一词并不陌生吧,通过word转换成pdf转换器选择需要转换的模式,上传转换的文本,即可快速复制出一个与原件一
  • word转换成html

    千次阅读 2013-06-17 15:21:47
    word转换成html,然后在qt中将html显示出来。 其中先要将word文档解析xml文档,这里需要base64方法,具体介绍如下: Base64是一种基于64个可打印字符来表示二进制数据的表示方法。由于2的6次方等于64,所以每6个...
  • C#将word转换HTML格式

    千次阅读 2017-11-21 11:28:00
    假如C盘有个简历,AA.doc,我把它转化为html StringBuilder sb=newStringBuilder();Microsoft.Office.Interop.Word.ApplicationClass appclass =newMicrosoft.Office.Interop....
  • 把jacob.jar加载到工程里。 在C:\WINDOWS\system32;C:\Program Files\Java\jdk1.5.0_04\bin;C:\Program Files\Java\jdk1.5.0_04\jre\bin;下添加jacob.dll文件。 OfficeToXML.java文件是实现代码。...
  • pdf转换成word转换器免费版是一款专业的pdf转换word软件,完美支持pdf文件转换word文档,转换后可再次编辑,支持图文混合排版,支持表格转换,支持...pdf转换成word转换器是一款小巧、方便且免费的pdfWord工具...
  • 批量的把html 文件转换成word,不需要电脑上有word软件!并且支持本地图片,html链接的图片必须在本地,可以把图片转换word里!
  • word批量转换成html

    千次阅读 2015-09-25 11:36:50
    制作chm,首先得将一个个word文档拆分,然后将其转换成html格式,该项目的用户手册word版就有800多页呢,拆word后,,一个个手动转换成html么。百度了一下如何批量转换,没找到合适的方法(搜索方式有问题么
  • Word文档怎么转换PDF格式 Word文档怎么转换PDF格式的呢?Word文档在有些情况下不是那么的安全,如果转换PDF格式的会好很多,因此Word转换成PDF格式这一需求需要去解决。PDF文件的阅读性非常良好,网络上...
  • # python如何转换word格式、读取word内容、转成html? import docx from win32com import client as wc # 首先将doc转换成docx word = wc.Dispatch("Word.Application") doc = word.Documents.Open(r"D:\...
  • 工作中有些时候,领导下达指令需要将html格式的内容转换成Word格式的文档,对于很多新手来说,就着实不知道该如何下手了,如果是一个一个转换的话,内容过多就很艰难,而且十分耽误工作效率,那么html该怎么转换成...
  • Word怎么有效的转换PDF格式的文件?很多从事办公室工作的朋友可能都会接触到这一...因此小编需要找到将Word成功转换PDF的好方法,就是用word转换成pdf转换器,真的感觉特别好用。  下面是Word转换成PDF的简单方法
  • java word转换成html

    千次阅读 2009-10-29 10:51:00
    在J2EE项目中有时需要把 word 转换成 html 文件,可以利用jacob组件进行转换,该组件包含一个jacob.jar包和一个jacob.dll ,把jacob.jar放到项目的web-inf/lib下即可,把jacob.dll 放到运行tTomcat的jre/bin下即可。...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 152,339
精华内容 60,935
关键字:

word转换成html格式