精华内容
下载资源
问答
  • PHP由HTML生成Word文档编码转换

    千次阅读 2018-01-03 11:15:53
    Word类源代码: class Word{ function start(){ ob_start(); echo '<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word"...

    Word类源代码:

    class Word{
        function start(){
            ob_start();
            echo '<html xmlns:o="urn:schemas-microsoft-com:office:office"
            xmlns:w="urn:schemas-microsoft-com:office:word"
            xmlns="http://www.w3.org/TR/REC-html40>';
        }
    
        function save($path){
            echo '</html>';
            $data=ob_get_cotents();
            ob_end_clean();
            $this->writeFile($path, $data);
        }
    
        function writeFile($path, $data){
            $fp=fopen($path, 'wb');
            fwrite($fp, $data);
            fclose($fp);
        }
    }

    使用方法:

    $html='<html><table><tr><td>&nbsp;</td><td>&nbsp;</td></tr><tr><td>&nbsp;</td><td>&nbsp;</td></tr></table>';
    $word=new Word();
    $word->start();
    $wordname=iconv('UTF-8', 'GB2312//IGNORE', '<filename>'.'doc');// 添加//IGNORE参数忽略转换错误,以防止因转换失败而导致脚本终止运行
    $path='<PATH/TO/SAVE>'.$wordname;//最好是绝对路径。这里注意:1.确保写入目录具有可写入权限;2.路径和文件名中不得包含/\*?"<>|等非法字符
    echo iconv('UTF-8', 'GB2312//IGNORE', $html);
    $word->save();
    ob_flush();
    flush();

    注:生成带图片的Word文档时,图片src须使用绝对路径

    展开全文
  • 有些朋友在打开文档的时候,上网搜索资料,下载了一个文档,使用本人电脑上安装的 Word文档打开后,发现是乱码,或者是已经损坏了的文档,程序代码都变成面条了,遇到这种情况原因是:内容的编码格式和word规定的...

    word文档是办公常见使用的工具之一,有些朋友在打开文档的时候,上网搜索资料,下载了一个文档,使用本人电脑上安装的 Word

    文档,打开后,发现是乱码,或者是已经损坏了的文档,程序代码都变成面条了,遇到这种情况原因是:内容的编码格式和word规定的不相同,这怎么办?现在我们在这里分享一下word乱码解决的方法给大家。

    第一步:在word中打开损坏的文档。然后将该文件另存为别的格式。在保存类型中,选择”RTF格式(*.rtf)格式,最后保存:

    33c1efa4b2060cd8feecd363a5a7aba0.png

    第二步:将乱码的文档关闭;然后打开刚才保存的.rtf格式的文档;又将这个格式的文档另存为”.doc”格式,保存:

    52da1ef643f3a95c67bd360075d2e000.png

    第三步:打开由.rtf格式转换成”.doc”格式后的Word文档看是否还乱码:

    941ef5c5c331985efcf4c05db72828d7.png

    第四步:文档的rtf格式与doc格式转化将保留其格式,可以纠正文件损坏。如果还不行的话,将乱码的doc文档换成txt格式,再从txt换成doc格式。换成txt格式的话,原先设置好格式没有了,只保留文字:

    d8c184d144c5ded0432702bba70dfe25.png

    以上就是Word文档打开是乱码怎么解决的方法是不是很简单呢,你学会了吗?

    展开全文
  • Word文档到Asciidoc转换

    千次阅读 2017-06-22 14:18:45
    Word文档的内容,需要背转换为Asciidoc。以下是我发现最有效的步骤:1. 将Word文档保存为HTML 2. 编码为UTF-8 3. 使用pandoc将HTML转换为AsciiDoc 4. 使用Sublime Text 2搜索和替换(使用一些正则表达式)去除疯狂的...

    原文
    Word文档的内容,需要背转换为Asciidoc。以下是我发现最有效的步骤:

    1. 将Word文档保存为HTML
    2. 编码为UTF-8
    3. 使用pandoc将HTML转换为AsciiDoc
    4. 使用Sublime Text 2搜索和替换(使用一些正则表达式)去除疯狂的东西
    5. 使用Sublime Text 2执行任何剩余的格式
    

    将Word文档保存为HTML

    在Word中打开文档,然后另存为网页。保存时选择“仅保存显示信息到HTML”选项。从Word退出。

    编码为UTF-8

    在Sublime Text 2中打开html文件。重新打开UTF-8编码并保存文件:

    Sublime Text 2重新打开编码
    如果不重新编码为UTF-8,则下一步将失败并显示错误:

    pandoc:无法解码字节’\ x6f’:Data.Text.Encoding.decodeUtf8:无效的UTF-8流

    使用Pandoc将HTML转换为AsciiDoc

    运行Pandoc。例如,以下命令将AsciiDoc文件file.asc转换为ConventionSheet.htm:

    pandoc -f html -t asciidoc -o file.asc ConventionSheet.htm
    

    使用Sublime Text 2搜索和替换(使用一些正则表达式)去除疯狂的东西

    奇怪的单引号需要去:

    Sublime Text 2用单引号替换反引号,如果在Word中进行了审核,则审阅者的评论和更改可能会出现在HTML中。使用搜索删除这些,并在搜索字段中替换以下正则表达式:

    \[line-through\]\*(.+)\*
    

    当匹配行交叉线断裂时,可以使用?s正则表达式中的单行选项()进行搜索和替换:

    (?s)\[line-through\]\*.(.*?)\*
    

    使用Sublime Text 2执行任何剩余的AsciiDoc格式

    在文档中等间隔任何正则表达式或其他特殊字符(这些将导致AsciiDoc解析器的问题)。

    根据需要编辑AsciiDoc文档!请注意,GitHub现在本地显示AsciiDoc文件(在幕后使用AsciiDoctor),就像Markdown一样。

    展开全文
  • 用poi讲word文档转换成html文件文件可以生成成功,但是编码却不一致了,大家有没有遇到,代码如下: public static String docx2html(File file, File outPutPath,String htmlFileName) { InputStream in=null...
  • word 拆分,对比,转换。。。java源码,文件编码识别,简繁转换。依赖包在lib文件夹下,word操着使用aspose
  • 解决方法(方法1)使用word2002 / 2003的“打开和修复”功能修复文档块. (1)启动word2002 / 2003,单击“文件-----打开”在“打开”对话框中选择重要的已修复Word文件. (2)单击“打开”按钮右侧的下部三角形按钮,...

    2013011912390214.jpg

    最佳答案1.较低的版本可能会打开较高的版本. 或格式不同. 2.文件已损坏. 解决方法(方法1)使用word2002 / 2003的“打开和修复”功能修复文档块. (1)启动word2002 / 2003,单击“文件-----打开”在“打开”对话框中选择重要的已修复Word文件. (2)单击“打开”按钮右侧的下部三角形按钮,然后在弹出菜单中选择“打开并修复”选项,以修复损坏的文档块. 修复完成后,将显示文档块的内容. 提示: “打开并修复”是仅在word2002及更高版本中可用的功能. 方法二: 转换文件格式以修复文件. 如果使用的是word2002以下的版本(例如word2000),则可以使用此方法修复文档块. (1)启动word2000后,单击“工具------选项-------常规”. 在此标签中,选中“打开时确认转换”复选框word打开显示文件转换,然后单击“确定”按钮.

    ddffcfb0ef1dde6a69f9762cf1100719.png

    (2)单击“文件---打开”在弹出的“打开”对话框中选择要恢复的文件,然后在“文件类型”框中选择“从任何文件中恢复文本”. (3)单击“打开”按钮以自动转换和修复Sun Changer的文档. (4)如果显示的文档内容令人困惑,请单击“文件---另存为”以“ RTF格式”或用其他字词识别的格式保存文档. (5)保存后关闭文档: 再次打开以“ RTF格式”保存的文档以查看完整文档. (6)再次将文档另存为“ DOC格式”. 这样就完成了孙长文文件的修复操作. 提示: 此方法也只能在word2002及更高版本中使用. 方法三: 重新格式化方法Word使用文档中的最后一个段落标记来关联各种格式信息,尤其是节和样式的格式. 这样我们就可以将除最后一段标记之”复选框

    c3f2e12d02e84ee06981425593083817.png

    取消选中复选框(选中整个段落时,Word将不会自动选择段落标记),然后单击“确定”按钮. ②选择除最后一段标记外的所有内容. 方法是按“ Ctrl + End”组合键,然后按“ Ctrl + Shift + Home”组合键. ③在通用工具栏中,依次单击“复制”,“新建”和“粘贴”按钮. 方法4: 禁止运行自动宏如果Word文档包含不正确的自动宏代码word打开显示文件转换,则当您尝试打开文档时,由于错误,自动宏将无法正常运行,从而导致无法打开文档的错误. 这时,请在“ Windows资源管理器”中,按住Shift键并双击Word文档,可以阻止自动宏运行,并可以打开该文档. 方法5: 使用修复软件,如DocRepair. 参考

    本文来自电脑杂谈,转载请注明本文网址:

    http://www.pc-fly.com/a/ruanjian/article-210863-1.html

    展开全文
  • ![执行这段代码就弹出一下框]...!... 在服务器上弹出 ”转换文件框"后、不手动去选择、程序就不往下执行!!! 有些word文不会弹出、有些会!现有什么办法不让弹出继续往下执行?
  • 出现这种情况,说明该word文档使用了不同的编码方式或格式,而汉语的编码方式刚好和word相一致罢了。那么,该如何解决word文档打开出现乱码的问题呢?word文档打开出现乱码的解决办法:方法一:删除内容格式法乱码的...
  • pdf转换成word转换器免费版是一款专业的pdf转换成word软件,完美支持pdf文件转换word文档,转换后可再次编辑,支持图文混合排版,支持表格转换,支持批量转换,操作简单。pdf转换成word转换器免费不限页数可以很好...
  • 不知是因为打开了非标准word文档改变了模板还是其他什么原因,当我鼠标右键新建一个word(.docx)文档时,然后双击打开,会弹出一个“转换文件”的对话框,有“纯文本、编码文本。。。”等选项,无论你选择了什么...
  • 不知是因为打开了非标准word文档改变了模板还是其他什么原因,当我鼠标右键新建一个word(.docx)文档时,然后双击打开,会弹出一个“转换文件”的对话框,有“纯文本、编码文本。。。”等选项,无论你选择了什么...
  • 每次打开word07 都出现下面一个框框,说要转换文件。 在Word2013文档中,为了能更好地使用“从任意文件还原文本”功能,用户需要启用“打开时确认文件格式转换”功能,以在打开并恢复文件时出现文件格式转换...
  • txt文件在Windows下可以正常显示,Ubuntu下打开文件乱码。这是中文编码问题,Windows下用的是gb2312,而linux下用的是utf8。在此提供5种解决方案: 1. 在文档所在目录运行命令  iconv -f gb2312 -t utf8 -c 1.txt ...
  • 有些word转换HTML后编码为x-cp20936,导至android系统中查看出现乱码,改为gd2312正常 Private WrdApp As Word.Application Private wrdDoc As Word.Document  Set wrdDoc = WrdApp.Documents.Open(sPath, , True)...
  • 原文Word文档的内容,需要背转换为Asciidoc。以下是我发现最有效的步骤:1. 将Word文档保存为HTML2. 编码为UTF-83. 使用pandoc将HTML转换为AsciiDoc4. 使用Sublime Text 2搜索和替换(使用一些正则表达式)去除疯狂的...
  • docx格式转txt格式先将doc格式转换为docx格式运用python-docx工具包来操作word文档乱码问题通过给定分隔符切分文段,并且保留分隔符 先将doc格式转换为docx格式 这里可以参考我的另一个博客: doc转docx. def doc_to_...
  • 今天遇到这个问题,word刚刚关闭,然后就打不开了 出现上面提示 解决方法: 先打开一个可以打开WORD文档 然后选择文件——打开——选择你那个损坏的WORD 然后点打开右边的向下箭头——选打开并修复, 一般都...
  • 本篇文章主要介绍了如何将html表单数据转换Word文档的几种方法,希望对有需要的朋友有所帮助。一、最简单的方法你可以直接选中表单数据直接复制粘贴到Excel表格中或者新建文档中,然而这样仅仅只有数据,没有任何...
  • 一款非常有用的pdf转换word软件,可以快速的将PDF文档转换Word RTF文件,E-PDF PDF To Word Converter允许你保留全部特性包括文字、图片、表格、链接等,同时也支持批量转换转换速度快,精确,易于使用,支持...
  • Java 将xml模板动态填充数据转换word文档

    万次阅读 多人点赞 2018-05-30 19:56:00
     2、通过Java程序,使用freemarker.jar包转换为xml格式的word文档文件 3、使用jacob包,将xml格式的word文档文件转换为docx格式的文档文件具体实现步骤:一、模板编辑 1、将word文档另存为xml模板: 2、模板中...
  • word转html可设置编码方式

    热门讨论 2011-08-31 17:53:58
    解决了关于word文档转换为html无法设置编码方式的问题
  • 一个同事的文档在U盘上处理并保存,然后早日去上班时发现文件打开内容是空的,但是文件的大小却是不为0的,通过各种办法最后分析出文件却是损坏无法恢复,最开始想的是编码问题,试了很多编码都不行,最后想在十六...
  • 文件转换为Base64编码

    2010-01-06 15:31:05
    可以实现将文件转换为Base64编码。可以实现将文件转换为Base64编码
  • PDF文档如何转换成可编辑的Word文档

    千次阅读 2016-03-25 11:08:56
    但是在文件的编辑操作上就比不上word了,尤其是对于文字的处理这块,所以在编辑处理pdf文件内容的时候就不想word那么简单了,如果遇到需要提取pdf文件中的内容,我们可以将其转换为可以编辑的word文档,然后在word中...
  • 实现html和word的相互转换(带图片)

    万次阅读 多人点赞 2018-06-16 13:29:10
    目前从html转换word为doc格式,而图片处理支持的是docx格式,所以需要手动把doc另存为docx,然后才可以进行图片替换。 一.添加maven依赖 主要使用了以下和poi相关的依赖,为了便于获取html的图片元素,还使用了...
  • 本篇文章主要介绍了如何将html表单数据转换Word文档的几种方法,希望对有需要的朋友有所帮助。一、最简单的方法你可以直接选中表单数据直接复制粘贴到Excel表格中或者新建文档中,然而这样仅仅只有数据,没有任何...
  • 在数据传输过程中经常会遇到将文件转为base64编码然后再进行传输,接收方接收到编码...利用JDK 自带的 Base 相关工具,写一个如下的工具类来处理 base64 编码文件转换: public class Base64Utils { /** ...
  • 任务:有一个父文件夹...(因为word的写入doc.SaveAs()s生成的都是ANSI编码文件,可以考虑转换为utf-8编码文件。当然也可以不转。) 4.将同一目录下所有的txt文件合并成为一个 直接上代码 #%% #读取一个父文件夹下

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 58,318
精华内容 23,327
关键字:

word文档打开要转换编码