-
wrong-result-***.txt,***为各种分词算法名称,这是分词结果和人工标注标准不一致的文本 10、分布式中文分词器 1、在自定义配置文件word.conf或word.local.conf中指定所有的配置项*.path使用HTTP资源,同时指定...
-
【JAVA】使用jacob生成的html,关于文字乱码处理,图片无法显示等问题。
2011-11-14 19:46:03jacob网上例子很多就不说了,但是jdk版本和jar包版本必须保持一致。 1.图片无法显示: 因为生成html的时候会生成一个files文件,就和文件另存为网页一样会产生一个files文件一样,因为里面用了vml矢量!vml始终为...最近项目中需要把word和excel直接通过ext导入到服务器上。用到了jacob,然后放在服务器目录上,问题出现了:
jacob网上例子很多就不说了,但是jdk版本和jar包版本必须保持一致。
1.图片无法显示:
因为生成html的时候会生成一个files文件,就和文件另存为网页一样会产生一个files文件一样,因为里面用了vml矢量!vml始终为false显示无法显示图片。
最后只有用自己又重新用流读写了此数据,替换掉了里面的vml矢量这样图片可以显示。
方法:
/** * * @Title: writeHtmlReplaceVml * @Description: TODO(word转html后替换vml矢量,否则无法显示图片) * @param vmlFilePath * @throws */ private static void writeHtmlReplaceVml(String vmlFilePath) { String strInfo = null; // 读取网页文件 try { FileInputStream fis = new FileInputStream(vmlFilePath); InputStreamReader isr = new InputStreamReader(fis); BufferedReader buf = new BufferedReader(isr); int i = 0; String c; try { while ((c = buf.readLine()) != null) { if (i == 0) { strInfo = c; } else { strInfo = strInfo + "\n" + c; } i++; } buf.close(); isr.close(); fis.close(); } catch (IOException e) { e.printStackTrace(); } } catch (FileNotFoundException e) { e.printStackTrace(); } // 处理网页内容,并重新生成新的网页文件 try { File write = new File(vmlFilePath); //BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(write),"utf-8")); BufferedWriter bw = new BufferedWriter(new FileWriter(write)); strInfo = strInfo.replace("<![if !vml]>", ""); strInfo = strInfo.replace("<![endif]>", " "); //strInfo = strInfo.replace("charset=gb2312", "charset=gb2312"); // strInfo=strInfo.replace("<td","<td nowrap"); bw.write(strInfo); bw.close(); } catch (IOException ee) { System.out.println(ee.getMessage()); } // 删除临时生成的网页文件及其附属文件夹 // try // { // File fl = new File(strFile); // if(fl.exists() && fl.isFile()){fl.delete();}//删除临时网页 // int intLen=strFile.lastIndexOf("."); // String strFileFolder=strFile.substring(0,intLen+1)+"files"; // delFolder(strFileFolder);//删除临时网页附属的文件夹 // } catch (Exception ee) { System.out.println(ee.getMessage()); } }
2.文字乱码。在显示的时候嵌套在了iframe里面,生成的html文件格式为gb2312,项目为utf-8,显示的时候word正常,excel正文正常,但是下面若有sheet分页的话,分页中文乱码,开始时候思路是写入的时候改变为utf-8,但是在处理后发现部分文字正常,但是某些文字还是乱码。无奈之下又去寻找答案,想了下当时使用mht显示的时候配置如下代码:web配置:
<!-- 页面可以访问mht文件配置 --> <mime-mapping> <extension>mht</extension> <mime-type>message/rfc822</mime-type> </mime-mapping>
在网上有找了下,发现需配置web:<web-app> <!-- 页面可以访问html文件配置 --> <jsp-config> <jsp-property-group> <description>HTML Encoding</description> <display-name>HTML Encoding Config</display-name> <url-pattern>*.html</url-pattern> <el-ignored>true</el-ignored> <page-encoding>gbk</page-encoding> <scripting-invalid>true</scripting-invalid> </jsp-property-group> </jsp-config> </web-app>
这样gb2312也可以显示正常。
-
oracle学习文档 笔记 全面 深刻 详细 通俗易懂 doc word格式 清晰 连接字符串
2017-05-06 20:26:52oracle学习文档 笔记 全面 深刻 详细 通俗易懂 doc word格式 清晰 第一章 Oracle入门 一、 数据库概述 数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它产生于距今五十年前。简单来说是本身可视... -
auxure 安装包+汉化包
2015-07-18 10:43:203.Axure RP根据设计稿,一键生成一致而专业的word版本的原型设计文档。 Axure RP 交流论坛(中文) Axure RP六合一功能: 一.网站构架图(Site Structure) AxureRP可以快速绘制树状的网站构架图,而且可以让构架... -
2004-2010软考程序员真题
2012-09-27 12:33:0016、Word的"文件"命令菜单底部显示的文件名所对应的文件是 A)当前被操作的文件 B)当前已经打开的所有文件 C)最近被操作过的文件 D)扩展名是.doc的所有文件 17、在Word的编辑状态,执行编辑命令"粘贴"后 A)... -
公司年会大屏幕抽奖
2018-09-25 15:06:14更新:摇一摇优化,现在手机端和电脑端的数字会显示一致,不会因为网络卡而导致不一样的情况发生 2015.12.12 更新:更新了安装文档中的一个错误。 更新:更新了上墙换肤图相关的一个js错误。 更新:优化一键安装流程,... -
华为编程开发规范与案例
2008-09-04 16:44:561、新老代码中同一全局变量不一致 第58页 【案例5.1.1】 第58页 六、可测试性代码问题 第59页 1、调试信息/打印信息的正确性 第59页 【案例6.1.1】 第59页 一、逻辑类代码问题 1、变量/指针在使用前就必须初始... -
免费DataGridView打印及.NET轻松打印控件5.0版
2012-05-13 15:29:557、解决了DataGridView在有固定列(冻结列)的时候,有些情况下(DGV固定列的index与DisplayIndex不一致时)打印可能出错的问题。 8、DGVPrint组件的自定义纸张使用更方便,设计时在可以通过设置PaperHeight与... -
C#高级编程(第9版):C# 5.0 & .NET 4.5.1.[美]Christian Nagel(带详细书签) PDF 下载 高清 完整版
2017-12-26 14:02:25如果读者使用以前的版本编码,本书的一些章节就不适用。本书将标注出专用于.NET Framework 4.5和4.5.1的新增内容。 不要被这个架构名称中的.NET所迷惑,认为这是一个只关注Internet的架构。这个名称中的.NET仅强调... -
一个成果如果包含一个pdf文件则直接打开,如果多于一个则打开列表,非pdf附件也是一样;文章采用富文本编辑器froala,支持图文word直接黏贴,自动上传图片;成果数据采用后端分页,百万级成果数据快速显示; 成果间...
-
Excel百宝箱 9.0 破解版 批量导入图片等200种功能
2013-05-11 22:46:24可以选择大于某值或者小于某值或者在某范围之间的值,文本定位时支持通配符,在8.0版本开始还加了按格式定位、按格式计算功能。例如选择并计算红色区域,或者选择字号为20、字体为宋体的区域,再如选择加粗且倾斜的... -
网管教程 从入门到精通软件篇.txt
2010-04-25 22:43:49如果不带任何参数,diskpart 命令将启动 diskpart 的 Windows 字符模式版本。 /add 创建新的分区。 /delete 删除现有分区。 device_name 要创建或删除分区的设备。设备名称可从 map 命令的输出... -
wps2000最经典的办公软件+注册码
2013-08-19 01:54:29早在1997 年,金山电脑公司就开发出了新一代字处理软件 WPS 97, 一经推出便受到各界用户的广泛欢迎和一致称赞。它以操作简便、功能齐全、实用方便等优点在中文字处理领域一枝独秀,备受用户青睐,成为中文字处理... -
测试培训教材
2014-04-01 12:10:48显示测试覆盖率饼图: 7、生成自动化测试脚本、BPT模型 产生自动化测试脚本 是否需要实现自动化: 自动化实现“Cruise Search”测试用例: 定位到“Cruise Search”测试用例,在“设计步骤”界面中选择... -
JAVA 正则表达式
2010-01-15 11:16:37* 显示输出信息 * @param out */ public void print (PrintStream out) { Iterator elements = files.iterator(); while (elements.hasNext()) { File file=(File) elements.next(); out.println(file.... -
asp.net知识库
2015-06-18 08:45:452分法-通用存储过程分页(top max模式)版本(性能相对之前的not in版本极大提高) 分页存储过程:排序反转分页法 优化后的通用分页存储过程 sql语句 一些Select检索高级用法 SQL server 2005中新增的排序函数及应用 ... -
支持 繁体字 拼音、笔画数及以上所有功能,实现和简体字一样的功能 支持 成语 查询功能,可以按照汉字、拼音(声调)、笔画数查询成语 支持 歇后语 查询功能,支持模糊查询 支持 偏旁部首 查询功能 提供汉字工具方法...
-
C++MFC教程
2013-05-21 13:37:154、窗口句柄:说到消息就不能不说窗口句柄,系统通过窗口句柄来在整个系统中唯一标识一个窗口,发送一个消息时必须指定一个窗口句柄表明该消息由那个窗口接收。而每个窗口都会有自己的窗口过程,所以用户的输入就会... -
python-docx:读取,查询以及修改 Microsoft Word 2007/2008 docx 文件。 python-pptx:可用于创建和修改 ppt 文件的 Python 库。 relatorio:模板化 OpenDocument 文件。 unoconv:在 LibreOffice/OpenOffice ...
-
uboott移植实验手册及技术文档
2010-01-28 19:18:03(4)在 “ _start_armboot: .word start_armboot ”后加入: .align 2 DW_STACK_START: .word STACK_BASE+STACK_SIZE-4 三、创建 board/fs2410/nand_read.c 文件,加入读 NAND Flash 的操作。 #include ...
收藏数
20
精华内容
8