精华内容
下载资源
问答
  • 导出word文档开发-freemarker1.pom.xml2.word模板3.代码4.FreeMarker基础语法5.建议6.参考网站 1.pom.xml <dependency> <groupId>org.freemarker</groupId> <artifactId>freemarker</...

    1.pom.xml

    	<dependency>
          <groupId>org.freemarker</groupId>
          <artifactId>freemarker</artifactId>
          <version>2.3.28</version>
     	</dependency>
    
    • 这里版本号自己控制(各版本差异自行百度)
    • https://mvnrepository.com/artifact/org.freemarker/freemarker

    2.word模板

    已WPS为例

    1. 打开需要开发导出的word文档
    2. 另存为 选择其他格式 选择XML格式 保存
    3. 在项目资源文件夹新建 **.ftl 文件
    4. 把另存的xml文件内容贴近 **.ftl 文件(或直接把xml扔进项目里改名)
      word内容
    //导出的xml里对应模板信息
    <w:r>
    	<w:rPr>
    		<w:rFonts w:hint="fareast"/>
    		<w:lang w:val="EN-US" w:fareast="ZH-CN"/>
    	</w:rPr>
    	<w:t>姓名:</w:t>
    </w:r>
    

    3.代码

    	/**
         * 使用FreeMarker通过模版生成word文档,模版文件需存放在/properties文件夹下
         * @param docData 模版中使用的数据
         * @param ftlName 模版文件的名称,只能是ftl类型文件
         * @param filePath 生成的doc文件存放的位置
         * @param fileName 生成的doc文件的名称(不含扩展名)
         * @return
         * @throws IOException
         */
        public void createDoc(Map<String, Object> docData, String ftlName, String filePath, String fileName) throws IOException {
            // FreeMarker模板配置对象
            Configuration configuration = new Configuration(Configuration.VERSION_2_3_22);
            // 指定模版文件目录
            configuration.setClassLoaderForTemplateLoading(this.getClass().getClassLoader(), "/properties");
            // 指定模版字符集
            configuration.setDefaultEncoding("UTF-8");
            // 加载模板文件
            Template tmplt = configuration.getTemplate(ftlName);
            // 生成doc文件的名称
            String docName = filePath + fileName + ".doc";
            // 待doc文件
            File docFile = null;
            try {
                docFile = new File(docName);
                Writer opWriter = new OutputStreamWriter(new FileOutputStream(docFile), "utf-8");
                tmplt.process(docData, opWriter);
                opWriter.flush();
                opWriter.close();
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    

    4.FreeMarker基础语法

    //同EL表达式 ${name}   // 这些基本都能解决了,如遇到不能解决的自行百度
    	1.if语句(判断是否为空)  
      <#if target?? >  
        此处为iftrue的内容
      </#if>
    
      2.list循环
      <#list list as t>
        ${t.title}
      </#list>
    

    5.建议

    //建议加上非空判断   不建议直接使用 ${name} 来展示 不加判断 值为空的话会报错
    <w:r>
    	<w:rPr>
    		<w:rFonts w:hint="fareast"/>
    		<w:lang w:val="EN-US" w:fareast="ZH-CN"/>
    	</w:rPr>
    	<w:t>姓名: <#if name??  && name != "">
    					${name}
    				<#else> 
    				
    				</#if>
    	</w:t>
    </w:r>
    

    6.参考网站

    http://freemarker.foofun.cn/ 或直接百度

    展开全文
  • 网上书店系统的最终目的是客户可以通过网上书店找到自己所需要的书籍,网上书店主要向客户提供各种书籍材料。
  • 特别是当Word文档中的图片非常多时,这个功能能够极大的提高工作效果。在上传Word图片时控件不会破坏Word文档格式。不仅如此,新颖网络Word图片上传控件还可以自动上传剪帖板中图片,电脑硬盘中的图片。 对于开发...
  • 批量word文档转换flash

    2008-11-17 16:11:42
    能将word2003的文档转换flash文档,对进行网站开发时使用word文档时非常便利
  • 这是一套网站后台开发简历酷黑炫彩应届Word简历模板,喜欢的人都来下载吧。该文档网站后台开发简历酷黑炫彩应届Word简历模板,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看
  • 提取word文档内容

    2013-11-28 14:15:00
    前段时间开发时,要求解析word,把里面的文本内容提取出来。先用微软自带的dll做开发, 发布到网站上结果:可能一些地方没解决好,解析时一个字慢。后来就不用了这种方法了。 于是,就用wps的dll用来解析,速度...

    前段时间开发时,要求解析word,把里面的文本内容提取出来。先用微软自带的dll做开发,

    发布到网站上结果:可能一些地方没解决好,解析时一个字慢。后来就不用了这种方法了。

     于是,就用wps的dll用来解析,速度倒是挺快的,不过在win7发布时好像行不通,权限配置不了,到最后也没懂。

    最后,百度许多内容,就用Aspose.Words.dll来,学习一下,不过Aspose.Words.dll是要收费的。。。

     

    转载于:https://www.cnblogs.com/st-coordinate/p/3447620.html

    展开全文
  • Python爬虫、数据分析、网站开发等案例教程视频免费在线观看 https://space.bilibili.com/523606542 需求 有一个下面这种形式的word表格: 希望能转换为下面这种格式的excel表格: 测试word文档读取...

    本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

    作者:小小明

    来源:菜J学Python

    Python爬虫、数据分析、网站开发等案例教程视频免费在线观看

    https://space.bilibili.com/523606542

    需求

    有一个下面这种形式的word表格:

    如何用Python将Word文档转换为Excel表格

     

    希望能转换为下面这种格式的excel表格:

    如何用Python将Word文档转换为Excel表格

     

    测试word文档读取

    先测试一个word文档前1页的数据读取:

    from docx import Document
    
    doc = Document("编号02 质检员高级技师(一级)理论试卷.docx")
    for i, paragraph in enumerate(doc.paragraphs[:55]):
        print(i, paragraph.text)

    如何用Python将Word文档转换为Excel表格

     

    从读取效果上看,各行文本数据都能很顺利的获取到。

    匹配题型、题目和具体的选项

    现在我们需要做的是就是匹配题型、题目和具体的选项,观察可以发现规律:

    1. 题型以大写数字开头
    2. 题目以普通数字+.开头
    3. 选项以括号+字母开头

    额外需要注意的:

    开头几行文本也存在普通数字+.开头的,需要直接排除。

    第7题的题目,和第19题的选项存在一些特殊的空白字符需要排除,

    括号和小数点都同时存在半角和全角两种情况。

    对于需要注意的第二点:

    如何用Python将Word文档转换为Excel表格

     

    查看一下这2处的空白字符:

    doc.paragraphs[21].text

    '7.(\xa0\xa0)是第一家实施六西格玛管理的公司。\xa0'

    doc.paragraphs[49].text

    '(A)参数设计 (B)常量设计\u3000 (C)变量设计\u3000\u3000 (D)系统设计'

    发现分别是\xa0和\u3000。

    整理好大致思路,我组织一下处理代码:

    import re
    from docx import Document
    
    doc = Document("编号02 质检员高级技师(一级)理论试卷.docx")
    
    black_char = re.compile("[\s\u3000\xa0]+")
    
    chinese_nums_rule = re.compile("[一二三四]、(.+?)\(")
    title_rule = re.compile("\d+.")
    option_rule = re.compile("\([ABCDEF]\)")
    option_rule_search = re.compile("\([ABCDEF]\)[^(]+")
    
    
    # 从word文档的“一、单项选择题”开始遍历数据
    for paragraph in doc.paragraphs[5:25]:
        #  去除空白字符,将全角字符转半角字符,并给括号之间调整为中间二个空格
        line = black_char.sub("", paragraph.text).replace(
            "(", "(").replace(")", ")").replace(".", ".").replace("()", "(  )")
        # 对于空白行就直接跳过
        ifnot line:
            continue
        if title_rule.match(line):
            print("题目", line)
        elif option_rule.match(line):
            print("选项", option_rule_search.findall(line))
        else:
            chinese_nums_match = chinese_nums_rule.match(line)
            if chinese_nums_match:
                print("题型", chinese_nums_match.group(1))

    如何用Python将Word文档转换为Excel表格

     

    从目前测试结果来看没有问题。

    保存匹配到的数据到结构化字典

    现在我打算将当前匹配出来的文本数据存储成字典形式的结构化数据,字典结构的设计如下:

    如何用Python将Word文档转换为Excel表格

     

    根据上述设计完善代码:

    import re
    from docx import Document
    from collections import OrderedDict
    
    doc = Document("编号02 质检员高级技师(一级)理论试卷.docx")
    
    black_char = re.compile("[\s\u3000\xa0]+")
    
    chinese_nums_rule = re.compile("[一二三四]、(.+?)\(")
    title_rule = re.compile("\d+.")
    option_rule = re.compile("\([ABCDEF]\)")
    option_rule_search = re.compile("\([ABCDEF]\)[^(]+")
    
    # 保存最终的结构化数据
    question_type2data = OrderedDict()
    # 从word文档的“一、单项选择题”开始遍历数据
    for paragraph in doc.paragraphs[5:]:
        #  去除空白字符,将全角字符转半角字符,并给括号之间调整为中间一个空格
        line = black_char.sub("", paragraph.text).replace(
            "(", "(").replace(")", ")").replace(".", ".").replace("()", "(  )")
        # 对于空白行就直接跳过
        ifnot line:
            continue
        if title_rule.match(line):
            options = title2options.setdefault(line, [])
        elif option_rule.match(line):
            options.extend(option_rule_search.findall(line))
        else:
            chinese_nums_match = chinese_nums_rule.match(line)
            if chinese_nums_match:
                question_type = chinese_nums_match.group(1)
                title2options = question_type2data.setdefault(question_type, OrderedDict())
    

    遍历结构化字典并存储

    然后我们遍历结构化字典,将数据保存到pandas对象中:

    import pandas as pd
    
    result = []
    max_options_len = 0
    for question_type, title2options in question_type2data.items():
        for title, options in title2options.items():
            result.append([question_type, title, *options])
            options_len = len(options)
            if options_len > max_options_len:
                max_options_len = options_len
    df = pd.DataFrame(result, columns=[
                      "题型", "题目"]+[f"选项{i}"for i in range(1, max_options_len+1)])
    # 题型可以简化下,去掉选择两个字
    df['题型'] = df['题型'].str.replace("选择", "")
    df.head()
    

    结果:

    如何用Python将Word文档转换为Excel表格

     

    最终保存结果:

    df.to_excel("result.xlsx", index=False)

    完整代码

    最终完整代码:

    import pandas as pd
    import re
    from docx import Document
    from collections import OrderedDict
    
    doc = Document("编号02 质检员高级技师(一级)理论试卷.docx")
    
    black_char = re.compile("[\s\u3000\xa0]+")
    
    chinese_nums_rule = re.compile("[一二三四]、(.+?)\(")
    title_rule = re.compile("\d+.")
    option_rule = re.compile("\([ABCDEF]\)")
    option_rule_search = re.compile("\([ABCDEF]\)[^(]+")
    
    # 保存最终的结构化数据
    question_type2data = OrderedDict()
    # 从word文档的“一、单项选择题”开始遍历数据
    for paragraph in doc.paragraphs[5:]:
        #  去除空白字符,将全角字符转半角字符,并给括号之间调整为中间一个空格
        line = black_char.sub("", paragraph.text).replace(
            "(", "(").replace(")", ")").replace(".", ".").replace("()", "(  )")
        # 对于空白行就直接跳过
        ifnot line:
            continue
        if title_rule.match(line):
            options = title2options.setdefault(line, [])
        elif option_rule.match(line):
            options.extend(option_rule_search.findall(line))
        else:
            chinese_nums_match = chinese_nums_rule.match(line)
            if chinese_nums_match:
                question_type = chinese_nums_match.group(1)
                title2options = question_type2data.setdefault(
                    question_type, OrderedDict())
    
    result = []
    max_options_len = 0
    for question_type, title2options in question_type2data.items():
        for title, options in title2options.items():
            result.append([question_type, title, *options])
            options_len = len(options)
            if options_len > max_options_len:
                max_options_len = options_len
    df = pd.DataFrame(result, columns=[
                      "题型", "题目"]+[f"选项{i}"for i in range(1, max_options_len+1)])
    # 题型可以简化下,去掉选择两个字
    df['题型'] = df['题型'].str.replace("选择", "")
    df.to_excel("result.xlsx", index=False)
    

    最终得到的文件:

    如何用Python将Word文档转换为Excel表格

    展开全文
  • word文档转html利器

    千次阅读 2015-12-12 00:57:56
    有需求,就会有相应的技术出现,以前知道word可以用来书写html网页,那自然就可以转成html页面,难道我们要用word开发html页面吗? 你可能会问,我为什么要把word转成html?是的,开始我也很不理解为什么会有这样...

    有需求,就会有相应的技术出现,以前知道word可以用来书写html网页,那自然就可以转成html页面,难道我们要用word开发html页面吗?

    你可能会问,我为什么要把word转成html?是的,开始我也很不理解为什么会有这样的需求。


    后来,我竟然真的迫切地需要一个这样的功能,把word直接转成html,挂入我们的网站。


    我们要自己的oa系统,有很多经验分享要挂在oa系统上,但这些经验很多都是以word文档的形式保存的。如何能在线预览?

    有很多方式,比如转为flash等等,但都太复杂了。

    我想到了一种变通的方式,即提前把word转换为html,预览的时候,直接返回这个html即可,当然不能手工转,要借助工具,即jacob


    详见如下DEMO:


    1、导入jacob.jar

    2、核心测试代码

    1. import com.jacob.activeX.ActiveXComponent;  
    2. import com.jacob.com.Dispatch;  
    3. import com.jacob.com.Variant;  
    4.   
    5. /** 
    6.  *  
    7.  *  
    8.  * @author jialin 
    9.  * @since 2015-3-27 
    10.  */  
    11. public class word2html {  
    12.     public static boolean wordToHtml(String inPath, String toPath) {  
    13.         // 启动word  
    14.         ActiveXComponent axc = new ActiveXComponent("Word.Application");  
    15.   
    16.         boolean flag = false;  
    17.   
    18.         try {  
    19.             // 设置word不可见  
    20.             axc.setProperty("Visible"new Variant(false));  
    21.   
    22.             Dispatch docs = axc.getProperty("Documents").toDispatch();  
    23.   
    24.             // 打开word文档  
    25.             Dispatch doc = Dispatch.invoke(  
    26.                     docs,  
    27.                     "Open",  
    28.                     Dispatch.Method,  
    29.                     new Object[] { inPath, new Variant(false),  
    30.                             new Variant(true) }, new int[1]).toDispatch();  
    31.   
    32.             // 作为html格式保存到临时文件  
    33.             Dispatch.invoke(doc, "SaveAs", Dispatch.Method, new Object[] {  
    34.                     toPath, new Variant(8) }, new int[1]);  
    35.   
    36.             Variant f = new Variant(false);  
    37.             Dispatch.call(doc, "Close", f);  
    38.             flag = true;  
    39.             return flag;  
    40.   
    41.         } catch (Exception e) {  
    42.             e.printStackTrace();  
    43.             return flag;  
    44.         } finally {  
    45.             axc.invoke("Quit"new Variant[] {});  
    46.         }  
    47.     }  
    48.   
    49.     public static void main(String[] args) {  
    50.           
    51.     word2html.wordToHtml("E://01_Document//ths_project//webservice//webservice_invoke_help.docx",  
    52.                 "E://01_Document//ths_project//webservice//webservice_invoke_help.htm");  
    53.   
    54.     }  
    55. }  

    忽然想起当年老师说的一句话:遇到问题,你就去搜吧,肯定前面已经有很多人遇到和你一样的问题了。看看别人是怎么干的,借鉴一下,站在巨人的肩膀上。

    有了需求,自然有解决需求的工具。

    展开全文
  • GPS平台、网站建设、软件开发、...1.打开需要转换的Word文档。全选需要转换的中文,如果只需要转换一部分也可以选择其中的一部分的,这个看个人情况而定。 2.选择菜单栏中的审阅,我们可以看到里面有很多的内容,里
  • aspose将word文档转为html内容

    千次阅读 2019-07-25 18:21:37
    网站开发过程中,有时候需要将word内容展示在网页,可以通过aspose将doc文件直接转为pdf进行预览,但是有时候可能需要就在网页的某部分信息中显示内容,而不需要在线预览,这时候可以考虑将word内容简单转换为html...
  • GPS平台、网站建设、软件...可是GIF图片插入Word文档后却变成了静态画面,表现效果大打折扣。让我们装一个小控件,让 图片动起来! 第一步:登录http://www.officefans.net/cdb/attachment.php?aid=1034下载控件(快
  • docx4j 处理word2007文档

    千次阅读 2017-05-12 15:16:12
    Word2007采用ECMA-376标准,在java开发中,处理word文档有很多优秀的第三方开源项目,例如: 1)POI(兼容doc、docx文件)  官方网站:http://poi.apache.org/  网上例子很多,由于发布时间较早,很多外国网站的...
  • 网站的使用中,有时候需要把数据库里面的内容生成到word文档里面,然后下载到本地进行查看,使用VS.NET就可以实现这个功能,下面这个例子就简单到实现了服务器端生成word文档并提供下载的功能,虽然没有彻底地把...
  • 网站的使用中,有时候需要把数据库里面的内容生成到word文档里面,然后下载到本地进行查看,使用VS.NET就可以实现这个功能,下面这个例子就简单到实现了服务器端生成word文档并提供下载的功能,虽然没有彻底地把...
  • 资源名称:Jquery学习文档 中文WORD版内容简介:本文档主要讲述的是Jquery学习文档;jQuery是继Prototype之后有一个优秀的Javascript库,是一个由John Resig创建于2006年1月的开源项目。现在的jQuery团队主要...
  • 网站的使用中,有时候需要把数据库里面的内容生成到word文档里面,然后下载到本地进行查看,使用VS.NET就可以实现这个功能,下面这个例子就简单到实现了服务器端生成word文档并提供下载的功能,虽然没有彻底地把...
  • 第5~10章介绍了窗体控件、文件管理、Internet应用、数据库、图形图像以及组件设计等Windows窗体界面下的客户端应用编程,第11~14章介绍了网页设计、Web服务器控件、网站开发应用设计和报表处理,第15章为与本书...
  • 下面我就简单的和大家分享一下如何实现Word文档的在线打开、编辑和保存。第一步:请先安装PageOffice的服务器端的安装程序,之后在你的网站中根目录下添加pageoffice文件夹(在PageOffice官方网站的“下...
  • 在某些涉及到报表的项目开发中,可能经常会...下面我就以批量转换10个Word文档为例来分享一下FileMakerCtrl控件的使用方法。第一步:请先安装PageOffice的服务器端的安装程序,之后在你的网站或项目的根目录下添加p...
  • 客户有这种要求,就是复制word文档中有文字、表格、图片到网页编辑器中,在页面上呈现的效果也不会出现排版上的错乱,和原本在word上这只的格式、排版都一样。 我知道这种需要特殊定制,但是格式的上的只能复制到...
  • 基于JSP技术的镇旅游网站设计软件程序源码+数据库+word毕业设计论文文档.旅游网站设计主要用于实现旅游景点信息管理,基本功能包括:主界面模块设计,用户注册模块,旅游景点模块,酒店预订模块,后台管理模块等。本...
  • 基于JAVA和Eclipse开发环境的网络爬虫技术网络新闻分析软件程序源码+WORD毕业论文文档. 本系统结构如下: (1)网络爬虫模块。 (2)中文分词模块。 (3)中3文相似度判定模块。 (4)数据结构化存储模块。 (5)...
  • 在做OA或者工作流程的网站中,常常能够看到一些在线Word编辑进行文档处理的功能,这里我开发了一个在线Word编辑插件并且以此为例。 1.NTKO Word在线编辑器介绍: NTKO的官方网站:http://www.ntko.com/ NTKO ...
  • 第2章 网站开发环境及相关知识介绍 3 2.1 系统配置要求 3 (1) 服务器硬件: 3 (2) 服务器软件: 3 (3) 客户机软件: 3 2.2 B/S体系结构 3 2.3 MyEclipse 7.0 简介 3 2.4 SQL Server 2012数据库 4 2.5 JDBC技术 4 ...
  • 程序员在开发项目时,经常需要给一些图片、文件添加水印,但往往代码编写复杂,只能是先将文件上传再调用Graphics类才能实现这一功能。但是最无奈的是这个类只能给图片添加水印,而无法通过程序给Word文件添加水印,...
  • 在OA系统开发中,有些客户可能会希望通过系统来实现签订某些电子文件或合同,而非还是必须通过纸质文件来实现。而电子签章就是为实现这一功能而出现的,电子签章能保证签订合同、协议的有效性和真实性,而如何加盖...
  • 在本地磁盘上打开一个Word文件,手动添加内容或插入图片是十分容易的,但是如何在线打开一个Word文件并用程序修改Word文件内容或者插入图片呢,这时就需要通过PageOffice开发平台,给数据区域赋值,来实现这一目标了...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 465
精华内容 186
关键字:

网站开发word文档