精华内容
下载资源
问答
  • 在pom.xml中指定dependency,可用版本有1.0、1.1、1.2、1.3、1.3.1: <dependencies> <dependency> <groupId>org.apdplat</groupId> <artifactId>word</artifactId> <...
  • 找不到映射 请按 ENTER 或其它命令继续 ``` vim的配置文件如下 ``` let Tlist_Auto_Highlight_Tag=1 let Tlist_Auto_Open=1 let Tlist_Auto_Update=1 let Tlist_Display_Tag_Scope=1 let Tlist_Exit_...
  • 二进制XML存储方案

    2008-09-25 09:48:50
    · 存储的数据中可能包括一个或者多个的文件附件,如:word文档; · 存储的数据可能被不同的平台使用,如:windows或者linux; · 作为web项目的一部分,除了提供VC的接口之外,存储的数据格式需要提供java的接口...
  • 可以在web.xml里配一个servlet,如以*.png的请求转成.do的。如: public class PngDispatcherServlet extends HttpServlet { private static final long serialVersionUID = 6230740581031996144L; public ...
  • 中文语料上的word2vec训练

    千次阅读 2016-12-08 19:57:14
    GOOGLE开源的word2vec能够把词映射到K维空间,每个词有独自的向量表示,从而得出词语词之间的距离(相似度)。但是其自带的基本语料text8是本身就十分适合于训练的(全部是英文单词,中间用空格隔开,没有多余的信息...

    GOOGLE开源的word2vec能够把词映射到K维空间,每个词有独自的向量表示,从而得出词语词之间的距离(相似度)。但是其自带的基本语料text8是本身就十分适合于训练的(全部是英文单词,中间用空格隔开,没有多余的信息)语料,训练的结果自然很好。本文就是说明一下如何用word2vec处理中文语料。
    想到的能使用训练集自然是维基百科的中文语料,里面包含大概23万篇文章,解压后有5G多。这种XML文件还是会有很多不必要的噪声,于是我们又要用到抽取其中内容的工具,意大利人用python写的WikiExtractor.py
    下载后可以直接进行处理,命令:bzcat zhwiki-latest-pages-articles.xml.bz2 | python WikiExtractor.py -b1000M -o extracted >output.txt,(参考了licstar维基百科简体中文语料的获取)一开始出现了参数不足的问题,将语料解压后改用了:python WikiExtractor.pyzhwiki-latest-pages-articles.xml -b1000M -o extracted >output.txt,大概4小时运行结束。
    但是这只是去噪的第一步,把文本内容抽取出来,接下来我们进行繁简转换,我用的UBUNTU14.04,可以方便的使用OPENCC,sudo apt-get install opencc进行安装,再用opencc -i wiki_00 -o wiki_jian -c zht2zhs.ini(参考了licstar维基百科简体中文语料的获取)就能成功的进行转换了,wiki_00是上一步内容提取生成的文件。wiki_jian是转换后的文件。
    最后进行分词之前我们先转换一下编码:iconv -c -t UTF-8 wiki_jian.utf-8。然后用jieba进行分词,同时去标点符号,安装命令:pip install jieba,编写python文件jiebatest.py

    #-*-coding:utf-8-*-
    #coding:utf8
    import jieba
    fin = open('wiki_jian.utf-8','r')
    fou = open('wiki_text','w')
    line = fin.readline()
    while line:
      newline = jieba.cut(line,cut_all=False)
      str_out = ' '.join(newline).encode('utf-8').replace(',','').replace('。','').replace('?','').replace('!','') \
                .replace('“','').replace('”','').replace(':','').replace('’','').replace('‘','').replace('-','') \
                .replace('(','').replace(')','').replace('《','').replace('》','').replace(';','').replace('.','') \
                .replace('、','').replace('_','').replace(',','').replace('?','').replace('!','')
      print str_out,
      print >> fou,str_out,
      line = fin.readline()
    fin.close()
    fou.close()

    python jiebatest.py即可生成去噪后的文件wiki_text,在下载下来的word2vec中的trunk中使其替换原来的text8,./demo-word.sh完成训练,下面是一些结果图:
    这里写图片描述

    这里写图片描述

    这里写图片描述

    这里写图片描述

    展开全文
  • 为GenreicModel定制id映射 - 72 - Finding对象 - 72 - Find by ID - 72 - Find all - 73 - 使用简单查询进行查找 - 73 - 使用JPQL 查询进行查找 - 74 - Counting统计对象 - 74 - 用play.db.jpa.Blob存储上传文件 - ...
  • 打开%TOMCAT_HOME%/conf/web.xml  在里面里面增加rar文件的mime映射就可以了。也可以将其他的类型添加到mime映射中,如:  doc  application/msword  xls  application/msexcel  pdf  ...

    打开%TOMCAT_HOME%/conf/web.xml 

    在里面里面增加rar文件的mime映射就可以了。也可以将其他的类型添加到mime映射中,如:

    <mime-mapping>
     <extension>doc</extension>
     <mime-type>application/msword</mime-type>
    </mime-mapping>

    <mime-mapping>
     <extension>xls</extension>
     <mime-type>application/msexcel</mime-type>
    </mime-mapping>

    <mime-mapping>
     <extension>pdf</extension>
     <mime-type>application/pdf</mime-type>
    </mime-mapping>

    <mime-mapping>
     <extension>zip</extension>
     <mime-type>application/zip</mime-type>
    </mime-mapping>

    <mime-mapping>
     <extension>rar</extension>
     <mime-type>application/rar</mime-type>
    </mime-mapping>

    <mime-mapping>
     <extension>txt</extension>
     <mime-type>application/txt</mime-type>
    </mime-mapping>

    <mime-mapping>
     <extension>chm</extension>
     <mime-type>application/mshelp</mime-type>
    </mime-mapping>

    然后重启Tomcat,清空IE临时文件即可.

    展开全文
  • 打开%TOMCAT_HOME%/conf/web.xml 在里面里面增加rar文件的mime映射。然后重启Tomcat,清空IE临时文件即可。 zip application/zip 也可以将其他的类型添加到mime映射中,如: doc application/ms...

    打开%TOMCAT_HOME%/conf/web.xml

    在里面里面增加rar文件的mime映射。然后重启Tomcat,清空IE临时文件即可。

    <mime-mapping>
     <extension>zip</extension>
     <mime-type>application/zip</mime-type>
    </mime-mapping>


    也可以将其他的类型添加到mime映射中,如:


    <mime-mapping>
     <extension>doc</extension>
     <mime-type>application/msword</mime-type>
    </mime-mapping>
    
    <mime-mapping>
     <extension>xls</extension>
     <mime-type>application/msexcel</mime-type>
    </mime-mapping>
    
    
    <mime-mapping>
     <extension>pdf</extension>
     <mime-type>application/pdf</mime-type>
    </mime-mapping>
    
    
    <mime-mapping>
     <extension>zip</extension>
     <mime-type>application/zip</mime-type>
    </mime-mapping>
    
    
    <mime-mapping>
     <extension>rar</extension>
     <mime-type>application/rar</mime-type>
    </mime-mapping>
    
    
    <mime-mapping>
     <extension>txt</extension>
     <mime-type>application/txt</mime-type>
    </mime-mapping>
    
    
    <mime-mapping>
     <extension>chm</extension>
     <mime-type>application/mshelp</mime-type>
    </mime-mapping>

    附(什么是MIME类型):http://baike.baidu.com/view/160611.htm

        什么是MIME类型-在把输出结果传送到浏览器上的时候,浏览器必须启动适当的应用程序来处理这个输出文档。这可以通过多种类型MIME(多功能网际邮件扩充协议)来完成。在HTTP中,MIME类型被定义在Content-Type header中。 

    例如,假设你要传送一个Microsoft Excel文件到客户端。那么这时的MIME类型就是“application/vnd.ms-excel”。在大多数实际情况中,这个文件然后将传送给Execl来处理(假设我们设定Execl为处理特殊MIME类型的应用程序)。在JSP中,设定MIME类型的方法是通过response对象的response.setContentType()方法。

    多媒体文件格式MIME 

       最早的HTTP协议中,并没有附加的数据类型信息,所有传送的数据都被客户程序解释为超文本标记语言HTML 文档,而为了支持多媒体数据类型,HTTP协议中就使用了附加在文档之前的MIME数据类型信息来标识数据类型。 

    MIME意为多目Internet邮件扩展,它设计的最初目的是为了在发送电子邮件时附加多媒体数据,让邮件客户程序能根据其类型进行处理。然而当它被HTTP协议支持之后,它的意义就更为显著了。它使得HTTP传输的不仅是普通的文本,而变得丰富多彩。 

    每个MIME类型由两部分组成,前面是数据的大类别,例如声音audio、图象image等,后面定义具体的种类。 

    常见的MIME类型 

    超文本标记语言文本 .html,.html text/html 
    普通文本 .txt text/plain 
    RTF文本 .rtf application/rtf 
    GIF图形 .gif image/gif 
    JPEG图形 .ipeg,.jpg image/jpeg 
    au声音文件 .au audio/basic 
    MIDI音乐文件 mid,.midi audio/midi,audio/x-midi 
    RealAudio音乐文件 .ra, .ram audio/x-pn-realaudio 
    MPEG文件 .mpg,.mpeg video/mpeg 
    AVI文件 .avi video/x-msvideo 
    GZIP文件 .gz application/x-gzip 
    TAR文件 .tar application/x-tar 

       Internet中有一个专门组织IANA来确认标准的MIME类型,但Internet发展的太快,很多应用程序等不及IANA来确认他们使用的MIME类型为标准类型。因此他们使用在类别中以x-开头的方法标识这个类别还没有成为标准,例如:x-gzip,x-tar等。事实上这些类型运用的很广泛,已经成为了事实标准。只要客户机和服务器共同承认这个MIME类型,即使它是不标准的类型也没有关系,客户程序就能根据MIME类型,采用具体的处理手段来处理数据。而Web服务器和浏览器(包括操作系统)中,缺省都设置了标准的和常见的MIME类型,只有对于不常见的 MIME类型,才需要同时设置服务器和客户浏览器,以进行识别。 

    由于MIME类型与文档的后缀相关,因此服务器使用文档的后缀来区分不同文件的MIME类型,服务器中必须定义文档后缀和MIME类型之间的对应关系。而客户程序从服务器上接收数据的时候,它只是从服务器接受数据流,并不了解文档的名字,因此服务器必须使用附加信息来告诉客户程序数据的MIME类型。服务器在发送真正的数据之前,就要先发送标志数据的MIME类型的信息,这个信息使用Content-type关键字进行定义,例如对于HTML文档,服务器将首先发送以下两行MIME标识信息,这个标识并不是真正的数据文件的一部分。 

    Content-type: text/html 

    注意,第二行为一个空行,这是必须的,使用这个空行的目的是将MIME信息与真正的数据内容分隔开。


    展开全文
  • 打开%TOMCAT_HOME%/conf/web.xml 在里面里面增加rar文件的mime映射就可以了。 也可以将其他的类型添加到mime映射中,如: doc application/msword xls application/msexcel ...
    http://topic.csdn.net/t/20040826/12/3311386.html

    打开%TOMCAT_HOME%/conf/web.xml

    在里面里面增加rar文件的mime映射就可以了。

    也可以将其他的类型添加到mime映射中,如:

    <mime-mapping>
    <extension>doc</extension>
    <mime-type>application/msword</mime-type>
    </mime-mapping>
    <mime-mapping>
    <extension>xls</extension>
    <mime-type>application/msexcel</mime-type>
    </mime-mapping>
    <mime-mapping>
    <extension>pdf</extension>
    <mime-type>application/pdf</mime-type>
    </mime-mapping>
    <mime-mapping>
    <extension>zip</extension>
    <mime-type>application/zip</mime-type>
    </mime-mapping>

    [color=red]<mime-mapping>
    <extension>rar</extension>
    <mime-type>application/octet-stream</mime-type>
    </mime-mapping>[/color]

    <mime-mapping>
    <extension>txt</extension>
    <mime-type>application/txt</mime-type>
    </mime-mapping>
    <mime-mapping>
    <extension>chm</extension>
    <mime-type>application/mshelp</mime-type>
    </mime-mapping>

    然后重启Tomcat,清空IE临时文件即可

    附(什么是MIME类型):

    什么是MIME类型-在把输出结果传送到浏览器上的时候,浏览器必须启动是党的应用程序来处理这个输出文档。这可以通过多种类型MIME(多功能网际邮件扩充协议)来完成。在HTTP中,MIME类型被定义在Content-Type header中。

    例如,架设你要传送一个Microsoft Excel文件到客户端。那么这时的MIME类型就是“application/vnd.ms-excel”。在大多数实际情况中,这个文件然后将传送给Execl来处理(假设我们设定Execl为处理特殊MIME类型的应用程序)。在ASP中,设定MIME类型的方法是通过Response对象的ContentType属性。


    多媒体文件格式MIME

    最早的HTTP协议中,并没有附加的数据类型信息,所有传送的数据都被客户程序解释为超文本标记语言HTML 文档,而为了支持多媒体数据类型,HTTP协议中就使用了附加在文档之前的MIME数据类型信息来标识数据类型。

    MIME意为多目Internet邮件扩展,它设计的最初目的是为了在发送电子邮件时附加多媒体数据,让邮件客户程序能根据其类型进行处理。然而当它被HTTP协议支持之后,它的意义就更为显著了。它使得HTTP传输的不仅是普通的文本,而变得丰富多彩。

    每个MIME类型由两部分组成,前面是数据的大类别,例如声音audio、图象image等,后面定义具体的种类。

    常见的MIME类型

    超文本标记语言文本 .html,.html text/html
    普通文本 .txt text/plain
    RTF文本 .rtf application/rtf
    GIF图形 .gif image/gif
    JPEG图形 .ipeg,.jpg image/jpeg
    au声音文件 .au audio/basic
    MIDI音乐文件 mid,.midi audio/midi,audio/x-midi
    RealAudio音乐文件 .ra, .ram audio/x-pn-realaudio
    MPEG文件 .mpg,.mpeg video/mpeg
    AVI文件 .avi video/x-msvideo
    GZIP文件 .gz application/x-gzip
    TAR文件 .tar application/x-tar

    Internet中有一个专门组织IANA来确认标准的MIME类型,但Internet发展的太快,很多应用程序等不及IANA来确认他们使用的MIME类型为标准类型。因此他们使用在类别中以x-开头的方法标识这个类别还没有成为标准,例如:x-gzip,x-tar等。事实上这些类型运用的很广泛,已经成为了事实标准。只要客户机和服务器共同承认这个MIME类型,即使它是不标准的类型也没有关系,客户程序就能根据MIME类型,采用具体的处理手段来处理数据。而Web服务器和浏览器(包括操作系统)中,缺省都设置了标准的和常见的MIME类型,只有对于不常见的 MIME类型,才需要同时设置服务器和客户浏览器,以进行识别。

    由于MIME类型与文档的后缀相关,因此服务器使用文档的后缀来区分不同文件的MIME类型,服务器中必须定义文档后缀和MIME类型之间的对应关系。而客户程序从服务器上接收数据的时候,它只是从服务器接受数据流,并不了解文档的名字,因此服务器必须使用附加信息来告诉客户程序数据的MIME类型。服务器在发送真正的数据之前,就要先发送标志数据的MIME类型的信息,这个信息使用Content-type关键字进行定义,例如对于HTML文档,服务器将首先发送以下两行MIME标识信息,这个标识并不是真正的数据文件的一部分。

    Content-type: text/html

    注意,第二行为一个空行,这是必须的,使用这个空行的目的是将MIME信息与真正的数据内容分隔开。


    [color=red]也可以把
    <mime-mapping>
    <extension>rar</extension>
    <mime-type>application/octet-stream</mime-type>
    </mime-mapping>
    放到项目中的web.xml中
    [/color]
    展开全文
  • In a word, MyCAT is a fresh new middleware of database. Mycat’s target is to smoothly migrate the current stand-alone database and applications to cloud side with low cost and to solve the bottle...
  • asp.net知识库

    2015-06-18 08:45:45
    技术基础 New Folder 多样式星期名字转换 [Design, C#] .NET关于string转换的一个小Bug Regular Expressions 完整的在.net后台执行javascript脚本...Serialize Your Deck with Positron [XML Serialization, XSD, C#]...
  • UltraEdit-32

    热门讨论 2008-12-11 18:22:00
    - Word wrap enhancement to bind trailing space with preceeding word - Fixed cursor pos of trim trailing spaces when cursor is in trailing spaces - Fixed crash involving undo and find/replace - ...
  • 2.1 从性能测试到LoadRunner的映射 35 2.2 LoadRunner工作原理 38 2.3 安装LoadRunner 41 2.4 揭开License的神秘面纱 42 第3章 走近LoadRunner 44 3.1 LoadRunner的运行原理 45 3.1.1 LoadRunner三大高手 45 3.1.2 ...
  • 创建发送者和映射消息。发送消息,同时对文本进行少量修改,发送end-of-messages消息,最后关闭连接。 Tcp服务端与客户端的JAVA实例源代码 2个目标文件 摘要:Java源码,文件操作,TCP,服务器 Tcp服务端与客户端的JAVA...
  • JAVA上百实例源码以及开源项目

    千次下载 热门讨论 2016-01-03 17:37:40
    创建发送者和映射消息。发送消息,同时对文本进行少量修改,发送end-of-messages消息,最后关闭连接。 Tcp服务端与客户端的JAVA实例源代码 2个目标文件 摘要:Java源码,文件操作,TCP,服务器  Tcp服务端与客户端的...
  • vc++ 应用源码包_1

    热门讨论 2012-09-15 14:22:12
    实例使用了加载类似xml文件读取信息,然后显示。 COM_ATL_Tutorial 简单的atl控件演示 COM接口挂钩及其应用 如题。 CSkinSlier CSliderCtrl自绘 Cursor 生成图标,运行到鼠标图标。 cutscene win32下实现视频...
  • vc++ 应用源码包_2

    热门讨论 2012-09-15 14:27:40
    实例使用了加载类似xml文件读取信息,然后显示。 COM_ATL_Tutorial 简单的atl控件演示 COM接口挂钩及其应用 如题。 CSkinSlier CSliderCtrl自绘 Cursor 生成图标,运行到鼠标图标。 cutscene win32下实现视频...
  • vc++ 应用源码包_6

    热门讨论 2012-09-15 14:59:46
    实例使用了加载类似xml文件读取信息,然后显示。 COM_ATL_Tutorial 简单的atl控件演示 COM接口挂钩及其应用 如题。 CSkinSlier CSliderCtrl自绘 Cursor 生成图标,运行到鼠标图标。 cutscene win32下实现视频...
  • vc++ 应用源码包_5

    热门讨论 2012-09-15 14:45:16
    实例使用了加载类似xml文件读取信息,然后显示。 COM_ATL_Tutorial 简单的atl控件演示 COM接口挂钩及其应用 如题。 CSkinSlier CSliderCtrl自绘 Cursor 生成图标,运行到鼠标图标。 cutscene win32下实现视频...
  • vc++ 应用源码包_4

    热门讨论 2012-09-15 14:38:35
    实例使用了加载类似xml文件读取信息,然后显示。 COM_ATL_Tutorial 简单的atl控件演示 COM接口挂钩及其应用 如题。 CSkinSlier CSliderCtrl自绘 Cursor 生成图标,运行到鼠标图标。 cutscene win32下实现视频...
  • vc++ 应用源码包_3

    热门讨论 2012-09-15 14:33:15
    实例使用了加载类似xml文件读取信息,然后显示。 COM_ATL_Tutorial 简单的atl控件演示 COM接口挂钩及其应用 如题。 CSkinSlier CSliderCtrl自绘 Cursor 生成图标,运行到鼠标图标。 cutscene win32下实现视频...
  • vc++ 开发实例源码包

    2014-12-16 11:25:17
    代码用了备份dll的方法,因此在自定义的函数中可以直接调用在内存中备份的dll代码,而不需要再把函数头部改来改去。 IOCP反弹远控客户端模型,外加上线服务端,全部代码注释! 如题。这个是IOCP远程控制软件的...
  • 实例080 将XML文件节点绑定到TreeView控件中 106 2.8 DataGridView控件应用 108 实例081 DataGridView控件的分页功能 108 实例082 从DataGridView控件拖放数据至TreeView控件 113 实例083 在DataGridView控件中实现...
  • C#程序开发范例宝典(第2版).part02

    热门讨论 2012-11-12 07:55:11
    实例080 将XML文件节点绑定到TreeView控件中 106 2.8 DataGridView控件应用 108 实例081 DataGridView控件的分页功能 108 实例082 从DataGridView控件拖放数据至TreeView控件 113 实例083 在DataGridView控件中...
  • C#程序开发范例宝典(第2版).part13

    热门讨论 2012-11-12 20:17:14
    实例080 将XML文件节点绑定到TreeView控件中 106 2.8 DataGridView控件应用 108 实例081 DataGridView控件的分页功能 108 实例082 从DataGridView控件拖放数据至TreeView控件 113 实例083 在DataGridView控件中...
  • 实例080 将XML文件节点绑定到TreeView控件中 106 2.8 DataGridView控件应用 108 实例081 DataGridView控件的分页功能 108 实例082 从DataGridView控件拖放数据至TreeView控件 113 实例083 在DataGridView控件中...
  • 实例080 将XML文件节点绑定到TreeView控件中 106 2.8 DataGridView控件应用 108 实例081 DataGridView控件的分页功能 108 实例082 从DataGridView控件拖放数据至TreeView控件 113 实例083 在DataGridView控件中...
  • 实例080 将XML文件节点绑定到TreeView控件中 106 2.8 DataGridView控件应用 108 实例081 DataGridView控件的分页功能 108 实例082 从DataGridView控件拖放数据至TreeView控件 113 实例083 在DataGridView控件中...
  • 实例080 将XML文件节点绑定到TreeView控件中 106 2.8 DataGridView控件应用 108 实例081 DataGridView控件的分页功能 108 实例082 从DataGridView控件拖放数据至TreeView控件 113 实例083 在DataGridView控件中...

空空如也

空空如也

1 2 3 4
收藏数 63
精华内容 25
关键字:

word里xml映射