精华内容
下载资源
问答
  • NLTK wordnet.zip

    2019-12-01 20:43:28
    id: wordnet; size: 10775600; author: ; copyright: WordNet 3.0 Copyright 2006 by Princeton University. All rights reserved.; license: Permission to use, copy, modify and distribute this software and ...
  • WordNet-WN18

    2019-03-12 14:35:52
    数据集WN18是WordNet的子集,包含18种关系和40k种实体。训练集中包含141,442条三元组,验证集中包含2,500条三元组,测试集中包含2,500条三元组。
  • NLTK在anaconda中有,WordNet语料库需要手动下载。这里主要介绍如何下载wordnet语料库。。。 In [1]: from nltk.corpus import wordnet as wn In [2]: wn.syssets('love') Traceback (most recent call ...



    NLTK在anaconda中有,WordNet语料库需要手动下载。这里主要介绍如何下载wordnet语料库。。。


    In [1]: from nltk.corpus import wordnet as wn
    
    In [2]: wn.syssets('love')
    Traceback (most recent call last):
    
      File "<ipython-input-2-dda9a665adaa>", line 1, in <module>
        wn.syssets('love')
    
      File "d:\Anaconda\lib\site-packages\nltk\corpus\util.py", line 99, in __getattr__
        self.__load()
    
      File "d:\Anaconda\lib\site-packages\nltk\corpus\util.py", line 64, in __load
        except LookupError: raise e
    
    LookupError: 
    **********************************************************************
      Resource u'corpora/wordnet' not found.  Please use the NLTK
      Downloader to obtain the resource:  >>> nltk.download()
      Searched in:
        - 'C:\\Users\\mmc/nltk_data'
        - 'C:\\nltk_data'
        - 'D:\\nltk_data'
        - 'E:\\nltk_data'
        - 'd:\\Anaconda\\nltk_data'
        - 'd:\\Anaconda\\lib\\nltk_data'
        - 'C:\\Users\\mmc\\AppData\\Roaming\\nltk_data'
    **********************************************************************



    解决方法:

    In [3]: import nltk
    
    In [4]: nltk.download()
    出现下面的图形界面:

    注意,选择第二个选项卡“Corpora”,滑到下面选择和wordnet相关的两个语料库,否则你就等着他慢慢下载吧。。。。。





    参考文章,感谢他们:

    NLTK:http://www.nltk.org/

    WordNet:http://wordnet.princeton.edu/


    http://www.velvetcache.org/2010/03/01/looking-up-words-in-a-dictionary-using-python

    http://www.tuicool.com/articles/zqIvAr

    http://blog.csdn.net/ictextr9/article/details/4008703

    http://blog.csdn.net/u010454729/article/details/22397255




    WordNet是面向语义的英语词典,类似于传统字典。它是NLTK语料库的一部分,可以被这样调用:

     

    更简洁的写法:

    1 .单词

    查看一个单词的同义词集用synsets(); 它有一个参数pos,可以指定查找的词性。这里得到的同义词集是同义词集的集合,即里面不是单纯的词,是同义词的集合.

    注:

    •  一个synset(同义词集:指意义相同的词条的集合)被一个三元组描述:(单词.词性.序号)。这里的’dog.n.01’指:dog的第一个名词意思;’chase.v.01’指:chase的第一个动词意思
    •  pos可为:NOUN、VERB、ADJ、ADV…

    2 .同义词集

     :一些关系的获得只能通过Lemmas,比如反义词:

    3. Similarity

    synset1.path_similarity(synset2): 是基于上位词层次结构中相互连接的概念之间的最短路径在0-1范围的打分(两者之间没有路径就返回-1)。同义词集与自身比较将返回1


    展开全文
  • Python NLTK WordNet的在线与手动安装方法

    千次阅读 多人点赞 2019-07-18 17:06:46
    WordNet使用前一般需要先下载nltk的corpus import nltk nltk.download() 这样子会弹出如上窗口。,我这里是已经安装好的了,如果第一次运行则是点击左下角的安装。 安装之后可以用以下代码测试wordnet的运行 ...

    nltk是自然语言处理中常用的包,在使用nltk进行处理的时候,会用到WordNet。

    WordNet使用前一般需要先下载nltk的corpus

    import nltk
    nltk.download()

    这样子会弹出如上窗口。,我这里是已经安装好的了,如果第一次运行则是点击左下角的安装。

    安装之后可以用以下代码测试wordnet的运行

    from nltk.corpus import brown
    brown.words()
    #['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]
    

    对于无法正常使用这种方法的同学,有另外一种手动设置词库的方法,就是把别人下载好的词库加进环境路径里面,nltk就可以直接使用到了。

    可以直接下载我的压缩包,里面是词库的全部内容。首先解压到任意一个地方。

    链接:https://pan.baidu.com/s/1maoSDw7MTNQy2VR1zHY1Qg 
    提取码:hqe9 
     

    然后设置环境变量。具体方法是我的电脑-> 属性->高级系统设置->系统属性->环境变量->添加一个NLTK_DATA的变量

    添加完之后,nltk就可以正常使用wordnet了。

     

     

     

    展开全文
  • WordNET 安装

    千次阅读 2013-12-24 13:52:49
    我原本因为是个论文检索什么的,原来是普林斯顿(princeton)大学的一些的教授搞得的一个英语词法数据库(lexical database of English),顿时觉得这玩意好NB,看了一下还有的下载,就下载了一个用用,毕竟不是什么时候...

    缘起

    一直使用有道词典的在线版,对其的英英释义下的WordNET感到好奇,就点进去看了一下。我原本因为是个论文检索什么的,原来是普林斯顿(princeton)大学的一些的教授搞得的一个英语词法数据库(lexical database of English),顿时觉得这玩意好NB,看了一下还有的下载,就下载了一个用用,毕竟不是什么时候都想上网查单词的。

    正文

    系统配置:Ubuntu 12.04 LTS

    安装前提:tcl/tk 包,gcc编译器

    1.前期准备

    • gcc编译器:大多数的Linux发行版都预装的这个软件包的。如果没有装,命令:sudo apt-get install build-essential ,就会将一些基本的编译的工具安装好,包括gcc编译器和libc.so等库
    • 安装tcl/tk包,tcl/tk的网站: http://www.tcl.tk/  安装命令: sudo apt-get install tcl tcl-dev
         备注:这里假设使用的Ubuntu的dpkg安装包工具及其的包装工具(apt-XXX),其他的一些包安装工具诸如yum,rpm不太熟悉,不过命令大体相似,但是依赖项管理不如dpkg那么好用和方便。

    2.正式安装

    如果使用的windows系统,WordNet的下载页面http://wordnet.princeton.edu/wordnet/download/current-version/中有一个WordNet-2.1.exe下载,安装时,双击,next,next大概就可以了。
    如果使用的Linux系统,那就是著名的./configure--make--make install流程了。

    2.1 下载WordNet

        
       (点击上面的tar-gzipped格式的文件或者tar-bzip文件)

    2.2 解压

       使用Archieve图形界面软件解压很简单,也可以使用命令来解压
       tar -xvf WordNet-3.0.tar.gz
       cd WordNet-3.0/

    2.3 正式安装

    ./configure --with-tk=/usr/lib/tk8.5/ --with-tcl=/usr/lib/tcl8.5/

    (备注:

        1.这里的tcl和tk的版本的号可能每个人安装的不同,我安装的8.5(2013.9),现在8.6也可以从官网http://www.tcl.tk/下载

         2.--with-tk=/usr/lib/tk8.5/ --with-tcl=/usr/lib/tcl8.5/必须要有,否则就会出现 configure: WARNING: Can't find Tcl configuration 和configure: WARNING: Can't find Tk configuration。 这也是我最初安装时出现的问题。

    输出结果:

    checking for gcc... gcc
    checking for C compiler default output file name... a.out
    checking whether the C compiler works... yes
    checking whether we are cross compiling... no
    checking for suffix of executables... 
    checking for suffix of object files... o
    checking whether we are using the GNU C compiler... yes
    checking whether gcc accepts -g... yes
    checking for gcc option to accept ANSI C... none needed
    checking for ranlib... ranlib
    checking for a BSD-compatible install... /usr/bin/install -c
    checking how to run the C preprocessor... gcc -E
    checking for egrep... grep -E
    checking for ANSI C header files... yes
    checking for sys/types.h... yes
    checking for sys/stat.h... yes
    checking for stdlib.h... yes
    checking for string.h... yes
    checking for memory.h... yes
    checking for strings.h... yes
    checking for inttypes.h... yes
    checking for stdint.h... yes
    checking for unistd.h... yes
    checking locale.h usability... yes
    checking locale.h presence... yes
    checking for locale.h... yes
    checking malloc.h usability... yes
    checking malloc.h presence... yes
    checking for malloc.h... yes
    checking for stdlib.h... (cached) yes
    checking for string.h... (cached) yes
    checking for stdlib.h... (cached) yes
    checking for GNU libc compatible malloc... yes
    checking for strchr... yes
    checking for strdup... yes
    checking for strrchr... yes
    checking for strstr... yes
    checking for strtol... yes
    checking for nl_langinfo and CODESET... yes
    checking whether build environment is sane... yes
    checking for gawk... gawk
    checking whether make sets $(MAKE)... yes
    checking for style of include used by make... GNU
    checking dependency style of gcc... gcc3
    checking for Tcl configuration... found /usr/lib/tcl8.5/tclConfig.sh
    checking for Tk configuration... configure: WARNING: Can't find Tk configuration definitions
    xiajian@xiajian-pc:~/software/WordNet-3.0$ ./configure --with-tk=/usr/lib/tk8.5/ --with-tcl=/usr/lib/tcl8.5/
    checking for gcc... gcc
    checking for C compiler default output file name... a.out
    checking whether the C compiler works... yes
    checking whether we are cross compiling... no
    checking for suffix of executables... 
    checking for suffix of object files... o
    checking whether we are using the GNU C compiler... yes
    checking whether gcc accepts -g... yes
    checking for gcc option to accept ANSI C... none needed
    checking for ranlib... ranlib
    checking for a BSD-compatible install... /usr/bin/install -c
    checking how to run the C preprocessor... gcc -E
    checking for egrep... grep -E
    checking for ANSI C header files... yes
    checking for sys/types.h... yes
    checking for sys/stat.h... yes
    checking for stdlib.h... yes
    checking for string.h... yes
    checking for memory.h... yes
    checking for strings.h... yes
    checking for inttypes.h... yes
    checking for stdint.h... yes
    checking for unistd.h... yes
    checking locale.h usability... yes
    checking locale.h presence... yes
    checking for locale.h... yes
    checking malloc.h usability... yes
    checking malloc.h presence... yes
    checking for malloc.h... yes
    checking for stdlib.h... (cached) yes
    checking for string.h... (cached) yes
    checking for stdlib.h... (cached) yes
    checking for GNU libc compatible malloc... yes
    checking for strchr... yes
    checking for strdup... yes
    checking for strrchr... yes
    checking for strstr... yes
    checking for strtol... yes
    checking for nl_langinfo and CODESET... yes
    checking whether build environment is sane... yes
    checking for gawk... gawk
    checking whether make sets $(MAKE)... yes
    checking for style of include used by make... GNU
    checking dependency style of gcc... gcc3
    checking for Tcl configuration... found /usr/lib/tcl8.5/tclConfig.sh
    checking for Tk configuration... found /usr/lib/tk8.5/tkConfig.sh
    checking for existence of /usr/lib/tcl8.5/tclConfig.sh... loading
    checking for existence of /usr/lib/tk8.5/tkConfig.sh... loading
    configure: creating ./config.status
    config.status: creating Makefile
    config.status: creating dict/Makefile
    config.status: creating doc/Makefile
    config.status: creating doc/html/Makefile
    config.status: creating doc/man/Makefile
    config.status: creating doc/pdf/Makefile
    config.status: creating doc/ps/Makefile
    config.status: creating include/Makefile
    config.status: creating include/tk/Makefile
    config.status: creating src/Makefile
    config.status: creating lib/Makefile
    config.status: creating lib/wnres/Makefile
    config.status: creating config.h
    config.status: executing depfiles commands
    config.status: executing default commands
    
    WordNet is now configured
    
      Installation directory:               /usr/local/WordNet-3.0
    
      To build and install WordNet:
    
        make
        make install
    
      To run, environment variables should be set as follows:
    
        PATH - include ${exec_prefix}/bin
        WNHOME - if not using default installation location, set to /usr/local/WordNet-3.0
    
        See INSTALL file for details and additional environment variables
        which may need to be set on your system.
    
    (仔细看上面的最后的一段关于安装的描述,如果不想将WordNet安装在默认的目录时,需要设置WNHOME变量,如果想直接在commandline中使用需要配置PATH变量,可以考虑在当前用户的主目录下的.bashrc中进行配置)

    make (编译程序)

    make install (安装程序,如果是使用默认安装,需要使用sudo提升权限,不然以普通用户的权限不能向/usr/local目录中写入和复制文件的)

    make uninstall(卸载程序,如果安装时使用了sudo,卸载时也要使用,原因是相同的,权限问题)

    WordNet截图:


    备注:

    • 这里使用时暂时还没有给WordNet配置Path,而是直接到安装目录/usr/local/WordNet-3.0/bin中参考脚本的,这个目录下有三个脚本:

    1. wn 大概是命令行接口
    2. wnb 是上面的图形界面接口,但是在使用时候出现了个问题,./wnb: 3: ./wnb: wishwn: not found  这个问题前几天遇到过得,就是在shell脚本中调用shell脚本的问题,不知道WordNet开发者使用的什么shell解释器,在我的机器上这样是不能执行的。需要将wnb脚本中的第三行的 wishwn "$0" "$@" & 修改为$(pwd)/wishwn "$0" "$@" &。 (事后发现,在PATH中配置路径后不需要修改脚本,而使用./方式运行时需要修改)
    3. wishwn, 功能不明,不过直接执行的话出现的界面是这样的:
             
           (备注:如果你对这些脚本的功能以及tcl/tk的功能感到惊喜的话,那就去研究一下这里的shell的写法和wordnet的源代码吧。毕竟仅仅是脚本就可以做成这样,这就是Linux/Unix的魅力之一)
    • 如果对WordNet的界面感到倒胃口,觉得其几乎没有什么美学可言,一点都不优美,不如网页版的有道词典。好吧,我就是这么想的。可以考虑卸载WordNet, make uninstall. (备注:卸载的时候仅仅将文件删除了,目录没有删除,如果非常介意的话,就自己手动的目录也删了把 rm -r WordNet-3.0/)

    后记

         装好了WordNet,自己又用google搜索了一下WordNet, 发现这个WordNet不简单的,并不只是一个简单的英英释义的词典,而是一个关于认知语言学的单词网络工具,有点类似于语义网络这样的东西。参考2是对WordNet的简介。由于WordNet开发过程中存在过使用prolog实现的过程,参考3中介绍的一些关于prolog与wordnet的主题。参考四中介绍了一些关于WordNet词网的研究。WordNet开发团队出版了一本关于Wordnet及其相关的理论的书《WordNet: An Electronic Lexical Database》,wordnet在线文档的地址:http://wordnet.princeton.edu/wordnet/documentation/ 牛人王垠关于WordNet一些介绍:http://docs.huihoo.com/homepage/shredderyin/wordnet.html

    小结

     1. Linux下源代码安装和卸载软件的流程,tar -xvf xxx-- cd xxx -- ./configure xxxx -- make -- make install -- make uninstall
    2. tcl/tk工具的界面确实不怎么的,很朴素和Java Swing有的一拼。
    3. wordnet是有普林斯顿的人开发的,虽然使用是free的,但是依然是有版权的。
    4. 网页的有道比金山词霸好用,原因是广告少。
    6.很多问题都是可以百度google就解决了的。在现代的信息社会,搜索引擎是最好的良师益友。
    5. 以上,都是废话。

    参考资料

    1.stackflow:http://stackoverflow.com/questions/12820609/wordnet-3-0-installation-issue-on-fedora-17?s=6d8cf725-7ae9-49d2-b93d-06436b14a7c2#new-answer

    2.WordNet:http://blog.csdn.net/wen_2/article/details/13004817 

    3. Prolog与WordNet:http://blog.csdn.net/skiffloveblue/article/details/9359449  

    4.WordNet词网研究:http://blog.csdn.net/skiffloveblue/article/category/1508785

    展开全文
  • 手动下载wordnet语料库,下载地址。其它语料库同样可以在路径:http://www.nltk.org/nltk_data/ 中找到。 将下载好的包解压后放在nltk可以找到的位置【这个位置就是第一幅图中的Searched in :中的路径】 最后得到的...

    在这里插入图片描述
    在这里插入图片描述
    方法
    手动下载wordnet语料库,下载地址。其它语料库同样可以在路径:http://www.nltk.org/nltk_data/ 中找到。
    将下载好的包解压后放在nltk可以找到的位置【这个位置就是第一幅图中的Searched in :中的路径】
    最后得到的路径(在linux下)是/home/lawson/nltk_data/corpora/wordnet,这个目录下就是具体的文件了; 如果是在windows下,那么得到的路径就是C:\nltk_data\corpora\wordnet
    效果
    在这里插入图片描述

    原文链接:https://blog.csdn.net/liu16659/article/details/109691534

    展开全文
  • wordnet20词库

    2018-10-15 19:24:15
    wordnet20词库
  • 主要关注中文的对应英文,一词多...#下载open multilingual wordnet语料 import nltk nltk.download("wordnet") nltk.download("wordnet_ic") nltk.download('omw') from nltk.corpus import wordnet as wn #wor
  • 3.8k实体,11个关系的知识图谱数据
  • NLTK wordnet_ic.zip

    2019-12-02 09:38:57
    WordNet-InfoContent id: wordnet_ic; size: 12056682; author: ; copyright: ; license: ;
  • 使用nltk.download('wordnet')下载不下来要用的包,导致代码加载资源错误 解决 离线下载NLTK Data github:nltk_data 将解压文件后得到的packages文件夹 目录下面的所有文件(防止再少什么文件报错) 按照下图...
  • 这是一个模块,提供许可,包含 163K 字,包含 [English WordNet 2020 ( ) 的动态下载的数据文件],它基于来自 ,以及相应的 SQLite 数据库文件,使用模块即时生成。 安装 $ npm install wordnet-lmf wordnet-lmf-en ...
  • 最开始执行代码的时候连数据集都没下载,后来数据集下载好了可是依旧有下面错误。 补充该库作用:词干提取 【什么是词干提取?】 在语言形态学和信息检索里,词干提取是去除词缀得到词根的过程─—得到单词最...
  • 在https://pip.pypa.io/en/stable/installing/ 下载get-pip.py 然后执行python get-pip.py 将自动安装pip nltk是python的一个扩展包,提供自然语言处理工具集 安装nltk sudopipinstall-Unltk import nltk ...
  • wordnet字典

    2011-12-24 11:33:24
    世界上最全的英文本体字典,通过语义扩展和英文联想,能够查到相关词汇。类似于英英翻译。
  • wordnet2.1

    2014-10-29 13:06:18
    官网下载,亲测可用,可以结合教程实现,解压后再下载一个JWNL配合使用
  • WordNet使用方法

    千次阅读 2012-12-18 20:52:38
    WordNet中有词语的各种信息,定义、同义、上位、下位、实例、包含等等关系的词集,通过调用相应方法可一一获取,然后进行同义词计算、类别划分等操作。源码的main()函数在wn.c文件中。注意:若在windows环境下调用...
  • 中文版wordnet

    热门讨论 2011-07-02 18:27:01
    以前做项目时看过个,可惜后来还是没怎么用上。从官网上下载的,只有32个表,好像内容并不全。献给有需要的人。
  • nltk离线下载文件

    2021-03-09 16:14:25
    NLTK离线下载文件,解压后可使用分词、停用词、词性标注和词形还原、wordnet等功能,NLTK安装可参考https://blog.csdn.net/herosunly/article/details/105017811中的0. 如何离线安装NLTK
  • WordNet嵌入 wnet2vec 文章 ...本文中提到的使用运行6万个单词的最佳wnet2vec模型,可在下载。 如何运行wn2vec软件 要将输入文件提供给软件,必须存在以下结构: |-- main.py |-- data | |-- input
  • 简介 笔者当初为了学习JAVA,收集了很多经典源码,源码难易程度分为初级、中级、高级等,详情看源码列表,需要的可以直接下载! 这些源码反映了那时那景笔者对未来的盲目,对代码的热情、执着,对IT的憧憬、向往!...
  • 如何使用wordnet

    2021-05-31 22:54:27
    WordNet是包含了语义信息英语词典。 wordnet根据词条的语义分组,相同语义的词条组合在一起称为synset(同义词集),一个一词多义的词将出现在它的每个语义对应的同义词集中 wordnet为每一个synset提供了简短,概要...
  • WordNet Similarity 词语相似度

    热门讨论 2012-05-29 15:24:10
    WordNet Similarity 词语相似度 提供了多种计算方式
  • WordNet中采用语义网络作为词汇本体表达的基本方式,利用同义词集合(synonymy set)而不是词形(word form)来组织词汇。
  • nltk下载出现问题

    2020-12-03 15:52:32
    nltk下载出现问题 今天继续项目三,由于需要做一个英文的关键词提取,所以需要用到nltk的库文件。 from nltk.stem import WordNetLemmatizer # 使用WordNetLemmatizer类,即wordnet词形还原方法 def Lemmatization_...
  • 新词网 是英语的开源词汇数据库。...使用getAndCreateNeoWn函数下载所需的数据库文件并一次创建一个Wordnet图形。 该函数返回一个graph对象,该对象可以与Nicole White的RNeo4j包(与neoWordNet一起提供)一起使
  • 这是一个模块,包含许可、156K 字,包含从即时下载的数据文件,位于精简信息集 (RIS 的 ) 格式,使用模块即时生成。 安装 $ npm install wordnet-ris wordnet-ris-en 用法 ( async ( ) => { const RIS = require ...
  • 所以,暂时先不考虑相似度的计算,把WordNet下载下来再说。  参考 https://wordnet.princeton.edu/download 。顺利地下载,安装以及跑demo。  之后,一起来看一下WordNet的文件结构:    bin目录下...
  • 最近在中文语料上数据分析,想借用一些外部资源,就想到了WordNet,在这里记录一下,以备后用。 文章目录(一)WordNet的介绍(二)WordNet的安装(三)中英文WordNet的使用(1)词义查询(2) 同义词查询(3) 其他...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,860
精华内容 744
关键字:

wordnet下载