精华内容
下载资源
问答
  • 自然语言处理理论书籍很多,讲实际操作的不多,能讲的这么系统的更少。Python语言在做NLP方面有较明显的优势。之前国外有《Natural Language Process with Python》,国内热心网友将其翻译为中文版。从这个角度讲,...

    自然语言处理理论书籍很多,讲实际操作的不多,能讲的这么系统的更少。Python语言在做NLP方面有较明显的优势。之前国外有《Natural Language Process with Python》,国内热心网友将其翻译为中文版。从这个角度讲,本书是目前世界上最好的自然语言处理实践教程。初学者若在看过理论之后能精读本书,必定会有获益。这也是翻译本书的目的之一。通过使用Python程序设计语言和自然语言工具包(NTLK)的开源库,本书将帮助你增加自然语言处理的实际经验。如果你对开发Web应用、分析多语言的新闻源或编制濒危语言感兴趣,或者只是想要从程序员的视角看人类语言如何运作,你将发现本书不仅有趣而且极其有用。

    python自然语言处理目录

    第1章 语言处理与Python

    1.1 语言计算:文本和词汇

    1.2 近观Python:将文本当做词链表

    1.3 计算语言:简单的统计

    1.4 回到Python:决策与控制

    1.5 自动理解自然语言

    1.6 小结

    1.7 深入阅读

    1.8 练习

    第2章 获得文本语料和词汇资源

    2.1 获取文本语料库

    2.2 条件频率分布

    2.3 更多关于Python:代码重用

    2.4 词典资源

    2.5 WordNet

    2.6 小结

    2.7 深入阅读

    2.8 练习

    第3章 处理原始文本

    3.1 从网络和硬盘访问文本

    3.2 字符串:最底层的文本处理

    3.3 使用Unicode进行文字处理

    3.4 使用正则表达式检测词组搭配

    3.5 正则表达式的有益应用

    3.6 规范化文本

    3.7 用正则表达式为文本分词

    3.8 分割

    3.9 格式化:从链表到字符串

    3.10 小结

    3.11 深入阅读

    3.12 练习

    第4章 编写结构化程序

    4.1 回到基础

    4.2 序列

    4.3 风格的问题

    4.4 函数:结构化编程的基础

    4.5 更多关于函数

    4.6 程序开发

    4.7 算法设计

    4.8 Python库的样例

    4.9 小结

    4.10 深入阅读

    4.11 练习

    第5章 分类和标注词汇

    5.1 使用词性标注器

    5.2 标注语料库

    5.3 使用Python字典映射词及其属性

    5.4 自动标注

    5.5 N-gram标注

    5.6 基于转换的标注

    5.7 如何确定一个词的分类

    5.8 小结

    5.9 深入阅读

    5.10 练习

    第6章 学习分类文本

    6.1 监督式分类

    6.2 监督式分类的举例

    6.3 评估

    6.4 决策树

    6.5 朴素贝叶斯分类器

    6.6 最大熵分类器

    6.7 为语言模式建模

    6.8 小结

    6.9 深入阅读

    6.10 练习

    第7章 从文本提取信息

    7.1 信息提取

    7.2 分块

    7.3 开发和评估分块器

    7.4 语言结构中的递归

    7.5 命名实体识别

    7.6 关系抽取

    7.7 小结

    7.8 深入阅读

    7.9 练习

    第8章 分析句子结构

    8.1 一些语法困境

    8.2 文法的用途

    8.3 上下文无关文法

    8.4 上下文无关文法分析

    8.5 依存关系和依存文法

    8.6 文法开发

    8.7 小结

    8.8 深入阅读

    8.9 练习

    第9章 建立基于特征的文法

    9.1 文法特征

    9.2 处理特征结构

    9.3 扩展基于特征的文法

    9.4 小结

    9.5 深入阅读

    9.6 练习

    第10章 分析语句的含义

    10.1 自然语言理解

    10.2 命题逻辑

    10.3 一阶逻辑

    10.4 英语语句的语义

    10.5 段落语义层

    10.6 小结

    10.7 深入阅读

    10.8 练习

    第11章 语言数据管理

    11.1 语料库结构:案例研究

    11.2 语料库生命周期

    11.3 数据采集

    11.4 使用XML

    11.5 使用Toolbox数据

    11.6 使用OLAC元数据描述语言资源

    11.7 小结

    11.8 深入阅读

    11.9 练习

    PC官方版

    安卓官方手机版

    IOS官方手机版

    展开全文
  • 国内纯中文自然语言处理书籍只有理论方面的,却在实战方面比较空缺。 而我们的达人课《中文自然语言处理入门》专门应对这些困境: 21 节精品内容带你边学边实战 6 个极简案例快速掌握基本能力 9 步制作自己的...

    限时活动 | 入行 AI 必看《中文自然语言处理入门》

    作为 AI 初学者,我们时常面临这样的尴尬:

    • 市面上自然语言处理内容大抵为英文;
    • 中文的处理比英文复杂的多,网上的相关资料少之又少;
    • 国内纯中文自然语言处理书籍只有理论方面的,却在实战方面比较空缺。

    而我们的达人课《中文自然语言处理入门》专门应对这些困境:

    • 21 节精品内容带你边学边实战
    • 6 个极简案例快速掌握基本能力
    • 9 步制作自己的中文聊天机器人
    • Neo4j 从入门到构建知识图谱
    原价 39 元,限时促销,只要3.99!!!
    赶快扫码领取你的专属学习福利带你重新认识 NLP!
    展开全文
  • 收集五本自然语言处理经典书籍电子书:Neural Networks and Deep Learning by Michael Nielsen;PYTHON自然语言处理中文翻译;Speech and Language Processing;统计自然语言处理;统计自然语言处理基础(中文版 带...
  • PYTHON自然语言处理中文,不错的书籍,分享给大家
  • 用python学习自然语言处理的经典书籍
  • python自然语言处理的pdf书籍,学习NLP的好帮手,有书签,书籍清晰
  • 这里汇总整理了18本自然语言处理与计算语言学的相关书籍介绍,按国外书籍(1~4),国内书籍(5~18),其中国内书籍又按自然语言处理(5~9),计算语言学(10~13),中文信息处理(14~17),文选(18)顺序整理,如果...

    这里汇总整理了18本自然语言处理与计算语言学的相关书籍介绍,按国外书籍(1~4),国内书籍(5~18),其中国内书籍又按自然语言处理(5~9),计算语言学(10~13),中文信息处理(14~17),文选(18)顺序整理,如果有遗漏,欢迎补充!

    1、 Speech and Language Processing
    a) 作者: Daniel Jurafsky / James H. Martin
    b) 副标题: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition
    c) ISBN: 9780130950697
    d) 定价: USD 97.00
    e) 出版社: Prentice Hall
    f) 装帧: Paperback
    g) 第一版出版年: 2000-01-26;第二版出版年:2006
    h) 相关网站:http://www.cs.colorado.edu/~martin/slp.html
    i) 英文简介:This book takes an empirical approach to language processing, based on applying statistical and other machine-learning algorithms to large corpora.Methodology boxes are included in each chapter. Each chapter is built around one or more worked examples to demonstrate the main idea of the chapter. Covers the fundamental algorithms of various fields, whether originally proposed for spoken or written language to demonstrate how the same algorithm can be used for speech recognition and word-sense disambiguation. Emphasis on web and other practical applications. Emphasis on scientific evaluation. Useful as a reference for professionals in any of the areas of speech and language processing.
    j) 中文译名:自然语言处理综论
    k) 译者: 冯志伟 / 孙乐
    l) ISBN: 9787121007767
    m) 页数: 588 页
    n) 出版社: 电子工业出版社
    o) 定价: 78.0
    p) 装帧: 平装
    q) 出版年: 2005
    r) 中文简介:本书是一本全面系统地讲述计算机自然语言处理的优秀教材。本书英文版出版之后好评如潮,国外许多著名大学纷纷把本书选为自然语言处理和计算语言学课程的主要教材,该书被誉为该领域教材的“黄金标准”。本书包含的内容十分丰富,分为四个部分,共21章,深入细致地探讨了计算机处理自然语言的词汇、句法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。从层次的角度看,本书的论述是按照自然语言的不同层面逐步展开的,首先论述单词的自动形态分析,接着论述自动句法分析,然后论述各种语言单位的自动语义分析,最后论述连贯文本的自动分析、对话与会话的智能代理以及自然语言生成。从技术的角度看,本书介绍了正则表达式、有限状态自动机、文本- 语音转换、发音与拼写的概率模型、词类自动标注、N元语法、隐马尔可夫模型、上下文无关语法、特征与合一、词汇化剖析与概率剖析、一阶谓词演算、词义排歧、修辞结构理论、机器翻译等非常广泛的内容。本书具有“覆盖全面、注重实用、强调评测、语料为本”四大特色。在本书的配套网站上,还提供了相关的资源和工具,便于读者在实践中进一步提高。

    2、 Foundations of Statistical Natural Language Processing
    a) 作者: Christopher D. Manning / Hinrich Schuetze
    b) ISBN: 9780262133609
    c) 页数: 680
    d) 定价: USD 82.00
    e) 出版社: The MIT Press
    f) 装帧: Hardcover
    g) 出版年: 1999-06-18
    h) 相关网站:http://nlp.stanford.edu/fsnlp/
    i) 英文简介:Statistical approaches to processing natural language text have become dominant in recent years. This foundational text is the first comprehensive introduction to statistical natural language processing (NLP) to appear. The book contains all the theory and algorithms needed for building NLP tools. It provides broad but rigorous coverage of mathematical and linguistic foundations, as well as detailed discussion of statistical methods, allowing students and researchers to construct their own implementations. The book covers collocation finding, word sense disambiguation, probabilistic parsing, information retrieval, and other applications.
    j) 中文译名:统计自然语言处理基础
    k) 译者: 苑春法
    l) ISBN: 9787505399211
    m) 页数: 418
    n) 出版社: 电子工业出版社
    o) 定价: 55.0
    p) 装帧: 平装
    q) 出版年: 2005-1-1
    r) 中文简介:近年来,自然语言处理中的统计学方法已经逐渐成为主流。本书是一本全面系统地介绍统计自然语言处理技术的专著,被国内外许多所著名大学选为计算语言学相关课程的教材。本书涵盖的内容十分广泛,分为四个部分,共16章,包括了构建自然语言处理软件工具将用到的几乎所有理论和算法。全书的论述过程由浅入深,从数学基础到精确的理论算法,从简单的词法分析到复杂的语法分析,适合不同水平的读者群的需求。同时,本书将理论与实践紧密联系在一起,在介绍理论知识的基础上给出了自然语言处理技术的高层应用(如信息检索等)。在本书的配套网站上提供了许多相关资源和工具,便于读者结合书中习题,在实践中获得提高。

    3、 Natural Language Understanding (2nd Edition)
    a) 作者: James Allen
    b) ISBN: 9780805303346
    c) 定价: USD 66.00
    d) 出版社: Addison Wesley
    e) 装帧: Paperback
    f) 出版年: 1994-08-03
    g) 英文简介:From a leading authority in artificial intelligence, this book delivers a synthesis of the major modern techniques and the most current research in natural language processing. The approach is unique in its coverage of semantic interpretation and discourse alongside the foundational material in syntactic processing.
    h) 中文译名:自然语言理解
    i) 译者: 刘群
    j) ISBN: 9787121007552
    k) 页数: 508
    l) 定价: 59.0
    m) 出版社: 电子工业出版社
    n) 装帧: 平装
    o) 出版年: 2005-01-01
    p) 中文简介: 本书是讲授自然语言理解的经典教材。书中全面而深入地介绍了自然语言理解领域中使用的理论和技术,共分为句法处理、语义解释和上下文与世界知识三大部分。具体探讨了上下文无关文法、 chart句法分析器、转移网络形式体系、逻辑形式语言、知识表示、篇章结构和语用推理以及会话agent等多方面的内容。本书理论与实践并重,阐述清晰,简明易懂。世界多所院校采用本书作为自然语言理解的教材。对本领域的研究人员而言,本书也是一本优秀的参考书。

    4、 Statistical Language Learning
    a) 作者: Charniak, Eugene
    b) ISBN: 9780262531412
    c) 定价: $22.00
    d) 出版社: The MIT Press
    e) 出版年:1996年9月1日
    f) 英文简介:Eugene Charniak breaks new ground in artificial intelligence research by presenting statistical language processing from an artificial intelligence point of view in a text for researchers and scientists with a traditional computer science background. New, exacting empirical methods are needed to break the deadlock in such areas of artificial intelligence as robotics, knowledge representation, machine learning, machine translation, and natural language processing (NLP). It is time, Charniak observes, to switch paradigms. This text introduces statistical language processing techniques -- word tagging, parsing with probabilistic context free grammars, grammar induction, syntactic disambiguation, semantic word classes, word-sense disambiguation -- along with the underlying mathematics and chapter exercises. Charniak points out that as a method of attacking NLP problems, the statistical approach has several advantages. It is grounded in real text and therefore promises to produce usable results, and it offers an obvious way to approach learning: "one simply gathers statistics." Language, Speech, and Communication

    卓越网:自然语言处理书籍
    当当网:自然语言处理书籍

    注:转载请注明出处“我爱自然语言处理”:www.52nlp.cn

    本文链接地址:
    http://www.52nlp.cn/natural-language-processing-and-computational-linguistics-books-summary-one-foreign-book/

    转载于:https://www.cnblogs.com/syw429326339/archive/2012/12/04/2801571.html

    展开全文
  • python 自然语言处理中文版 本书是一本实用的介绍 NLP 的书。你将通过例子来学习,编写真正的程序,体会到能 够通过实践验证自己想法的价值。如果你没有学过编程,本书将教你如何编程。与其他编程 书籍不同的是,...
  • 这是Python做自然语言处理的很好的书籍,翻译者不是本人,在这里感谢作者的辛勤翻译,希望大家好好利用学习资源!
  • Python自然语言处理(中文版)pdf电子书籍
  • python自然语言处理

    2017-09-21 23:14:12
    PYTHON自然语言处理中文版 主要讲述了利用python语言进行自然语言处理的过程 包含大量代码的实践类书籍 PYTHON自然语言处理中文版 主要讲述了利用python语言进行自然语言处理的过程 包含大量代码的实践类书籍
  • 自然语言处理理论书籍很多,讲实际操作的不多,能讲的这么系统的更少。从这个角度 讲,本书是目前世界上最好的自然语言处理实践教程。初学者若在看过理论之后能精读本书, 必定会有获益。这也是翻译本书的目的之一。
  • Natural Language Proccessing...自然语言处理理论书籍很多,讲实际操作的不多,能讲的这么系统的更少。从这个角度 讲, 书是目前世界上最好的自然语言处理实践教程。初学者若在看过理论之后能精读 书, 必定会有获益。
  • 商品(书籍、酒店、计算机、牛奶、手机、热水器)等评论数据 from sklearn.model_selection import train_test_split from gensim.models.word2vec import Word2Vec import numpy as np import pandas as pd ...

    1、数据集下载

    商品(书籍、酒店、计算机、牛奶、手机、热水器)等评论数据

    from sklearn.model_selection import train_test_split
    from gensim.models.word2vec import Word2Vec
    import numpy as np
    import pandas as pd
    import jieba
    from sklearn.externals import joblib
    from sklearn.svm import SVC
    

    2、载入数据,做预处理(分词),切分训练集与测试集

    #载入数据,做预处理(分词),切分训练集与测试集
    def load_file_and_preprocessing():
        neg=pd.read_excel('chinese_data/neg.xls',header=None,index=None)
        pos=pd.read_excel('chinese_data/pos.xls',header=None,index=None)
        cw=lambda x:list(jieba.cut(x))
        pos['words']=pos[0].apply(cw)
        neg['words']=neg[0].apply(cw)
        # use 1 for positive sentiment,0 for negative
        y=np.concatenate((np.ones(len(pos)),np.zeros(len(neg))))
        #训练集:测试集=8:2
        x_train,x_test,y_train,y_test=train_test_split(np.concatenate((pos['words'],neg['words'])),y,test_size=0.2)
     
        #NumPy提供了多种文件操作函数方便存取数组内容(npy格式以二进制存储数据的)
        np.save('pre_data/y_train.npy',y_train)
        np.save('pre_data/y_test.npy',y_test)
        return x_train,x_test
    

    3、计算训练集和测试集每条评论数据的向量并存入文件

    #对每个句子的所有词向量取均值,来生成一个句子的vector
    def build_sentence_vector(text,size,w2v_model):
        vec=np.zeros(size).reshape((1,size))
        count=0
        for word in text:
            try:
                vec+=w2v_model[word].reshape((1,size))
                count+=1
            except KeyError:
                continue
        if count!=0:
            vec/=count
        return vec
    
    
    
    #计算词向量
    def get_train_vecs(x_train,x_test):
        n_dim=300 #词向量维度
        #试用Word2Vec建立词向量模型
        w2v_model=Word2Vec(size=n_dim,window=5,sg=0,hs=0,negative=5,min_count=10)
        w2v_model.build_vocab(x_train) #准备模型词汇表
        #在评论训练集上建模
        w2v_model.train(x_train,total_examples=w2v_model.corpus_count,epochs=w2v_model.iter) #训练词向量
     
        #训练集评论向量集合
        train_vecs=np.concatenate([build_sentence_vector(z,n_dim,w2v_model) for z in x_train])
        np.save('pre_data/train_vecs.npy',train_vecs) #将训练集保存到文件中
        print(train_vecs.shape)  #输出训练集的维度
     
        #在测试集上训练
        w2v_model.train(x_test,total_examples=w2v_model.corpus_count,epochs=w2v_model.iter)
        w2v_model.save('pre_data/w2v_model/w2v_model.pkl')
        test_vecs=np.concatenate([build_sentence_vector(z,n_dim,w2v_model) for z in x_test])
        np.save('pre_data/test_vecs.npy',test_vecs)
        print(test_vecs.shape)
    

    4、获得训练集向量和标签,测试集向量和标签

    #获得训练集向量和标签,测试集向量和标签
    def get_data():
        train_vecs=np.load('pre_data/train_vecs.npy')
        y_train=np.load('pre_data/y_train.npy')
        test_vecs=np.load('pre_data/test_vecs.npy')
        y_test=np.load('pre_data/y_test.npy')
        return train_vecs,y_train,test_vecs,y_test
    

    5、训练SVM模型

    #训练SVM模型
    def svm_train(train_vecs,y_train,test_vecs,y_test):
        clf=SVC(kernel='rbf',verbose=True)
        clf.fit(train_vecs,y_train)   #根据给定的训练数据拟合SVM模型
        joblib.dump(clf,'pre_data/svm_model/model.pkl')  #保存训练好的SVM模型
        print(clf.score(test_vecs,y_test))   #输出测试数据的平均准确度
    

    6、构建待遇测句子的向量

    #构建待遇测句子的向量
    def get_predict_vecs(words):
        n_dim=300
        w2v_model=Word2Vec.load('pre_data/w2v_model/w2v_model.pkl')
        train_vecs=build_sentence_vector(words,n_dim,w2v_model)
        return train_vecs
    

    7、对单个句子进行情感判断

    #对单个句子进行情感判断
    def svm_predict(string):
        words=jieba.lcut(string)
        words_vecs=get_predict_vecs(words)
        clf=joblib.load('pre_data/svm_model/model.pkl')
        result=clf.predict(words_vecs)
     
        if int(result[0])==1:
            print(string,'positive')
        else:
            print(string,'negative')
    if __name__=='__main__':
        #x_train, x_test=load_file_and_preprocessing()
        #get_train_vecs(x_train, x_test)
     
        #train_vecs, y_train, test_vecs, y_test=get_data()
        #svm_train(train_vecs, y_train, test_vecs, y_test)
     
        #对输入句子情感进行判断
        string='电池充完了电连手机都打不开,简直烂的要命,真是金玉其外,败絮其中!连5号电池都不如'
        #string='牛逼的手机,从3米高的地方摔下去都没坏,质量非常好'
        #string='这款电脑感觉还行,能用,先试用一下,应该不错'
        svm_predict(string)
    

    中文自然语言处理流程

    展开全文
  • 自然语言处理理论书籍很多,讲实际操作的不多,能讲的这么系统的更少。Python语言在做NLP方面有较明显的优势。之前国外有《Natural Language Process with Python》,国内热心网友将其翻译为中文版。从这个角度讲,...
  • 无奈之下,向远在天津大学读书的另一个师兄求救,聊天过程中,他知道我本科期间做了一些nlp(自然语言处理)的研究。遂让我写写那时使用的工具、读过的书和看过的文章。所以本文是为了答复师兄而写的。分词工具 结巴...
  • 自然语言处理 入门书籍,很多大师都推荐,应该不会错
  • 中文分词方法 本文参考自书籍《Python自然语言处理实战:核心技术与算法》 用做个人的学习笔记和分享 1. 规则分词 规则分词的详细笔记 2. 统计分词 3. 混合分词 ...
  • Python自然语言处理

    2012-05-29 19:56:33
    《Python自然语言处理》【中文】【文字版】 作者:翻译:陈涛(weibo.com/chentao1999) 出版日期:2009 出版社:O'Reilly 页数:382 ISBN:978-0596516499 文件格式:PDF 文件大小:4.26 MB 书籍简介 NLTK配套书...
  • 统计自然语言处理基础(中文版 带书签),算是自然语言处理的入门级书籍了,值得好好看一下。
  • 自然语言处理综论,包含中文与英文两个版本。自然语言处理 入门书籍,很有帮助
  • 小白一个,最近一直在学习自然语言处理。以后准备在这方面发展。也就计划开始写博客,希望自己有所提升。文中主要是笔者看过的文章和书籍中整理出来的,第一次发博客。当中肯定有许多瑕疵,内容肯定也不是那么完善。...
  • 一本介绍自然语言处理技术的入门书籍中文的哦
  • 主要参考书为宗成庆老师的《统计自然语言处理》,虽然很多内容写的不清楚,但好像中文NLP书籍就这一本全一些,如果想看好的英文资料,可以到我的GitHub上下载: http://github.com/lovesoft5/ml 下面直接开始...

空空如也

空空如也

1 2 3 4 5 ... 7
收藏数 133
精华内容 53
热门标签
关键字:

中文自然语言处理书籍