热门好课推荐
猜你喜欢
相关培训 相关博客
  • NLP课程笔记stevenliuyi  http://mooc.guokr.com/note/157/2013-08-0216:51课程涵盖范围:NLP子问题(NLPsub-problems):词性标注(part-of-speechtagging)、句法分析(parsing)、词义辨识(word-sensedisambiguation)
    2016-03-07 20:19:33
    阅读量:2000
    评论:0
  • 编辑距离用来衡量两个串的相似度编辑距离就是用最少的编辑操作将一个词变为另一个词,操作有三种插入删除替换如何计算最短编辑距离?动态规划字符串X长度为n字符串Y长度为m定义D(i,j)表示X[0,i]和Y[0,j]的最短编辑距离,则D(n,m)表示X和Y的最短编辑距离先计算i,j较小的情况下的D(i,j),然后再利用已经计算出来的结果来计算i,j较大的情况下的D
    2015-06-10 15:33:12
    阅读量:584
    评论:0
  • 这篇博客总结的很好:https://blog.csdn.net/qq_33355980/article/details/84929538里面有两个地方补充下:1、衡量languageModel的手段是使用Perplexity,这个量反映了模型在测试数据上的表现情况;2、线性插值中,lambda的值除了取定值外还可以取变值...
    2019-04-23 22:02:44
    阅读量:53
    评论:0
  • 这一节概略的介绍了一下分词的内容。分词是NLP里面很重要的方面。每个NLP任务都需要做文本的规范化,包括切分单词单词格式规范化切分句子用N表示单词总数,V表示不同的单词数(sizeofvocabulary),用shake.txt做了实验,将非字母的字符作为分隔符,统计每个单词的出现次数。遇到的问题:d和s的个数非常多,因为文章中经常会出现‘s类似这样的词
    2015-06-10 14:13:50
    阅读量:644
    评论:0
  • 目录一、语言模型的定义和意义二、语言模型的马尔可夫模型2.1定长句子下的马尔可夫模型2.2变长句子下的马尔可夫模型 三、三元语言模型(TrigramLanguageModel)3.1极大似然估计3.2平滑估计3.2.1 线性插值(LinearInterpolation)     3.2.2 DiscountingMethods讲义...
    2018-12-09 22:13:47
    阅读量:199
    评论:0
  • !,?毫无疑问是一个句子的结尾而.则不一定是句子的结尾,.可以用于句子结尾缩写如Inc.数字如0.4, .02%因此需要一个分类器来确定.是哪种。二元分类器(是句子结尾,不是句子结尾)更复杂一点的决策树特征带.的单词形态:首字母大写,小写,全是大写,数字.后面的单词形态:首字母大写,小写,全是大写,数字数字特征:带.的单词长度带.
    2015-06-10 15:25:52
    阅读量:1078
    评论:0
  • 课程地址https://www.coursera.org/course/nlp​记得以前在网页上查正则表达式时,总是被那些归纳总结的表看到头昏压花,今天学了视频课程,感觉学到好多,至少很基本的东西是知道了一些,自己能读写简单的正则表达式了。[]里面的字符表示每个都可以,比如[wW]oodchuck可以表示woodchuck和Woodchuck​[12
    2015-06-09 17:46:31
    阅读量:557
    评论:0
  • npl和文本分析的应用领域:搜索引擎,情感分析,主题建模,词性标注,实体识别等。本小结知识是关于如何从文本数据中提取有用的信息#tokenize将一个文本分割成有意思的标记,比如一个文本分割成若干单词或者句子sample_text="Areyoucuriousabouttokenization?Let'sseehowitworks!Weneedtoanaly...
    2018-04-08 21:56:06
    阅读量:172
    评论:0
  • 语言模型的目的是给句子计算概率。为什么要计算句子的概率呢?这在多个领域都有作用。比如在机器翻译领域(machinetranslation),可以用来区分哪个翻译好,哪个翻译不好,如P(highwindstonite)>P(largewindstonite)在拼写矫正领域(spellcorrection),可以用来矫正错误的拼写,如theofficeisabout
    2015-06-12 15:20:58
    阅读量:1709
    评论:0
  • 针对nlp的问题,对起课程进行翻译:  cs224n-2017-lecture1   1、人类的语言有哪些特点呢?     一个人类语言就是能够特定的组织来表达其意思的系统:    (1)不仅仅是一个环境信号,更多是一个交流信息;(2)用了一种编码方式,并且这种方式,一个小孩都可以能够很快的学习。     所以一种人类语言就是一个离散的、符号、...
    2018-12-25 18:46:02
    阅读量:394
    评论:0