热门好课推荐
猜你喜欢
相关培训 相关博客
  • 5.12今天交了一下,训练了一个epoch,效果不好,交了一下成绩是05.14今天终于改通了算法,是vocab.size的问题,传的时候给成词典的值了,应该给句子的值,导致eval出问题。训练了一个epoch,效果不好,准备循环100次看一下loss,这里记录一下原理。论文地址:SiameseRecurrentArchitecturesforLearningSentenceSimila...
    2018-05-14 16:40:41
    阅读量:1128
    评论:0
  • 最近的项目就是NLP相关,说一些个人对NLP的看法。直观地看,NLP算法工程师的经验和算法工程师的经验没有太大差别。NLP的发展并不是那么快。如果没有实际的业务需求,NLP的实现或产品功能不如其他领域那么大,所以NLP工程师可能会面临相对较多的挫折,当然也面临更多的机会。实际上,算法工程师的经验非常重要,两个人认为这是积累和反思,通常花更多的时间阅读纸张来重现一些实验,而不会浪费你的表现和时间;问...
    2018-03-30 10:42:04
    阅读量:6921
    评论:0
  • 自然语言处理的算法和工具汇总
    2018-07-25 10:54:01
    阅读量:1536
    评论:28
  • word2vecword2ve是词聚类模型,是基于上下文的,关注的是词与上下文的共现。算法可以用word2vec+kmeans聚类。LDALDA是主题聚类模型,关注的是词与文章的共现。LDA和doc2vec更与对比性。LDA很耗时,商业不喜欢用。FastText可以参考的博客地址FastText是facebook开源的一个词向量与文本分类工具,模型简单且训练速度快。FastText使用的模型与wo...
    2018-05-08 15:38:49
    阅读量:767
    评论:0
  • TextRank算法提取关键词的Java实现码农场 > 自然语言处理2014-03-26 阅读(16935)评论(27)目录PageRank的计算公式:正规的TextRank公式TextRank的Java实现排序后的投票结果:开源项目地址谈起自动摘要算法,常见的并且最易实现的当属TF-IDF,但是感觉TF-ID
    2018-02-05 14:43:35
    阅读量:152
    评论:0
  • 自然语言处理中的形态还原就是把句子中的词还原成基本词形,作为词的其它信息(词典、个性规则)的索引。
    2014-10-30 22:09:15
    阅读量:1616
    评论:0
  • TextRank算法TextRank算法基本思想来源于PageRank算法,首先了解一下PageRank算法。PageRank算法是一种用于网页排名的算法,其基本思想有两条:1.链接数量。一个网页被越多的其他网页链接,说明这个网页越重要。2.链接质量。一个网页被一个越高权值得网页链接,也能表明这个网页越重要。个人理解:该算法的主要思想就是每个网页都有自己的权值得分,然后该得分影...
    2019-01-08 16:59:18
    阅读量:122
    评论:0
  • BM25算法,通常用来做检索相关性评分。首先对一个查询Query进行分词得qi,对每个搜索结果文档d,计算qi与文档d的相关性得分。最后将所有的qi进行加权求和,从而得到查询Query与文档d的相关性得分。公式中,Q表示查询Query,qi表示查询被解析得到的分词qi,d表示搜索结果文档d,Wi表示分词qi的权重,R(qi,d)表示分词qi与文档d的相关性得分。定义一个词与文档相关性的权重方法有很...
    2018-05-20 22:39:41
    阅读量:1356
    评论:0