热门好课推荐
猜你喜欢
相关培训 相关博客
  • 以NLTK为基础配合讲解自然语言处理的原理NLTK:是Python上著名的自然语言处理库,自带语料库,词性分类库,自带分类,分词等功能,强大的社区支持,还有很多的简单版wrapperNLTK的安装:参考官网的安装过程首先importnltk导入nltk然后nltk.download()安装语料库NLTK自带语料库文本处理流程先做预处理,包括分词,去除停止词,然后生成表达式...
    2018-12-28 15:05:14
    阅读量:97
    评论:0
  • NLP理论基础和实践(进阶)记录。时间周期:两周Task-01一、环境准备anaconda/miniconda安装:https://mirrors.tuna.tsinghua.edu.cn/anaconda/tensorflow安装:http://www.tensorflownews.com/series/tensorflow-install-tutorial/二、数据集探索中文数...
    2019-08-06 16:51:09
    阅读量:23
    评论:0
  • NLP理论基础和实践(进阶)记录。时间周期:两周Task文章目录神经网络基础一、线性模型二、激活函数去线性化2.1sigmoid函数2.2relu函数2.3tanh函数三、损失函数3.1二分类问题3.2多分类问题3.3回归问题四、神经网络优化算法4.1Batchgradientdescent4.2随机梯度下降法(SGD,StochasticGradientDecent)...
    2019-08-12 20:30:40
    阅读量:13
    评论:0
  • @TOCDataWhale-NLP理论基础和实践(进阶)-lixiaome欢迎使用Markdown编辑器你好!这是你第一次使用Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown编辑器,可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了...
    2019-08-07 20:04:00
    阅读量:17
    评论:0
  • NLP理论基础和实践(进阶)记录。时间周期:两周Task-02一、one-hot词袋模型(BOW,bagofwords)词袋模型是自然语言处理中在建模文本时常用的文本表示方法。词袋模型是在自然语言处理和信息检索中的一种简单假设。在这种模型中,文本(段落或者文档)被看作是无序的词汇集合,忽略语法甚至是单词的顺序。把句子转换成一个稀疏向量。规则是:对应索引位置上的单词存在,则对应索引...
    2019-08-09 20:30:40
    阅读量:63
    评论:0
  • NLP理论基础和实践一、TensorFlow安装Tensorflow的主要优势有以下几点:高度的灵活性、支持python语言开发、可视化效果好、功能更加强大、运行效率高、强大的社区。本文以Windows安装为例,参考资料来自http://www.tensorflownews.com/2018/03/28/tensorflow-windows-install/安装TensorFlow之前需...
    2019-08-07 14:26:58
    阅读量:6
    评论:0
  • NLP理论基础和实践(进阶)记录。时间周期:两周Task文章目录一、卷积神经网络1.1网络结构1.2经典模型1.2.1LeNet-5模型1.2.2VGGNet模型1.2.3Inception-v3模型一、卷积神经网络卷积神经网络是在全连接神经网络基础上提出的。全连接神经网络相邻两层之间所有节点都有边连接,而对于卷积神经网络,相邻两层之间只有部分节点连接,为了展示每一层的神经元维度...
    2019-08-14 19:45:52
    阅读量:6
    评论:0
  • 目录Windows安装安装Python3.7安装Numpy安装NLDKNLTK自带语料库文本处理流程Tokenize中英⽂NLP区别中文分词 分词之后的效果有时候tokenize没那么简单社交⽹络语⾔的tokenize纷繁复杂的词形词形归⼀化NLTK实现StemmingNLTK实现LemmaStopwordsNLTK去除sto...
    2018-08-08 10:41:54
    阅读量:166
    评论:0
  • 视频地址:https://www.bilibili.com/video/av27083004/?p=1对于社交语言一类的,表情符之类的要通过正则匹配把它们筛出来,具体处理如下图NLP:在feed进模型前要做大量的预处理,下面重点介绍存在的问题(在英文中这个问题比较明显,在中文中可以忽略)解决方法实现停用词(设置停用词的话可能会破坏...
    2018-11-22 17:47:48
    阅读量:81
    评论:0
  • 【特征选择(2days)】TF-IDF原理。TF-IDF(TermFrequency-InverseDocumentFrequency,词频-逆文件频率).是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率...
    2019-08-11 15:56:27
    阅读量:8
    评论:0