猜你喜欢
相关培训 相关博客
  • IIS算法数学理论背景IIS算法主要用来计算参数估计的maximum-likelihood。 这篇文章主要是解读Adam Berger的算法(IIS Algorithm)。首先这里采用的是概率模型。其中参数解释:表示再输入文档是x的情况下,输出label为y的概率。(在Adam的文章中这个是表示language modeling的一个句子概率问题,但是这里用于文本分
    2014-02-12 12:46:09
    阅读量:2709
    评论:5
  • [写在前面:最近工作上事情比较多,加上年终述职和元旦假期去首都玩了一次,导致这篇博客前前后后写了快有半个月,跨越了2017和2018年,意义非凡。在这里祝大家新年快乐,也希望自己在新的一年能够坚持学习,提升自己!]  上一篇博客机器学习之路——朴素贝叶斯分类写到了朴素贝叶斯的理论知识,今天来讲一下朴素贝叶斯实战——垃圾邮件过滤,本文内容参考《机器学习实战》。  举个简单的例子,我们在网上发帖的时候,
    2017-12-26 21:19:41
    阅读量:4064
    评论:3
  • 随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。以统计理论为基础,利用机器学习算法对已知的训练数据做统计分析从而获得规律,再运用规律对未知数据做预测分析,已成为文本分类领域的主流。InfoQ联合“达观数据“共同策划了《文本数据的机器学习自动分类方法》系列文章,为您详细阐述机器学习文本分类的基本方法与处理流程。
    2016-01-26 11:09:52
    阅读量:83129
    评论:3
  • 算法原理:基本概念介绍:支持度: 对于事件A→BA\to B的支持度 support=P(AB)support=P(AB)置信度: 置信度confidence=P(B|A)=P(AB)/P(A)confidence=P(B|A)=P(AB)/P(A); 3、强关联规则: 如果存在一条关联规则,它的支持度和置信度都大于预先定义好的最小支持度与置信度,我们就称它为强关联规则。强关联规则就可以
    2017-10-18 16:09:15
    阅读量:399
    评论:0
  • 基于机器学习的NLP情感分析(二)—- 分类问题 前文提到了如何把一个文本转换为相应的词向量,本文讨论的是如何进行分类。feature相关性首先,需要看看我之前选出来的feature,是否能够满足需求。这里其实有很多参数没有显示出来。从该图来看,大部分的参数相关性是非常低的,这是一件非常好的事情,因为这说明选出来的参数具有更大表现力。但也发现有一些参数是重复的,这个比较尴尬。当然可以采用PCA
    2017-07-18 21:07:35
    阅读量:9125
    评论:0
  • Java自然语言处理CoreNLP—斯坦福大学的CoreNLP提供一系列的自然语言处理工具,输入原始英语文本,可以给出单词的基本形式(下面Stanford开头的几个工具都包含其中)。Stanford Parser—一个自然语言解析器。Stanford POS Tagger —一个词性分类器。Stanford Name Entity Recognizer—Java实现的名称识别器
    2015-11-07 22:46:14
    阅读量:1649
    评论:1
  • Tensorflow是Google推出的机器学习开源神器,对Python有着良好的语言支持,支持CPU,GPU和Google TPU等硬件,并且已经拥有了各种各样的模型和算法。目前,Tensorflow已被广泛应用于文本处理,语音识别和图像识别等多项机器学习和深度学习领域。基础框架分为三层:应用层、接口层和核心层应用层提供了机器学习相关的训练库、预测库和针对Python、C++和Java等...
    2019-12-04 19:03:26
    阅读量:10
    评论:0
  • 算法原理推导伪代码java实现代码测试数据算法原理推导优缺点分析优点:在数据较少的情况下,仍然有效,可以处理多分类问题 缺点:对于输入数据的准备方式比较敏感 适用数据类型:标称型数据主要思想p1(x,y)表示数据点(x,y)属于类别1的概率; p2(x,y)表示数据点(x,y)属于类别2的概率; if: p1>p2 属于1...
    2016-09-23 12:27:35
    阅读量:2805
    评论:0
  • 笔者想在JAVA项目中做机器学习的分类想使用循环神经网络的时候苦于没有找到开源的代码,最后终于找到lipiji所写的LSTM和GRU,项目GitHub链接在这:项目GitHub地址,但是这个项目的demo只是简单的做了一个文本序列的预测,无法达到自己做分类的目的,于是笔者新写了一个demo来实现分类的目的,这里所使用的数据集是Iris。Iris数据集是常用的分类实验数据集,由Fisher, 1
    2017-04-25 12:01:45
    阅读量:4422
    评论:4