精华内容
下载资源
问答
  • 本文实例讲述了朴素贝叶斯算法的python实现方法。分享给大家供大家参考。具体实现方法如下: 朴素贝叶斯算法优缺点 优点:在数据较少的情况下依然有效,可以处理多类别问题 缺点:对输入数据的准备方式敏感 适用数据...
  • 朴素贝叶斯算法优缺点

    万次阅读 2018-07-14 00:06:07
    朴素贝叶斯的主要优点有:1)朴素贝叶斯模型有稳定的分类效率。2)对小规模的数据表现很好,能处理多分类任务,适合增量式训练,尤其是数据量超出内存时,可以一批批的去增量训练。3)对缺失数据不太敏感,算法也...
    朴素贝叶斯的主要优点有:
    
    1)朴素贝叶斯模型有稳定的分类效率。
    2)对小规模的数据表现很好,能处理多分类任务,适合增量式训练,尤其是数据量超出内存时,可以一批批的去增量训练。
    3)对缺失数据不太敏感,算法也比较简单,常用于文本分类。
    朴素贝叶斯的主要缺点有:   
    1) 理论上,朴素贝叶斯模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为朴素贝叶斯模型给定输出类别的情况下,假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性个数比较多或者属性之间相关性较大时,分类效果不好。而在属性相关性较小时,朴素贝叶斯性能最为良好。对于这一点,有半朴素贝叶斯之类的算法通过考虑部分关联性适度改进。
    2)需要知道先验概率,且先验概率很多时候取决于假设,假设的模型可以有很多种,因此在某些时候会由于假设的先验模型的原因导致预测效果不佳。
    3)由于我们是通过先验和数据来决定后验的概率从而决定分类,所以分类决策存在一定的错误率。
    4)对输入数据的表达形式很敏感。
    展开全文
  • 当然,朴素贝叶斯算法优点有很多,但这种算法的缺点也是我们不能忽视的,那么大家知道不知道朴素贝叶斯算法优点和缺点是什么呢?下面我们就给大家介绍一下这个问题。 那么什么是朴素贝叶斯算法呢?其实朴素...


    在机器学习中有很多算法,而有一种算法有着坚实的数学背景,并且被广泛使用,这种算法就是朴素贝叶斯算法。当然,朴素贝叶斯算法的优点有很多,但这种算法的缺点也是我们不能忽视的,那么大家知道不知道朴素贝叶斯算法的优点和缺点是什么呢?下面我们就给大家介绍一下这个问题。

    那么什么是朴素贝叶斯算法呢?其实朴素贝叶斯属于生成式模型,也就是关于生成模型和判别式模型,主要还是在于是否需要求联合分布,这种算法是一种比较简单的算法,你只需做一堆计数即可。如果注有条件独立性假设,朴素贝叶斯分类器的收敛速度将快于判别模型,比如逻辑回归,所以你只需要较少的训练数据即可。即使NB条件独立假设不成立,NB分类器在实践中仍然表现的很出色。它的主要缺点是它不能学习特征间的相互作用,用mRMR中R来讲,就是特征冗余。

    那么朴素贝叶斯算法的优点是什么呢?这种算法的优点有五个,第一就是朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。第二就是对大数量训练和查询时具有较高的速度。即使使用超大规模的训练集,针对每个项目通常也只会有相对较少的特征数,并且对项目的训练和分类也仅仅是特征概率的数学运算而已。第三就是对小规模的数据表现很好,能个处理多分类任务,适合增量式训练(即可以实时的对新增的样本进行训练)。第四就是对缺失数据不太敏感,算法也比较简单,常用于文本分类。第五就是朴素贝叶斯对结果解释容易理解。

    当然,朴素贝叶斯算法的缺点也是很明显的,朴素贝叶斯算法的缺点有四点,第一就是

    需要计算先验概率。第二就是分类决策存在错误率。第三就是对输入数据的表达形式很敏感。第四就是对由于使用了样本属性独立性的假设,所以如果样本属性有关联时其效果不好。

    那么朴素贝叶斯应用领域是什么呢?其实朴素贝叶斯算法在欺诈检测中使用较多。当然,我们还可以用朴素贝叶斯算法来决定一封电子邮件是否是垃圾邮件。还可以用朴素贝叶斯算法判断一篇文章应该的类别,同时也能够使用贝叶斯算法去判断一段文字表达的是积极的情绪还是消极的情绪。从中我们可以看出朴素贝叶斯算法是一个十分实用的算法。

    在这篇文章中我们给大家介绍了关于朴素贝叶斯算法优缺点的相关知识,通过对这些知识的讲解相信大家已经对朴素贝叶斯算法有了一定的了解,希望这篇文章能够帮助大家。

    展开全文
  • 朴素贝叶斯算法是一种有监督学习算法,用于解决分类问题。 “朴素”是因为整个形式化过程只做最原始、最简单的假设。 朴素贝叶斯的优缺点: 优点: – 在数据较少的情况下仍然有效,可以处理多类别问题。 – ...

    朴素贝叶斯算法是一种有监督学习算法,用于解决分类问题。

    “朴素”是因为整个形式化过程只做最原始、最简单的假设。


    朴素贝叶斯的优缺点:

    • 优点:
      – 在数据较少的情况下仍然有效,可以处理多类别问题。
      – 简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。
    • 缺点:
      – 对于输入数据的准备方式较为敏感。
    • 适用数据类型:标称型数据。

    朴素贝叶斯是贝叶斯决策理论的一部分。

    >>> 贝叶斯决策理论:

    假设现在有一个数据集,它由两类数据组成,数据分布如下图所示:

    现在用 p 1 ( x , y ) p1(x,y) p1(x,y) 表示数据点 ( x , y ) (x,y) (x,y) 属于类别1(图中红色圆点表示的类别)的概率,用 p 2 ( x , y ) p2(x,y) p2(x,y) 表示数据点 ( x , y ) (x,y) (x,y) 属于类别2(图中蓝色三角形表示的类别)的概率,那么对于一个新数据点 ( x , y ) (x,y) (x,y),可以用下面的规则来判断它的类别:

    • 如果 p 1 ( x , y ) > p 2 ( x , y ) p1(x,y)>p2(x,y) p1(x,y)>p2(x,y),那么类别为1
    • 如果 p 1 ( x , y ) < p 2 ( x , y ) p1(x,y)<p2(x,y) p1(x,y)<p2(x,y),那么类别为2

    也就是说,我们会选择高概率对应的类别。这就是贝叶斯决策理论的核心思想,即选择具有最高概率的决策。


    在学习如何计算p1和p2概率之前,我们必须对条件概率有所了解。


    参考资料:《机器学习实战》

    展开全文
  • 朴素贝叶斯算法及其实战

    万次阅读 2019-12-15 02:28:08
    1.概率: 随机事件发生的可能性 2.定义 贝叶斯方法 贝叶斯方法是以贝叶斯原理为基础,使用概率统计的知识对样本数据集进行分类。...贝叶斯分类算法在数据集较大的情况下表现出较高的准确率,同时算法本身也比...

    1.概率:

          随机事件发生的可能性

    2.定义

     贝叶斯方法

        贝叶斯方法是以贝叶斯原理为基础,使用概率统计的知识对样本数据集进行分类。由于其有着坚实的数学基础,贝叶斯分类算法的误判率是很低的。贝叶斯方法的特点是结合先验概率和后验概率,即避免了只使用先验概率的主观偏见,也避免了单独使用样本信息的过拟合现象。贝叶斯分类算法在数据集较大的情况下表现出较高的准确率,同时算法本身也比较简单。 [2] 

    朴素贝叶斯算法

        朴素贝叶斯算法(Naive Bayesian algorithm) 是应用最为广泛的分类算法之一。

        朴素贝叶斯方法是在贝叶斯算法的基础上进行了相应的简化,即假定给定目标值时属性之间相互条件独立。也就是说没有哪个属性变量对于决策结果来说占有着较大的比重,也没有哪个属性变量对于决策结果占有着较小的比重。虽然这个简化方式在一定程度上降低了贝叶斯分类算法的分类效果,但是在实际的应用场景中,极大地简化了贝叶斯方法的复杂性。

        首先给出贝叶斯公式:
        换成分类任务的表达式:
         我们最终求的p(类别|特征)即可!就相当于完成了我们的任务。

         则,朴素贝特斯公式为:

    3.结合具体实例理解

      数据:

    现在给我们的问题是,如果一对男女朋友,男生想女生求婚,男生的四个特点分别是不帅,性格不好,身高矮,不上进,请你判断一下女生是嫁还是不嫁?

    这是典型的二分类问题,按照朴素贝叶斯的求解,转换为P(嫁|不帅、性格不好、矮、不上进)和P(不嫁|不帅、性格不好、矮、不上进)的概率,最终选择嫁与不嫁的答案。

    这里我们根据贝特斯公式:

    由此,我们将(嫁|不帅、性格不好、矮、不上进)转换成三个可求的P(嫁)、P(不帅、性格不好、矮、不上进|嫁)、P(不帅、性格不好、矮、不上进)。进一步分解可以得:
         P(不帅、性格不好、矮、不上进)=P(嫁)P(不帅|嫁)P(性格不好|嫁)P(矮|嫁)P(不上进|嫁)+P(不嫁)P(不帅|不嫁)P(性格不好|不嫁)P(矮|不嫁)P(不上进|不嫁)。
        P(不帅、性格不好、矮、不上进|嫁)=P(不帅|嫁)P(性格不好|嫁)P(矮|嫁)P(不上进|嫁)

    将上面的公式整理一下可得:

         P(嫁)=1/2、P(不帅|嫁)=1/2、P(性格不好|嫁)=1/6、P(矮|嫁)=1/6、P(不上进|嫁)=1/6。
         P(不嫁)=1/2、P(不帅|不嫁)=1/3、P(性格不好|不嫁)=1/2、P(矮|不嫁)=1、P(不上进|不嫁)=2/3
     但是由贝叶斯公式可得:对于目标求解为不同的类别,贝叶斯公式的分母总是相同的。所以,只求解分子即可:

        于是,对于类别“嫁”的贝叶斯分子为:P(嫁)P(不帅|嫁)P(性格不好|嫁)P(矮|嫁)P(不上进|嫁)=1/2 * 1/2 * 1/6 * 1/6 * 1/6=1/864     
    对于类别“不嫁”的贝叶斯分子为:P(不嫁)P(不帅|不嫁)P(性格不好|不嫁)P(矮|不嫁)P(不上进|不嫁)=1/2 * 1/3 * 1/2 * 1* 2/3=1/18。
    经代入贝叶斯公式可得:P(嫁|不帅、性格不好、矮、不上进)=(1/864) / (1/864+1/18)=1/49=2.04%
    P(不嫁|不帅、性格不好、矮、不上进)=(1/18) / (1/864+1/18)=48/49=97.96%
    则P(不嫁|不帅、性格不好、矮、不上进) > P(嫁|不帅、性格不好、矮、不上进),则该女子选择不嫁!

     4. 引子:

                            

          根据前面推算公式可直接求:

    科技:
        P(科技|影院,支付宝,云计算) = P(影院,支付宝,云计算|科技)*P(科技)
                 =(8/100)*(20/100)*(63/100)*(30/90)
                 = 126 / 37500
                 ≈ 0.0036
     娱乐:
          P(娱乐|影院,支付宝,云计算) = P(影院,支付宝,云计算|娱乐)*P(娱乐)
                 = (56/232)*(25/122)*(0/121)*(60/90)
                 = 0 

    从公式和结果中,可以看出属于娱乐的概率为,具有不合理性,因此引入拉普拉斯平滑系数

             

     

     5.Python中朴素贝叶斯算法API

    sklearn.naive_bayes.MultinomialNB(alpha=1.0)
        .朴素贝叶斯分类
        .alpha 拉普拉斯平滑系数

     

    6.实战:对sklearn数据集中20类新闻数据分类

    其中:该数据集包含20个新闻类别及18000条新闻数据

    from sklearn.model_selection import train_test_split
    from sklearn.naive_bayes import MultinomialNB
    from sklearn.datasets import fetch_20newsgroups
    from sklearn.feature_extraction.text import TfidfVectorizer
    def naviebayes():
        '''
        朴素贝叶斯进行文本分类
        :return: None
        '''
        news = fetch_20newsgroups(subset="all")
    
        #数据分割
        x_train,x_test,y_train,y_test = train_test_split(news.data,news.target,test_size=0.25)
    
        #对数据集进行特征抽取
        tf = TfidfVectorizer() #实例化
        x_train = tf.fit_transform(x_train)#以训练集单重的词的列表进行每篇文章重要性统计
        x_test = tf.transform(x_test)
    
        #进行朴素贝叶斯算法的预测
        mlt = MultinomialNB(alpha=1)
        mlt.fit(x_train,y_train)
        y_predict = mlt.predict(x_test)
    
        print("预测出的文章类别为:",y_predict)
    
        #准确率
        print("准确率为:",mlt.score(x_test,y_test))
    
    
        return None
    
    if __name__ == "__main__":
        naviebayes()

    分类结果及预算正确率:

    预测出的文章类别为: [15  9  9 ...  1 11 17]
    准确率为: 0.8527164685908319

    根据公式可知,不存在调参的算法优化, 唯一影响预测结果的因素: 训练集数据的准确性

    7.分类模型评估

           正确率:estimator.score():即预测结果的正确百分比
           精确率(Precision): 预测结果为正例样本中真实为正例的比例(查得准)
           召回率(Recall):真实为正例样本中预测结果为正例的比例(查得全,对正样本的区分能力)
            API:
                sklearn.metrics.classification_report
            使用:
                classification_report(y_true,y_pred,target_names= None)
                    y_true:真实目标值
                    y_pred:估计器预测目标值
                    target_names:目标类别名称
                    return : 每个类别精确率与召回率

    print("每个类别的精确率和召回率:",classification_report(y_test,y_predict,target_names=news.target_names))#news.target_names文章类别字符串

    打印精确率和召回率入下 

                                 precision    recall  f1-score   support
                 alt.atheism       0.90      0.77      0.83       195
               comp.graphics       0.91      0.79      0.84       240
     comp.os.ms-windows.misc       0.87      0.81      0.84       259
    comp.sys.ibm.pc.hardware       0.64      0.89      0.75       219
       comp.sys.mac.hardware       0.93      0.83      0.88       240
              comp.windows.x       0.92      0.87      0.89       234
                misc.forsale       0.91      0.72      0.80       234
                   rec.autos       0.92      0.90      0.91       258
             rec.motorcycles       0.95      0.97      0.96       250
          rec.sport.baseball       0.95      0.97      0.96       245
            rec.sport.hockey       0.93      0.98      0.95       242
                   sci.crypt       0.83      0.97      0.90       264
             sci.electronics       0.95      0.80      0.87       253
                     sci.med       0.98      0.93      0.95       259
                   sci.space       0.89      0.96      0.92       257
      soc.religion.christian       0.62      0.98      0.76       263
          talk.politics.guns       0.76      0.97      0.85       233
       talk.politics.mideast       0.93      0.97      0.95       239
          talk.politics.misc       1.00      0.63      0.77       180
          talk.religion.misc       0.98      0.28      0.44       148
                 avg / total       0.89      0.87      0.86      4712

     *注:每次结果不一样,因为样本随机分,词语也是,导致结果稍微有偏差。

    8.朴素贝叶斯分类优缺点:

         优点
        (1)朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率。
        (2)对小规模的数据表现很好,能个处理多分类任务,适合增量式训练,尤其是数据量超出内存时,我们可以一批批的去增量训练。
        (3)对缺失数据不太敏感,算法也比较简单,常用于文本分类。
      缺点
        (1)理论上,朴素贝叶斯模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为朴素贝叶斯模型给定输出类别的情况下,假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性个数比较多或者属性之间相关性较大时,分类效果不好。而在属性相关性较小时,朴素贝叶斯性能最为良好。对于这一点,有半朴素贝叶斯之类的算法通过考虑部分关联性适度改进。
        (2)需要知道先验概率,且先验概率很多时候取决于假设,假设的模型可以有很多种,因此在某些时候会由于假设的先验模型的原因导致预测效果不佳。
        (3)由于我们是通过先验和数据来决定后验的概率从而决定分类,所以分类决策存在一定的错误率。
        (4)对输入数据的表达形式很敏感。

    文章参考链接:

    https://baike.baidu.com/item/%E6%9C%B4%E7%B4%A0%E8%B4%9D%E5%8F%B6%E6%96%AF/4925905?fr=aladdin 

    朴素贝叶斯算法的理解与实现 

    带你彻彻底底搞懂朴素贝叶斯公式

    某机构视频

     

    展开全文
  • 朴素贝叶斯的主要优点 朴素贝叶斯模型发源于古典数学理理论,有稳定的分类效率。 对小规模的数据表现良好,能够处理多分类任务,适合增量式训练,尤其是数据量超过内存时,可以逐批地去增量训练。 对缺失数据不太...
  • 朴素贝叶斯算法

    2018-12-26 20:55:59
    朴素贝叶斯算法是一种生成算法,主要用于分类,可以处理非线性的数据。它会计算样本属于每一个类的后验概率,然后判定样本属于后验概率最大的那一个类。朴素贝叶斯有两个假设条件: 条件独立假设:用于分类的特征在...
  • 朴素贝叶斯算法(1)算法介绍 朴素贝叶斯算法(2)案例实现 引言 贝叶斯算法的思想可以概括为选择后验概率最大的类为分类标签,先验概率+数据=后验概率。也就是说我们在实际问题中需要得到的后验概率,可以通过先验...
  • 朴素贝叶斯算法文本分类算法 从零开始的算法 (Algorithms From Scratch) 介绍 (Introduction) The Naive Bayes classifier is an Eager Learning algorithm that belongs to a family of simple probabilistic ...
  • 朴素贝叶斯算法原理

    千次阅读 2018-10-31 20:59:50
    下表提取了文章中出现频率最高的关键词,并根据事先定义好的关键词向量,如果这个关键词在文中出现频率高,则标记为1,频率不高,则标记为0,然后就可以通过朴素贝叶斯算法进行分类了。比如新来一篇文章6,其出现...
  • 文章目录1 朴素贝叶斯简介2 条件概率与全概率公式3 贝叶斯推断4 引例5 朴素贝叶斯算法分类(1) GaussianNB(2) MultinomialNB(3) BernoulliNB6 朴素贝叶斯算法优缺点7 实验参考资料 1 朴素贝叶斯简介 贝叶斯分类算法...
  • 朴素贝叶斯算法总结

    2019-08-21 17:45:18
    朴素贝叶斯应该是机器学习领域最简单的一种算法,但这只是在数学层面的"简单"。如果要深挖下去,考虑先验概率和后验概率,用的不顺溜的话也特别复杂。 为什么说它 "朴素" 呢? 因为它有两个先决条件(或限制条件)...
  • 朴素贝叶斯算法 工作原理 提取所有文档中的词条并进行去重 获取文档的所有类别 计算每个类别中的文档数目 对每篇训练文档:  对每个类别:  如果词条出现在文档中--&gt;增加该词条的计数值( for循环或者矩阵...
  • 朴素贝叶斯算法原理+案例+总结

    千次阅读 2020-07-08 10:35:58
    1、朴素贝叶斯算法原理 ● 概率基础:概率定义为一件事情发生的可能性。 ● 联合概率:包含多个条件,且所有条件同时成立的概率 ● 条件概率:事件A在事件B已经发生的情况下发生的概率 (条件:所以特征之间时条件...
  • 机器学习——k近邻算法与朴素贝叶斯算法k近邻算法 k近邻算法 定义:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别 计算距离公式:利用欧式距离...
  • 04 数据挖掘之朴素贝叶斯算法 原文链接:04 数据挖掘之朴素贝叶斯算法 相关博客 01 数据挖掘之Apriori关联规则算法 02 数据挖掘之k均值聚类算法 03 数据挖掘之ID3决策树算法 前言 照例,数据挖掘迎来了第四次实践...
  • 1.朴素贝叶斯算法的优缺点总结: 优点: 朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率; 分类速度快,准确度高; 对缺失数据不太敏感,算法简单,常用于文本分类(如新闻分类,垃圾邮件过滤等)。 缺点...
  • 朴素贝叶斯算法简介

    2021-04-19 10:57:00
    朴素贝叶斯算法简介 1.2 概率基础复习 1.概率定义 概率定义为一件事情发生的可能性 扔出一个硬币,结果头像朝上 P(X) : 取值在[0, 1] 2.案例:判断女神对你的喜欢情况 在讲这两个概率之前我们通过一个...
  • 朴素贝叶斯算法的优缺点

    千次阅读 2019-03-30 14:11:48
    朴素贝叶斯算法的优缺点 优点:     (1)朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率。     (2)对小规模的数据表现很好,能个处理多分类任务,适合增量式训练,尤其是数据量超出内存时,我们...
  • 1 概率基础回顾 1。概率的定义:一件事情发生的可能性, P(X) 取值范围为[0,1] ...2 朴素贝叶斯算法 2.1。朴素?假设:特征与特征之间是相互独立 !!! 2.2。贝叶斯公式:P(C|W) = P(W|C)P© / P(W) 注:W 为
  • 一、朴素贝叶斯算法原理 1、联合概率、条件概率与相互独立 ·联合概率:包含多个条件,且所有事件同时成立的概率 。记作:P(A,B) 。例如:P(程序员,体型匀称),P(程序员,超重,喜欢) ·条件概率:就是事件...
  • 朴素贝叶斯算法算法原理对数据的要求算法的优缺点算法需要注意的点算法实现(python)(待更.......) 算法原理 P(Ck∣xi)=p(xi∣ck)∗p(ck)p(xi)=p(x1∣ck)∗p(x2∣ck)....p(ck)p(x1)p(x2)....P(C_k|x_i)=\frac{p(x...
  • 学习朴素贝叶斯算法的5个简单步骤

    千次阅读 2018-12-19 09:17:31
    本文将通过6个步骤带领你学习朴素贝叶斯算法。   Step1 什么是朴素贝叶斯算法朴素贝叶斯算法是一种基于贝叶斯定理的分类技术,假设在预测变量之间具有独立性。 给定一个水果,如果水果是黄色的,圆形的,...
  • 机器学习之朴素贝叶斯算法详解

    万次阅读 多人点赞 2018-07-05 19:39:13
    朴素贝叶斯公式: P(A|B)=P(A)P(B|A)P(B)P(A|B)=P(A)P(B|A)P(B) P(A|B) = \frac{P(A)P(B|A)}{P(B)} 一、概率基础知识: 条件概率是指事件A在另外一个事件B已经发生条件下的发生概率。 条件概率表示为: P(A|B)...
  • A:朴素贝叶斯算法案例 1、sklearn20新闻分类 2、20个新闻组数据集包含20个主题的18000个新闻组帖子 B:朴素贝叶斯案例流程 1、加载20类新闻数据,并进行分割 2、生成文章特征词 3、朴素贝叶斯estimator流程进行预估 C...
  • 朴素贝叶斯算法,点进来了解了解。

    千次阅读 2019-09-22 16:57:36
    本篇总结一下贝叶斯算法。 贝叶斯方法是以贝叶斯原理为基础,使用概率统计的知识对样本数据集进行分类。由于其有着坚实的数学基础,贝叶斯分类算法的误判率是很低的。贝叶斯方法的特点是结合先验概率和后验概率,即...
  • 朴素贝叶斯算法优化与 sklearn 实现

    千次阅读 2018-11-11 00:38:54
    朴素贝叶斯算法的推导与实践 但运行上一篇日志中的示例,我们发现出现了下面的结果: ['love', 'my', 'dalmation'] 属于非侮辱类 ['stupid', 'garbage'] 属于非侮辱类 这显然是不正确的,本文,我们就来解决这个...
  • 带你搞懂朴素贝叶斯分类算法带你搞懂朴素贝叶斯分类算贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。这...
  • 朴素贝叶斯算法:实现邮件分类

    万次阅读 多人点赞 2018-10-08 11:00:06
    朴素贝叶斯算法:实现邮件分类 一、实验准备 1、实验内容和目的 使用5000封邮件作为训练集,训练朴素贝叶斯分类器,然后使用该分类器对1000封邮件进行分类,给出准确率结果 其中训练集为文件spam_train.txt,...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 8,150
精华内容 3,260
关键字:

朴素贝叶斯算法优点