机器学习中的分层训练共找到2752条结果

今天要讲 4 个关于 Python 编程语言的故事,来看看人工智能时代爆发的 Python。 在这里先不告诉你 Python 是“最好的编程语言”(无论什么意思)。言归正传,我们到底该不该选择 Python?...(2016-04-07 13:49:32)

本文我们将对高斯过程回归模型给出基本介绍,研究的重点在于理解随机过程的含义和如何用它去定义一个分布函数,同时提出了一个简单的方程,它可以结合训练数据并应用边缘概率密度来学习超参数。本文阐述了高斯过程的实际应用优势,并证明高斯过程是适合当前时代趋势的。以回归(对于连续输出)和分类(对于离散输出)形式的 ...(2018-07-14 23:11:46)

过拟合 通俗一点地来说过拟合就是模型把数据学习的太彻底,以至于把噪声数据的特征也学习到了,这样就会导致在后期测试的时候不能够很好地识别数据,即不能正确的分类,模型泛化能力太差。例如下面的例子。 上面左图表示size和prize的关系,我们学习到的模型曲线如右图所示 ...(2017-11-02 16:58:31)

//样本数据 编号,色泽,根蒂,敲声,纹理,脐部,触感,密度,含糖率,好瓜 1,青绿,蜷缩,浊响,清晰,凹陷,硬滑,0.697,0.46,是 2,乌黑,蜷缩,沉闷,清晰,凹陷,硬滑,0.774,0.376,是 3,乌黑,蜷缩,浊响,清晰,凹陷,硬滑,0.634,0.264,是 4,青 ...(2017-07-30 14:29:30)

大数据训练 ...(2017-08-30 10:59:12)

机器学习的一个前提是有大量的数据,机器学习的过程就是对这些大量数据进行学习训练,获得一个能用于预测的模型,从而在面对新的数据时,我们能进行准确的预测。 怎么理解呢? 回想我们读高三的时候,是不是每天都在做题,为最后的高考做准备。我们从题库中不断学习,不断做题,然后就掌握了各种知识和一些解题方法, ...(2017-04-22 11:31:48)

导语在笔者的上一篇文章中[1],使用了 k-NN 算法来识别手写字数据集,它的缺点是浪费存储空间且执行效率低。本文将使用决策树算法来解决同样的问题。相对 k-NN 算法,它更节约存储空间且执行效率更高。更重要的是,实施决策树算法的过程将训练算法并得到知识 —— 这是开发机器学习程序的一般步骤。一旦理 ...(2017-12-25 00:00:00)

1.损失函数后面的epoch中出现剧烈的抖动,如下图所示,说明你的学习率在此时比较高,需要进行学习率的衰减。 2.损失函数在刚开的时候抖动,并且随着epoch的增加损失函数保持在一定的范围内,说明你的学习率比较大。 3.损失函数减少的比较缓慢,说明你的学习率比较小。 有关学习率的影响具体如 ...(2018-07-12 15:13:04)

在postgresql中使用Madlib训练机器学习模型 前段时间做数据课的开放性project,从链家上爬了些上海地区二手房的数据,想预估下二手房价格。因为要求用到postgresql\greenplum的特性,正好Madlib使得可以在数据库中直接使用SQL语句训练模型,就用它了。关于Mad ...(2018-01-30 15:57:10)

1、pandas读取csv neg_data = pd.read_csv('negative.csv') 2、查看前10行数据 neg_data.head(10) 3、查看数据的长度 len(neg_data) 4、删除某些列,需使用axis=1指定删除的对象是列(axis=0指 ...(2018-07-15 11:06:16)

防止过拟合的一些方法 L1 loss 在loss function中添加模型权重参数的绝对值和,用超参数αα\alpha调节L1 loss在整体loss function中占的比例。 Lnew=Lold+α∑|w|Lnew=Lold+α∑|w|{L_{new}} = {L_{old}} ...(2018-08-20 23:32:59)