热门好课推荐
猜你喜欢
相关培训 相关博客
  • 大数据是目前一个非常活跃的研究领域。由于大数据的海量、复杂多样、变化快的特性,对于大数据环境下的应用问题,传统的在小数据上的机器学习算法很多都不再适用。将大数据应用在机器学习和模式识别中,可以在进行学习和分类时大大提升决策的数据信息,因此,研究大数据下的机器学习算法成为学术界和产业界的研究趋势。本文主要介绍和总结当前大数据下机器学习和模式识别算法的分析与应用。
    2017-01-02 18:42:37
    阅读量:11743
    评论:1
  • 机器学习中稳定性风险  参考资料:如何看待机器学习中的”“稳定性”“?2017-12-07阿萨姆AI研习社1.下溢(Underflow)和上溢(Overflow)  属于计算稳定性。顾名思义,溢出是代表内容超过了容器的极限。在机器学习当中,因为我们大量的使用概率(Probability),而概率的区间往往在0至1之间,这就导致了下溢发生的可能性大大提高。  举个简单的例子,我们...
    2018-08-01 16:02:17
    阅读量:560
    评论:0
  • 概述在做机器学习的过程中,可视化能帮助我们了解模型训练状态,评估模型效果,还能了解数据,帮助我们了解算法模型,改善模型,在论文中好的可视化也是大大加分的~下面我总结了一下我在做机器学习时候常用的可视化。这篇博文会不断更新,目前水平有限,欢迎小伙伴们补充与指正!!!降维可视化通过PCA、LDA或SVD矩阵分解,将高纬数据转换为2维,便于可视化查看数据分布,了解数据特性。...
    2019-03-16 22:19:59
    阅读量:218
    评论:0
  • 关于特征工程(FeatureEngineering),已经是很古老很常见的话题了,坊间常说:“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已”。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。纵观Kaggle、KDD等国内外大大小小的比赛,每个竞赛的冠军其实并没有用到很高深的算法,大多数都是在特征工程这个环节做出了出色的工作
    2016-06-24 09:12:11
    阅读量:16359
    评论:2
  • 分类算法是机器学习中的一个重点,也是人们常说的“有监督的学习”。这是一种利用一系列已知类别的样本来对模型进行训练调整分类器的参数,使其达到所要求性能的过程,也成为监督训练或有教师学习。注:本文中用到的Python及其模块安装教程参见支持向量机SVM支持向量机SVM是一种比较抽象的算法概念,全称是SupportVectorMachine,它可以用来做模式识别,分类或者回归的机...
    2018-04-18 20:13:12
    阅读量:698
    评论:0
  • 机器学习论文阅读(1):BatchNormalization使用背景:神经网络学习过程本质就是为了学习数据分布,一旦训练数据与测试数据的分布不同,那么网络的泛化能力也大大降低;另外一方面,一旦每批训练数据的分布各不相同(batch梯度下降),那么网络就要在每次迭代都去学习适应不同的分布,这样将会大大降低网络的训练速度,这也正是为什么我们需要对数据都要做一个归一化预处理的原因...
    2018-08-08 13:10:17
    阅读量:467
    评论:0
  • 我们知道,在机器学习的算法实现之前,我们首先要提取图像的特征,将图像变成一个个向量,只有这样,图像才能被计算机学习,准确说,只有从我们人类概念下的图像变成离散型的变量,然后给离散型的变量赋予具体的含义,这样才能够借助计算机来实现接下来的机器学习之类的工作,为了提高学习效率,我们依然可以学习一些图形学内处理的方式,这样就可以大大的提升开发效率,可以说,现在大部分的重复性工作在于前人故意的埋坑,这里就
    2017-10-13 16:16:22
    阅读量:6243
    评论:3
  • 引子这一篇关于机器自然语言应用和特征工程结合的文章,目的在于探讨特征工程的另一种可能性——解决特征稀疏或数据和模型异构场景下一种通用的解决方案。一种大大降低模型开发及数仓建设人力成本,同时提高模型精度的解决方案。在机器学习科研领域中,往往可以看到的是在规整及缺失率低特征的数据集下,固定的生产线解决一个特定的问题。
    2017-11-14 01:00:39
    阅读量:1105
    评论:0
  • 本文由携程技术中心投递,ID:ctriptech。作者:潘鹏举,携程酒店研发BI经理,负责酒店服务相关的业务建模工作,主要研究方向是用机器学习实现业务流程自动化、系统智能化、效率最优化,专注于算法实践和应用。我们经常会碰到一个问题:用了复杂的GBDT或者xgboost大大提升了模型效果,可是在上线的时候又犯难了,工程师说这个模型太复杂了,我没法上线,满足不了工程的要求,你帮我转换成LR吧,...
    2017-01-13 10:59:19
    阅读量:994
    评论:0