热门好课推荐
猜你喜欢
相关培训 相关博客
  • 从2017年开始,人工智能便波澜不断,无论是从BAT高调布局AI,还是从年薪50万招聘AI应届生,炽手可热形容AI工程师一点都不过分。 百度推出“少帅计划”,针对30岁以下的深度学习科学家,开出100万以上年薪! 阿里巴巴对外宣布将通过校园招聘组建一支规模达数百人的NASA“青年军”! 华为更是开出200万年薪招聘应届毕业生,其专业均为最前沿的人工智能领域 机器学习...
    2019-11-21 17:49:53
    阅读量:186
    评论:0
  • 原文地址:http://tech.meituan.com/machinelearning-data-feature-process.html背景随着美团交易规模的逐步增大,积累下来的业务数据和交易数据越来越多,这些数据是美团做为一个团购平台最宝贵的财富。通过对这些数据的分析和挖掘,不仅能给美团业务发展方向提供决策支持,也为业务的迭代指明了方向。目前在美团的团购系统中大量
    2015-02-14 16:16:24
    阅读量:783
    评论:0
  • 【简明扼要地归纳了机器学习模型的容量的含义与影响,全文共2267字,阅读约15分钟】本文我们来简明扼要地探讨机器学习中模型的容量(capacity)。我会收录于我的专栏《深度学习精髓与细节知识合集》中,由于平时比较忙,此专栏也将陆续(缓慢)地记录研究或实践中一点一滴的灵感。通俗地讲,模型的容量是指它拟合各种函数的能力。比如,模型是3次多项式构成的函数:,其中权重w和偏置b的含义大家应该都很...
    2019-01-06 21:53:52
    阅读量:1661
    评论:1
  • 应用机器学习过程中的建议本文源自在Coursera平台学习machine learning 过程中的一些记录在评价一个机器学习模型时,当你发现你的模型在测试集上的预测性能非常差时,通常有一下解决办法: - 增加训练集样本量; - 减少输入特征变量数目; - 增加额外的特征变量; - 增加多项式特征变量; - 增大或降低lambda值;要评价一个模型,一般可以采用70%的数据量做训练集,另外
    2017-08-12 17:14:39
    阅读量:355
    评论:1
  • 在机器学习中,我们训练了一个模型,可能会发现这个模型得到的数据与实际数据偏差太大。这时,通常我们会在如下办法中选择去优化我们的算法: 得到更多的训练集; 减小特征的数目; 尝试去增加特征; 增加多项式; 增大 λ; 减小 λ。 以上这些步骤通常会花费你大量的时间,而且毫无目的地选择很可能会没有效果。为了防止以上的事情发...
    2019-03-17 17:31:49
    阅读量:101
    评论:0
  • Advice for Applying Machine Learning 我这里想做的是,确保大家在设计机器学习系统时,能够明白怎样选择一条最合适、最正确的路径。因此,接下来我们要讨论一些实用的建议和指导,帮助大家明白怎样进行选择。具体来说,我们将重点关注的问题是,加入我们正在开发一个机器学习系统,或者想试着改进一个机器学习系统的性能,我们应该如何决定接下来应该要做的事情。 E...
    2018-11-23 22:34:02
    阅读量:2594
    评论:0
  • 机器学习中的数据清洗与特征处理综述背景随着美团交易规模的逐步增大,积累下来的业务数据和交易数据越来越多,这些数据是美团做为一个团购平台最宝贵的财富。通过对这些数据的分析和挖掘,不仅能给美团业务发展方向提供决策支持,也为业务的迭代指明了方向。目前在美团的团购系统中大量地应用到了机器学习和数据挖掘技术,例如个性化推荐、筛选排序、搜索排序、用户建模等等,为公司创造了巨大的价值。本文主要介...
    2017-09-12 20:00:53
    阅读量:2621
    评论:0
  • #Large scale machine learning(大规模机器学习)即处理大数据集的算法。#Learning with large datasets(学习大数据集)在需要训练大量模型时,预先检查往往是个明智的选择; 使用一个非常小的训练集的效果可能相同。它也是绘制学习曲线的常用方法; 右者即使训练集增大,效果也不会更好。应该添加额外的特征项或在神经网络中添加额...
    2019-03-12 15:56:05
    阅读量:60
    评论:1
  • 关于偏差、方差以及学习曲线为代表的诊断法: 在评估假设函数时,我们习惯将整个样本按照6:2:2的比例分割:60%训练集training set、20%交叉验证集cross validation set、20%测试集test set,分别用于拟合假设函数、模型选择和预测。 模型选择的方法为: 1. 使用训练集训练出 10 个模型 2. 用 10 个模型分别对交叉验证集计算得出交叉验证误差(代价
    2017-11-24 21:02:12
    阅读量:1264
    评论:0
  • 1.名词解释泛化能力:泛化能力(generalization ability)是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据背后的规律,对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出,该能力称为泛化能力。过拟合:过拟合是指为了得到一致假设而使假设变得过度严格。避免过拟合是分类器设计中的一个核心任务。通常采用增大数据量和测试样本集的方法对分类器...
    2019-09-05 09:17:00
    阅读量:27
    评论:0