热门好课推荐
猜你喜欢
相关培训 相关博客
  • 您也可以查看这篇文章的英语和日语版本。用于机器学习的开放数据集有哪些呢?Gengo团队为高质量的数据集创建了一份最终备忘单。这些高质量的数据集或者涵盖范围广泛(比如Kaggle的lookingat系列),或者非常细化(比如自动驾驶汽车的数据)。首先,在搜索数据集时要记住几点。Dataquest是这么说的:数据集不应脏乱,这样就无需花太多时间来清洗数据。数据集不应包含太多的...
    2018-10-19 09:53:55
    阅读量:682
    评论:0
  • 机器学习里有一句名言:数据和特征决定了机器学习的上限,而模型和算法的应用只是让我们逼近这个上限。这个说法形象且深刻的提出前期数据处理和特征分析的重要性。这一点从我们往往用整个数据挖掘全流程60%以上的时间和精力去做建模前期的数据处理和特征分析也能看出。那么疑问来了,这超过60%时间和精力我们都用在哪了?本文基于以往的知识储备以及实际的项目经验,我做一个总结。主要包括三部分,一是获取数据、数据抽样,二是数据探索,三是数据预处理与清洗。
    2017-11-30 11:58:11
    阅读量:9219
    评论:3
  • 最强数据集集合:50个最佳机器学习公共数据集 https://mp.weixin.qq.com/s/_A71fTgwSyaW5XTAySIGOA 原作mlmemoirs 郭一璞编译 量子位报道|公众号QbitAI外国自媒体mlmemoirs根据github、福布斯、CMU官网等信息,整理了一张50个最佳机器学习公共数据集的榜单,为大家分享一下~提前说两个须知:...
    2018-11-08 09:13:57
    阅读量:2177
    评论:0
  • 引言在大多数非计算机专业人士以及部分计算机专业背景人士眼中,机器学习(DataMining)以及数据挖掘(MachineLearning)是两个高深的领域。在笔者看来,这是一种过高”瞻仰“的习惯性错误理解(在这里我加了好多定语)。事实上,这两个领域与计算机其他领域一样都是在融汇理论和实践的过程中不断熟练和深入,不同之处仅在于渗透了更多的数学知识(主要是统计学),在后面的文章中我会努力将这些数学知
    2015-08-17 22:17:41
    阅读量:23719
    评论:1
  • 本文首发于微调的知乎专栏「数据说」。机器学习中最值得问的一个问题是,到底需要多少数据才可以得到一个较好的模型?从理论角度,有Probablyapproximatelycorrect(PAC)learningtheory来描述在何种情况下,可以得到一个近似正确的模型。但从实用角度看,PAC的使用范围还是比较局限的。所以今天我们主要想讨论一个问题:到底如何定义有效数据量。1.数...
    2018-09-16 10:01:41
    阅读量:777
    评论:0
  • 之前朋友参加比赛,想用python做一个全美所有股票的涨幅走势分析,今天我就用分析苹果股票的例子手把手的教大家上手练习苹果股票涨跌图的绘制,至于更专业一点的,还是交给金融方面的大牛来分析吧,我实在看不懂股票~还是像之前一样,我们得把机器学习的库引入进jupyter,不得不说jupyter是真心好用,敲一行代码,就能看到一行结果,以至于后面不会忘记每个变量的属性,真是居家旅行必备神器。i...
    2018-06-15 18:26:31
    阅读量:5430
    评论:0
  • 在机器学习中,寻找数据集也是非常重要的一步。质量高或者相关性高的数据集对模型的训练是非常有帮助的。 那么用于机器学习的开放数据集有哪些呢?文摘菌给大家推荐一份高质量的数据集,这些数据集或者涵盖范围广泛(比如Kaggle),或者非常细化(比如自动驾驶汽车的数据)。 首先,在搜索数据集时,在卡内基·梅隆大学有以下说法:数据集不应混乱,因为你不希望花费大量时间清理数据。 数据集不...
    2018-10-25 13:49:36
    阅读量:480
    评论:0
  • 用机器学习的模型预测沪深300个股第二天走势,具体思路和每天预测结果都会在这个公众号下面更新,欢迎有兴趣的同学一起来看看~有啥疑问和想法也欢迎留言~...
    2018-09-26 16:47:01
    阅读量:885
    评论:0
  •  亚马逊AWS高级技术顾问WillBadr介绍了8种寻找机器学习数据集的方法1、Kaggle数据集 Kaggle的数据集中,包含了用于各种任务,不同规模的真实数据集,而且有许多不同的格式。此外,你还可以在这里找到与每个数据集相关联的交互式笔记本Kernels,这些笔记本能够在浏览器中运行。在这里,每个数据集都是一个小的交流社区,可以讨论数据,寻找一些公开的代码,或者在Kern...
    2019-01-21 14:54:40
    阅读量:632
    评论:0