热门好课推荐
猜你喜欢
相关培训 相关博客
  • 在前期搭建好spark、scala平台和学习基于python的logistic流式机器学习例程后,这一周正式基于spark做一个基于logistic的流式机器学习的实现。一、sparkstreaming例程首先尝试sparkstreaming指导手册中自带的例程(链接http://spark.apache.org/docs/latest/streaming-programming-
    2014-07-22 09:19:13
    阅读量:2931
    评论:3
  • 今天来和大家聊一下如何使用SparkSQL进行流式数据的机器学习处理。本文主要分为以下几个章节:什么是流式机器学习机器学习模型获取途径系统演示1.什么是流式机器学习通常,当我们听到有人提到实时数据机器学习时,其实他们是讨论:他们希望有一个模型,...
    2019-07-03 16:30:00
    阅读量:4
    评论:0
  • 流式数据处理的应用场景,包括基本概念和处理方式;也介绍了流式处理系统常见的编程模型和框架,最后介绍了流式数据处理的一些优化方法。原文https://www.slidestalk.com/s/TRabl_StreamProcessing156383...
    2018-11-01 14:23:32
    阅读量:363
    评论:0
  • 一些些背景其实技术总在更新,做这个行业也是一直要走在学习并适应的路上,这也是人工智能领域最吸引我的地方,其实基础的理论是不变的,但是随着业务的发展,计算能力的发展,上层的实现总是在迭代,今天讲下我对于流计算的一些认知。先聊下计算引擎的进化,随手画了上面的图。其实第一代分布式计算引擎是Hadoop,这是一个跨时代的创造,人们使用Hadoop的MapReduce框架实现了许多的算法,这些算法也发...
    2018-09-18 09:38:36
    阅读量:2521
    评论:0
  • 今天开始记录spark中机器学习的相关应用。spark某种意义上讲就是为机器学习准备的,其一,spark是一种内存计算框架,速度快,其二,spark更擅长处理迭代式的数据计算,而迭代运算这是机器学习模型经常遇到的。延申一点,目前大数据还有一种是流式运算,也就是处理的是实时数据,虽然这种spark也可以,但是毕竟是一种伪造的流式。所以更多时候spark是处理离线的、迭代式的运算。spark里面目...
    2018-12-01 09:29:46
    阅读量:580
    评论:0
  • 作者:张夏天,TalkingData首席数据科学家。12年大规模机器学习和数据挖掘经验,对推荐系统、计算广告、大规模机器学习算法并行化、流式机器学习算法有很深的造诣;在国际顶级会议和期刊上发表论文12篇,申请专利9项;前IBM CRL、腾讯、华为诺亚方舟实验室数据科学家;KDD2015、DSS2016国际会议主题演讲;机器学习开源项目Dice创始人。 欢迎技术投稿、约稿、给文章纠错,请...
    2016-12-19 13:45:43
    阅读量:245
    评论:0
  • 下面,您将找到一个由用户组织的数据科学和机器学习免费数据集的策划列表。您将找到精选的数据集和我们最喜欢的聚合器。目录探索性分析的数据集通用机器学习的数据集深度学习数据集自然语言处理的数据集云计算机学习的数据集时间序列分析的数据集推荐系统的数据集特定行业的数据集流式传输的数据集WebScraping的数据集当前事件的数据集 探索性分析的数...
    2018-07-27 15:24:15
    阅读量:3734
    评论:0
  • 第六周.学习曲线、机器学习系统的设计Learning Curve and Machine Learning System Design关键词          学习曲线、偏差方差诊断法、误差分析、机器学习系统的数值评估、大数据原理概要         本周内容分为两讲:         第一讲.Advice for applying machine learning,主要内
    2016-01-22 21:29:28
    阅读量:6390
    评论:0
  • 作者:张夏天,TalkingData首席数据科学家。12年大规模机器学习和数据挖掘经验,对推荐系统、计算广告、大规模机器学习算法并行化、流式机器学习算法有很深的造诣;在国际顶级会议和期刊上发表论文12篇,申请专利9项;前IBMCRL、腾讯、华为诺亚方舟实验室数据科学家;KDD2015、DSS2016国际会议主题演讲;机器学习开源项目Dice创始人。欢迎人工智能技术投稿、约稿、给文章...
    2017-01-06 12:52:09
    阅读量:374
    评论:0
  • 轻量级大规模机器学习算法库Fregata开源:快速,无需调参 http://geek.csdn.net/news/detail/129806作者:张夏天,TalkingData首席数据科学家。12年大规模机器学习和数据挖掘经验,对推荐系统、计算广告、大规模机器学习算法并行化、流式机器学习算法有很深的造诣;在国际顶级会议和期刊上发表论文12篇,申请专利9项;前IBM CRL、腾讯、华为诺亚方舟实验室
    2016-12-28 19:50:13
    阅读量:279
    评论:0