热门好课推荐
猜你喜欢
相关培训 相关博客
  • 大数据:大数据(bigdata),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Vel...
    2019-06-05 14:12:59
    阅读量:380
    评论:0
  • 知乎专栏https://dataquestion.com/ ============================================================欢迎关注公众号:程序员面试经验分享(jobbible)
    2018-03-16 15:33:22
    阅读量:1254
    评论:0
  • 鉴于本小弱非数据挖掘出身,只是在coursera上跟过Ng的机器学习,估计最后做一个regression再上一个协同过滤就到极限了,就不去争名次了。写一些stepbystep的入门东西,帮助感兴趣的新手快速入手,希望大家可以快速的参与进比赛来,如果真的有帮助到某个同学的话,那就苟富贵勿相忘了。首先扫一眼数据发现时间那一列居然是中文,先转成可处理的日期格式,就假设数据是13年的好了。
    2014-04-12 09:06:21
    阅读量:7451
    评论:2
  • 鉴于本小弱非数据挖掘出身,只是在coursera上跟过Ng的机器学习,估计最后做一个regression再上一个协同过滤就到极限了,就不去争名次了。写一些stepbystep的入门东西,帮助感兴趣的新手快速入手,希望大家可以快速的参与进比赛来,如果真的有帮助到某个同学的话,那就苟富贵勿相忘了。首先扫一眼数据发现时间那一列居然是中文,先转成可处理的日期格式,就假设数据是13年的好了。
    2014-03-17 10:42:36
    阅读量:1003
    评论:0
  • 新一代大数据处理引擎ApacheFlink:https://www.ibm.com/developerworks/cn/opensource/os-cn-apache-flink/index.html 
    2018-10-07 21:04:43
    阅读量:542
    评论:0
  • 本文旨在为普通程序员(Java程序员最佳)提供一个入门级别的大数据技术学习路径,不适用于大数据工程师的进阶学习,也不适用于零编程基础的同学。前言:一、背景介绍 二、大数据介绍正文:一、大数据相关的工作介绍 二、大数据工程师的技能要求 三、大数据学习规划 四、持续学习资源推荐(书籍,博客,网站) 五、项目案例分析(批处理+实时处理)前言一、背景介绍本人目前是一名大数...
    2018-09-13 11:03:50
    阅读量:1956
    评论:1
  • HORTONWORKSNEXT-GENDATAPLATFORMSANDSOLUTIONSTheHortonworksglobaldatamanagementsolutionsenableorganizationstoimplementtheirnext-genmoderndataarchitectures.Poweredandbuilt
    2018-01-12 17:16:31
    阅读量:230
    评论:0
  • 一:大数据软件框架结构概括1.Hadoopa.hadoop内核b.mapreduce:为大数据提供计算(批处理计算框架)c.hdfs:分布式文件系统,为大数据提供存储。d.Hadoopyarn:集群资源管理器,负责集群的资源管理e.HBase:nosql数据库f.数据仓库工具Hiveg.pig工作流语言h.机器学习算法库mahouti:zookeeper:是一个集中式服务,主...
    2019-05-27 23:59:54
    阅读量:24
    评论:0
  • 看看下图,大数据有哪些工具以及具体作用:在存储上,hdfs的分布式存储可以任意水平扩展,可以解决数据存储的难题。在计算上,从最初的MapReduce,把任务水平拆分,多台机器并行计算,再汇总结果;到基于Spark的内存计算,改造Mapreduce每次数据落盘以及编程方式的痛点。有了存储和计算框架,周边就衍生出了很多管理、缓存相关的技术,比如:yarn解决多租户资源调度的难题,flume解决数据传输...
    2018-03-22 09:53:22
    阅读量:102
    评论:0
  • 大数据是用scala语言,和java有些不同又比java强大,省去了很多繁琐的东西,scala中的的接口用trait来定义,不同于java的接口,trait中可以有抽象方法也可以有不抽象方法。scala中的方法中还可以定义方法,这在java中是从来没有的。大数据未来几年发展的重点方向,大数据战略已经在十八届五中全会上作为重点战略方向,中国在大数据方面才刚刚起步,但是在美国已经产生了上千亿的
    2015-12-30 20:36:27
    阅读量:130
    评论:0