-
总结如下:必须技能10条:01.Java高级(虚拟机、并发)02.Linux 基本操作03.Hadoop(此处为侠义概念单指HDFS+MapReduce+Yarn )04.HBase(JavaAPI操作+Phoenix )05.Hive(Hql基本操作和原理理解)06.Kafka 07.Storm08.Scala需要09.Python10.Spark (Core+sparksql+Spark st...
2018-04-04 09:34:49
- 阅读量:1199
- 评论:0
-
作者:清华大学数据科学研究院链接:https://www.zhihu.com/question/24761255/answer/228009507来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。Coursera全球顶尖的在线学习网站,由业内极具学术造诣及分享精神的大咖创办。Coursera上的课程相对比较基础,应该是“小白”起飞最好的平台,在这里推荐吴
2018-01-08 01:33:28
- 阅读量:435
- 评论:0
-
目前大数据行业异常火爆,不少人都对大数据充满了兴趣,其中有大部分人都是之前没有接触过计算机技术的,对编程语言也不太了解,那是不是这部分零基础的朋友就学不了大数据了呢?答案当然是否定的。大数据学习并不是高深莫测的,虽然它并没有多简单,但是通过努力,零基础的朋友也是完全可以掌握大数据的。推荐一个大数据学习群 119599574每天晚上20:10都有一节【免费的】大数据直播课程,专注大数据分析方法,...
2018-08-20 11:09:00
- 阅读量:931
- 评论:0
-
前言概括1 学习语言2 工具:数据挖掘,数据科学和可视化软件3 教科书4 教育:网络研讨会,课程,证书和学位5 数据6 比赛7 互动:会议,团体和社交网络more前言最近一直一再学习数据挖掘的相关知识,这是一篇国外的文章,我添加了自己的一些理解,大概的翻译过来,供大家一起学习参考。概括语言:学习R,Python和SQL 工具:了解如何使用数据挖掘...
2018-04-06 11:29:43
- 阅读量:7086
- 评论:0
-
大数据时代处理数据理念的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。大数据时代处理数据理念的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。大数据处理的流程 具体的大数据处理方法确实有很多,但是根据笔者长时间的实践,总结了一个普遍适用的大数据处理流程,并且这个流程应该能够对大家理顺大数据的处理有所帮助。整个处理流程可以概括为四步,分别是采集、导入...
2019-06-12 21:59:41
- 阅读量:1315
- 评论:0
-
首先这个文章是转载的,留着后面基础再扎实一点之后开始学习,感谢原文的作者,写出了如此清晰的学习路线。原文作者文章链接:https://blog.csdn.net/gitchat/article/details/78341484【不要错过文末彩蛋】申明:本文旨在为普通程序员(Java程序员最佳)提供一个入门级别的大数据技术学习路径,不适用于大数据工程师的进阶学习,也不适用于零编程基础的同...
2018-07-19 15:17:43
- 阅读量:21412
- 评论:11
-
大数据学习路线java(Javase,javaweb)Linux(shell,高并发架构,lucene,solr)Hadoop(Hadoop,HDFS,Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume)机器学习(R,mahout)Storm(Storm,kafka,redis)Spark(scala,spark,sparkcore,s...
2018-01-05 20:15:06
- 阅读量:56500
- 评论:25
-
本文梳理了学习大数据挖掘分析的思路和步骤,为大家提供了一些参考,希望能对大家有所帮助。最近,很多人都咨询过,想学大数据,但不知道怎么开始,在哪里开始学习,需要学什么东西?对于初学者来说,学习大数据挖掘分析的逻辑是什么?本文从0开始梳理如何学习大数据挖掘分析和学习步骤,并给出一个学习建议。希望可以帮助到大家很多人认为数据挖掘需要掌握复杂、深刻的算法,掌握数据挖掘技术和分析技术是很有必要的。如果你钻研...
2018-05-04 21:25:54
- 阅读量:4252
- 评论:0
-
大数据采集01—概览02—相关延展系统日志数据的采集 Scribe是Facebook开源的日志收集系统,在Facebook内部已经得到大量的应用。它够从各种日志源上收集日志,存储到一个中央存储系统上,以便于进行集中的统计分析处理。 Scribe为日志的“分布式收集,统一处理”提供了一个可扩展的、高容错的方案。(老师收学生信息表,需要班长代理收集的例子)。...
2019-02-27 17:21:39
- 阅读量:1522
- 评论:0
-
想学大数据,先搭个环境再说,要准备多少台服务器,每台服务器的基础环境设置,各个服务器的网络互联,真是很麻烦的一件事 第一座山先把想入门的学习者挡在门外,别放弃,这里又一个即全面又快捷的搭建大数据环境的方法,排除下载软件的时间,只需要5分钟,就可以拥有一个自己的大数据环境,包括绝大部分大数据生态环境的各个组建,完美得不能再完美。 只需按照以下步骤进行: 一、下载并安装ora...
2018-06-15 11:05:26
- 阅读量:4247
- 评论:0