热门好课推荐
猜你喜欢
相关培训 相关博客
  • 原文地址:http://blog.sina.com.cn/s/blog_55ba8b4601012ken.html第一部分、十道海量数据处理面试题1、海量日志数据,提取出某日访问百度次数最多的那个IP。首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为10
    2015-12-30 18:40:39
    阅读量:1896
    评论:0
  • 第一部分、十道海量数据处理面试题1、海量日志数据,提取出某日访问百度次数最多的那个IP。首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大的几
    2016-03-23 17:34:16
    阅读量:290
    评论:0
  • https://wizardforcel.gitbooks.io/the-art-of-programming-by-july/content/06.03.html分而治之问题1:有10个文件,每个文件1G,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求你按照query的频度排序,求TopK解决:hash映射顺序读取10个文件,按照hash(query)%10的
    2016-08-03 21:10:38
    阅读量:511
    评论:0
  • 转载于:https://www.cnblogs.com/alexhjl/p/7762606.html
    2017-10-31 17:22:00
    阅读量:19
    评论:0
  • 在浏览器中基于地图构建应用已经是很广泛的业务需求,随着大数据在地图可视化中的出现,我们遇到了不小的挑战。用户会拿出十万甚至百万数量级的数据,正如您所想象的,在显示此数量的地理编码信息方面存在着一些技术上的难题。一个难题是确保数据以一种有意义且对最终用户可操作的方式准确地呈现;另一个是因为信息的数量使得它在浏览器上产生了巨大负载,需要花长时间才可以看到的结果。为了寻找最佳解决方案,我们测试了各种...
    2018-09-03 15:40:33
    阅读量:4538
    评论:1
  • 爱奇艺实时流处理项目实战(SparkStreaming):http://edu.51cto.com/course/11860.html?source=soSpark从入门到精通:https://edu.csdn.net/course/play/3302/55279Scala从入门到精通:https://edu.csdn.net/course/play/3301  ...
    2018-07-18 00:49:54
    阅读量:2053
    评论:0
  • http://www.dajiangtai.com/course/list.do?=qq1209xx
    2015-12-14 14:27:26
    阅读量:463
    评论:0
  • youtube上关于大数据学习的视频:https://www.youtube.com/user/bobzeng1228/playlists至于怎么观看youtube上的视频,要先翻那啥的说:http://www.getssin.com/in/ph76i2lrut ...
    2018-12-01 21:49:01
    阅读量:399
    评论:0
  • 1、Hadoop—Spark企业应用实战强烈推荐版视频教程 链接: https://pan.baidu.com/s/1F082k-5oME38T-L8_AJn5g 密码:kfm7 2、Hadoop+Storm+Spark入门进阶实战视频教程链接: https://pan.baidu.com/s/1qZpoILm 密码:xtmb 3、Hadoop大数据工程师零基础入门进阶...
    2018-08-29 09:10:35
    阅读量:1287
    评论:1