热门好课推荐
猜你喜欢
相关培训 相关博客
  • 链接:https://pan.baidu.com/s/1MPrjPajoIzoIuCqdhJUkTQ密码:5s1f**相关截图:image
    2018-10-23 15:09:00
    阅读量:26
    评论:0
  • //2014年3月16日纪念一下,在阿里巴巴大数据竞赛中初步成绩为第66名,继续努力!(MEE队,电子科技大学)
    2014-03-16 13:35:08
    阅读量:819
    评论:0
  • 转载于:https://www.cnblogs.com/alexhjl/p/7762606.html
    2017-10-31 17:22:00
    阅读量:12
    评论:0
  • ps:这本书主讲阿里的大数据体系架构方案,从底层到高层阐述,目前对我来说此书的难度较大,不是很懂,大部分为对原书的引用归纳总结,我会给出相应的大牛的关于此书的读书笔记的传送门供参考。以下为大牛关于本书的读书笔记供参考:读书笔记传送门https://www.jianshu.com/p/69dbf35713ad此书下载传送门http://www.java1234.com/a/javabook/yun/...
    2018-06-07 22:23:49
    阅读量:1689
    评论:0
  • 第1章总述阿里巴巴大数据系统体系主要分为,数据采集、数据计算、数据服务和数据应用四大层次。数据采集工具:web端、App端、H5数据计算层:数据存储、云计算平台(离线计算平台、实时计算平台、数据整合管理体系ONEDATA)数据服务层:以数据仓库整合计算好的数据作为数据源,对外通过接口的方式提供数据服务,主要提供简单数据查询服务,复杂数据查询服务和实时数据推送服务三大特色数据服务。数据...
    2019-03-31 14:52:32
    阅读量:50
    评论:0
  • 阿里巴巴大数据系统架构图:Aplus.JS是web端日志采集技术UserTask是APP端日志采集技术TimeTunel(TT)是一个消息队列DataX是一个数据同步工具,将下层的不同的DB兼容在一起MaxCompute是离线计算平台StreamCompute是实时计算平台OneData是数据整理和管理的体系和工具,构建统一、规范、可共享的全栈数据体系,避免数据的冗余和重复建设,...
    2019-01-20 21:46:03
    阅读量:459
    评论:0
  • 一、总述人类正在从IT时代走向DT时代。现在的数据呈爆炸式增长,其潜在的巨大价值有待发掘。但是如果不对数据进行有序、有结构的分类组织和存储,它将变成一场灾难。在阿里内部,数据的存储达到EB级别。这些给数据采集、存储、计算都带来了极大的挑战。随着数阿里内部数据量的剧增,以及日益丰富的业态,这些都给大数据系统的构建提供了更复杂的要求。本书介绍的阿里巴巴大数据系统架构,就是为了满足不断变化的业务...
    2019-03-19 16:52:43
    阅读量:175
    评论:0
  • 日志采集的挑战数据采集面临的主要挑战已不是日志采集技术本身,而是如何实现日志数据的结构化和规范化组织,实现更为高效的下游统计计算,提供符合业务特性的数据展现,以及为算法提供更便捷、灵活的支持等方面。规范制定——元数据注册——日志采集——自动化计算——可视化展现3、数据同步3.1数据同步方式直连同步、数据文件同步、数据库日志解析同步直连同步直连同...
    2019-03-04 14:26:00
    阅读量:5
    评论:0
  • 今天继续谈阿里的这本书,包括数据服务平台、数据挖掘平台、数据建模、数据管理及数据应用,希望于你有启示。1、数据服务平台数据服务平台可以叫数据开放平台,数据部门产出海量数据,如何能方便高效地开放出去,是我们一直要解决的难题,在没有数据服务的年代,阿里的数据开放的方式简单、粗暴,一般是直接将数据导出给对方,我想,现在大多公司的开放应该也是如此吧,虽然PaaS喊...
    2018-07-26 15:37:00
    阅读量:21
    评论:0