首页 > apache大数据学习

apache大数据学习 共找到494条结果

  • 知乎专栏https://dataquestion.com/ ============================================================欢迎关注公众号:程序
    2018-03-16
    阅读量:18340
    评论:4
  • 本文旨在为普通程序员(Java程序员最佳)提供一个入门级别的大数据技术学习路径,不适用于大数据工程师的进阶学习,也不适用于零编程基础的同学。前言:一、背景介绍 二、大数据介绍正文:一、大数据相关的工作
    2018-09-13
    阅读量:302437
    评论:15
  • 新一代大数据处理引擎ApacheFlink:https://www.ibm.com/developerworks/cn/opensource/os-cn-apache-flink/index.html
    2018-10-07
    阅读量:357604
    评论:27
  • 1、ApachePig 介绍ApachePigisaplatformforanalyzinglargedatasetsthatconsistsofahigh-levellanguageforexpre
    2016-09-12
    阅读量:24663
    评论:1
  • 1.Kafka是什么?它是一个分布式的消息队列,消息队列:生产者、消费者的功能。它提供了类似于JMS 的特性,但是在设计实现上完全不同,此外它并不是JMS规范的实现。2.Kafka的作用:这里我们简单
    2018-08-23
    阅读量:20129
    评论:4
  • 看看下图,大数据有哪些工具以及具体作用:在存储上,hdfs的分布式存储可以任意水平扩展,可以解决数据存储的难题。在计算上,从最初的MapReduce,把任务水平拆分,多台机器并行计算,再汇总结果;到基
    2018-03-22
    阅读量:419
    评论:0
  • 一:大数据软件框架结构概括1.Hadoopa.hadoop内核b.mapreduce:为大数据提供计算(批处理计算框架)c.hdfs:分布式文件系统,为大数据提供存储。d.Hadoopyarn:集群资
    2019-05-27
    阅读量:57
    评论:0
  • HORTONWORKSNEXT-GENDATAPLATFORMSANDSOLUTIONSTheHortonworksglobaldatamanagementsolutionsenableorganiz
    2018-01-12
    阅读量:1038038
    评论:94
  • 数据科学并没有一个独立的学科体系,统计学,机器学习,数据挖掘,数据库,分布式计算,云计算,信息可视化等技术或方法来对付数据。但从狭义上来看,我认为数据科学就是解决三个问题:datapre-proces
    2018-11-21
    阅读量:2919
    评论:2
  • 谁说大象不能跳舞Hadoop——轻松应对海量数据存储与分析海量数据:量,大,数据多,数据量到达PB,ZB级别,条目数达到上几十亿条百亿条1KB(Kilobyte 千字节)=1024B,1MB(Mega
    2018-03-15
    阅读量:102131
    评论:10