首页 > 大数据学习名词

大数据学习名词 共找到479条结果

  • SparkScalar使用scalar两个主要接口:他提供了最为完整的Spark接口,而且得益于JVM带来的性能优势,在生产环境大部分部署的大部分应用都适用Scalar。大数据当我们使用普通R语言和p
    2019-03-09
    阅读量:53052
    评论:5
  • ActiveMQ是Apache出品,最流行的,能力强劲的开源消息总线。 Dubbo是阿里巴巴公司开源的一个高性能优秀的服务框架,使得应用可通过高性能的RPC实现服务的输出和输入功能,可以和Spri
    2018-05-07
    阅读量:25804
    评论:1
  • 总结:hdfs:文件系统底层,不是什么软件,hbase(非结构化数据存储的数据库)=mapreduce+hdfs,hive-pig:(上层抽象,可以SQL查询),zookeeper:服务容错,sqoo
    2018-05-11
    阅读量:175
    评论:0
  • Hadoop是一个由Apache基金会所开发的分布式系统基础架构。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供
    2016-05-26
    阅读量:47804
    评论:1
  • /***author:冶秀刚*mail:dennyy99@gmail.com*/Shuffle过程是MapReduce的核心,也被称为奇迹发生的地方。要想理解MapReduce,Shuffle是必须要
    2017-03-28
    阅读量:60225
    评论:5
  • TF(TermFrequency)表示某个关键词在整篇文章中出现的频率。IDF(InversDocumentFrequency)表示计算倒文本频率。文本频率是指某个关键词在整个语料所有文章中出现的次数
    2018-06-26
    阅读量:110764
    评论:15
  • 知乎专栏https://dataquestion.com/ ============================================================欢迎关注公众号:程序
    2018-03-16
    阅读量:17113
    评论:3
  • 新一代大数据处理引擎ApacheFlink:https://www.ibm.com/developerworks/cn/opensource/os-cn-apache-flink/index.html
    2018-10-07
    阅读量:338996
    评论:29
  • 本文旨在为普通程序员(Java程序员最佳)提供一个入门级别的大数据技术学习路径,不适用于大数据工程师的进阶学习,也不适用于零编程基础的同学。前言:一、背景介绍 二、大数据介绍正文:一、大数据相关的工作
    2018-09-13
    阅读量:301253
    评论:16