热门好课推荐
猜你喜欢
相关培训 相关博客
  • 炎炎夏日,为期3天的“云计算与大数据处理技术”正式开始。我有幸参加了学习,并有不小的收获。课程的前两天是大数据处理方面的学习,所讲的算法、技术也是围绕着云计算展开的。杨老师在大数据方面确实是非常深的造诣,他对分布式存储、hadoop云计算应用、MapReduce、GFS、HDFS等重要知识讲得很透。如chubby是系统设计(相当于选老大),Bigtable是系统架构。。。。。。当讲到Hadoop中...
    2018-06-26 09:14:16
    阅读量:605
    评论:0
  • 1.首先参考的博文为:EasyML快速入门 http://blog.csdn.net/lihuinihao/article/details/731888482.当然它翻译至EasyML的快速入门 https://github.com/ICT-BDA/EasyML/blob/master/QuickStart.md因为1中文博文百度云盘的版本还是1.0,而目前的版本已经是1.1版本了
    2018-01-24 16:14:49
    阅读量:1212
    评论:0
  • 介绍最近在查找关于中文分词解析方面的开源工具,最开始找到了腾讯的文智与百度的自然语言,这两个平台都是对外提供HTTP接口调用需要把数据传输过去返回解析结果。使用这种方式会有两种隐患:1.要确定网络情况;2.数据保密性;在此基础上找到了NLPIR分词系统,下面来介绍一下使用方式,这里使用NLPIR的基础上完成二次开发。环境jdk1.7-64/win7-64/myeclipse8.5NLP...
    2018-10-12 16:42:33
    阅读量:1297
    评论:0
  • 本课程主要讲解在实际项目开发中,企业构建大数据平台的方案及实战。详细阐述企业级大数据平台的架构设计、机器选型、集群规划、技术选型、资源规划等技术方案。实战演练基于ClouderaManager安装部署、监控管理、运营维护大数据平台的各个服务组件。从理论经验到实战演练,从设计思想到流程实施。...
    2018-06-08 10:09:37
    阅读量:227
    评论:2
  • 主讲老师冒老师为计算机博士,现在中科院从事科研教学工作,十余年机器学习教学经验,主持国家级科研项目3项,研究方向为机器学习、计算机视觉及多媒体处理。XGBoost是"极端梯度提升"(eXtremeGradientBoosting)的简称。XGBoost源于梯度提升框架,但是能并行计算、近似建树、对稀疏数据的有效处理以及内存使用优化,这使得XGBoost至少比现有梯度提升实现有至少10倍的速...
    2017-06-21 10:24:40
    阅读量:220
    评论:0
  • 为什么Hadoop需要工作流?工作流对Hadoop到底有哪些好处?Hadoop有哪些内置的工作流?Oozie和Azkaban到底有哪些区别?我该如何成功的安装并使用Azkaban?
    2018-06-14 16:41:31
    阅读量:151
    评论:0
  • 资源管理-纳管对象1、物理机资源管理物理服务器可被手动发现或根据预定义策略自动发现并成为可被管理和调度的计算资源2、存储资源管理NAS、SAN等共享存储纳入管理,使其成为可用的存储资源3、网络资源管理接入交换机、防火墙、负载均衡器以及虚拟交换机(含分布式虚拟交换机)等网络资源纳入管理,并可根据网络规划实现平台端到端网络的部署。
    2017-07-06 09:59:02
    阅读量:985
    评论:0