快速学习搭建大数据相关课程
  • Kylin大数据实战学习教程

    中级课

    Kylin大数据实战学习教程
    79课时 733分钟 易水
    本课程为专题课,通过全面讲解Kylin架构原理、分布式集群搭建以及项目案例,让你快速掌握Kylin实时大数据BI技术,从而解决海量数据多维指标动态计算耗时问题、复杂条件筛选问题以及跨月、季度、年等大时间区间查询问题。
    免费试看
  • Python玩转大数据--105精讲视频

    中级课

    Python玩转大数据--105精讲视频
    105课时 1694分钟 张敏
    该课程采用时下后的编程语言Python讲解,囊括了当前火的大数据技术Spark/Hadoop/Hive知识,学习环境是基于Docker搭建的5个容器。通过这门课程不仅可以学到Spark/Hadoop/Hive大数据知识,还可以学到当下后的云计算技术Docker. 任务作业: 很多人都想入门机器学习和人工智能,挑战高薪!殊不知人工智能和机器学习的基础是数据及数学,特别是在大数据时代,90%以上的公司不单单是招聘算法工程师,到猎聘Boss直聘上查找算法岗位,查看其招聘条件往往都需要熟练使用大数据平台。这门课程涵盖Docker云计算容器技术,要求学员学完本门课程能够使用Docker容器部署4个容器的Spark集群并能用学到的Docker技术制作一个微服务镜像并对外提供服务;本课程全面讲解了Spark原理及接口,要求学员学完本课程能用网络爬虫爬取全国各地的房价数据,并用Spark编写mapreduce程序分析房价分布情况;本课程涉及分布式机器学习SparkML,要求学员学完本课程,能用SVR,LinearRegreesion,多层感知机算法,决策树回归算法等算法进行房价预测。 人人都想入门人工智能,殊不知人工智能的入门准则是基础的算法和数据处理的能力,学完本课程希望人人拿高薪! (注意: 作业需写在CSDN博客中,请把作业链接贴在评论区,老师会定期逐个批改~~)
    免费试看
  • ElasticSearch快速入门教程【大数据

    高级课

    ElasticSearch快速入门教程【大数据
    10课时 11分钟 千锋
    全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在JAVA应用中如何集成ElasticSearch并实现搜索。
    免费试看
  • 基于阿里云的海量数据处理数据仓库(离线)实战教程

    初级课

    基于阿里云的海量数据处理数据仓库(离线)实战教程
    74课时 518分钟 张长志
    一、项目简介 本项目教程以国内电商巨头实际业务应用场景为依托,同时以阿里云ECS服务器为技术支持,紧跟大数据主流场景,对接企业实际需求,对电商数仓的常见实战指标进行了详尽讲解,让你迅速成长,获取最前沿的技术经验。 二、项目架构 版本框架:Flume、DateHub、DataWorks、MaxCompute、MySql以及QuickBI等; Flume:大数据领域被广泛运用的日志采集框架; DateHub:类似于传统大数据解决方案中Kafka的角色,提供了一个数据队列功能。对于离线计算,DataHub除了供了一个缓冲的队列作用。同时由于DataHub提供了各种与其他阿里云上下游产品的对接功能,所以DataHub又扮演了一个数据的分发枢纽工作; 据上传和下载通道,提供SQL及MapReduce等多种计算分析服务,同时还提供完善的安全解决方案; DataWorks:是基于MaxCompute计算引擎,从工作室、车间到工具集都齐备的一站式大数据工厂,它能帮助你快速完成数据集成、开发、治理、服务、质量、安全等全套数据研发工作; QuickBI & DataV:专为云上用户量身打造的新一代智能BI服务平台。 三、项目场景 数仓项目广泛应用于大数据领域,该项目技术可以高度适配电商、金融、医疗、在线教育、传媒、电信、交通等各领域; 四、项目特色 本课程结合国内多家企业实际项目经验。从集群规模的确定到框架版本选型以及服务器选型,手把手教你从零开始搭建基于阿里云服务器的大数据集群。采用阿里云ECS服务器作为数据平台,搭建高可用的、高可靠的Flume数据采集通道,运用阿里云DateHub构建中间缓冲队列并担任数据分发枢纽将数据推送至阿里自主研发的DataWorks对数据进行分层处理,采用MaxCompute作为处理海量数据的方案,将计算结果保存至MySQL并结合阿里的QuickBI工作做最终数据展示。
    免费试看
  • 大数据之hbase详解

    高级课

    大数据之hbase详解
    24课时 273分钟 冯文凯
    HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持结构化的数据存储.HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群。本视频从hbase的概述开始,讲解hbase的安装,hbase的shell操作,数据结构和原理到java api操作以及优化,让我们快速上手hbase.
    免费试看
  • Spark快速大数据处理

    中级课

    Spark快速大数据处理
    167课时 747分钟 余海峰
    课程的主要内容包括: 1.ZooKeeper-分布式过程协同组件 2.Hadoop3-大数据基础组件 3.Tez-Yarn底层计算引擎 4.Hive3-大数据仓库 5.Spark2实时大数据处理 6.Oozie5-大数据流程引擎 课程特点: 1.最新API: Hadoop3/Spark2/Hive3/Oozie5 2.手工搭建集群环境:编译+搭建 3.配套资源:分阶段镜像+课件+安装资源,其中安装资源包括案例源码、脚本等 4.案例为主:分模块案例+天池数据分析竞赛 5.故障教学 6.完整实战项目:天池数据分析
    免费试看
  • 大数据项目业务建模
    大数据项目业务建模
    11095课时 易水
    掌握Spark Streaming大数据实时项目常用技术组件 掌握Spark Streaming大数据实时项目开发流程
    免费试看
  • 大数据集群平台角色规划
    大数据集群平台角色规划
    11095课时 易水
    掌握Spark Streaming大数据实时项目常用技术组件 掌握Spark Streaming大数据实时项目开发流程
    免费试看
  • 快速学习以太坊开发从入门到精通

    初级课

    快速学习以太坊开发从入门到精通
    25课时 392分钟 杨千锋
    课程介绍: 比特币提供了区块链技术应用的原型,但是比特币系统的初衷只是记录比特币交易记录,所以交易脚本非常简单,无法实现负责的逻辑处理。而以太坊系统则延伸了区块链技术的功能,增加了图灵完备的智能合约脚本。 本阶段视频我们先学习以太坊跟比特币相似的地方,那就是加密数字货币——以太币的钱包、挖矿及交易等知识点。然后重点学习以太坊在比特币基础上扩展的地方,那就是智能合约,而这也是以太坊被称为区块链2.0的原因。在众多的智能合约脚本语言中,我们学习官方推荐的Solidity脚本语言。本套视频我们还会学习如何搭建以太坊私链、如何开发以太坊钱包,如何发行ERC20标准的Token,以及以太坊开发集成环境truffle的用法。
    免费试看
  • Java大数据培训学校全套教程-50)Hadoop与MapReduce最入门

    高级课

    Java大数据培训学校全套教程-50)Hadoop与MapReduce最入门
    27课时 280分钟 马克
    "java大数据培训学校全套教材"系列课程由750集视频构成,基本就 是1)时下流行的java培训学校主流内部教材,2)和市面上培训学校的通 行的课程体系几乎一样。所以这套课程都能自己学下来,等于上了培训学 校一次,完全可以找个java工程师的工作了。     通过学习Hadoop的安装与配置,hdfs常用命令,WordCount程序详解,Shuffle过程详解,WordCount程序结果分析,Hadoop,HDFS,MapReduce,NameNode和DataNode,yarn,ResourceManager,NodeManager的概念等让大家对Hadoop和MapReduce编程打下好的基础。 课程特色:专业细致,偏案例,理论强。 课程软件使用:必须下载 2018最新eclipse 4.7 oxygen版本 重要声明: 1) 如果感觉噪音大,可以选择不用耳机,加音箱或用电脑原声  2) 既然我们的名字叫最最最入门,这个讲义的特点就在于成本最低的, 让你最快速的,最容易的入门。大数据的最大的难点在于入门入不了,从而最终放弃。俗话说师傅领进门,修行在个人。只要入了门了,后面的事都好办。当然,既 然侧重点在于如何入门,内容选的就不是很多。那些已经入门的,或者想学到精通级别的同学,请千万不要选我这套课程,选课前,务必注意本章的学习目标和内容。想学更多,注意后边的课程。
    免费试看
更多
免费试看
8844人学习 2704课时
介绍大数据技术生态圈主流技术框架的应用与发展,介绍如何搭建Hadoop大数据分布式系统集群平台、大数据分布式文件系统HDFS 、大数据分布式并行计算框架MapReduce。 本课程介绍大数据的学习基础。 本课程介绍大数据的背景。 带你深入了解大数据,对大数据有不同的认识。 介绍大数据的基本概念和技术生态圈。 本课程以杨力老师主编的《Hadoop大数据开发实战》为参考,书中详细的介绍了各个步骤,有需要的同学可以留意一下。 该课程的后续课程为杨力老师主讲的《hive大数据离线应用开发》,想要更进一步的同学可以继续观看杨老师的系列视频。
免费
免费试看
8482人学习 286课时
大数据技术在金融领域的应用与实战视频培训教程,系列课程是CSDN学院主题月专属视频,本期主题为 “金融大数据 ”,内容秉承干货实料的原则,邀请业内顶尖的数据技术讲师,共话大数据平台、Spark部署实践以及实现应用大数据支持业务发展等核心话题,旨在通过来自国内一线互联网公司的实践案例,为开发者提供一个有价值的高效技术交流平台,带你全面了解大数据在金融行业的应用与实战。
¥39.00 免费
免费试看
13168人学习 65课时
Hadoop入门和大数据应用视频教程,该课程主要分享Hadoop基础及大数据方面的基础知识。 讲师介绍:翟周伟,就职于百度,Hadoop技术讲师,专注于Hadoop&大数据、数据挖掘、自然语言处理等领域。2009年便开始利用Hadoop构建商业级大数据系统,是国内该领域早的一批人之一,负责设计过多个基于Hadoop的大数据平台和分析系统。2011年合著出版《Hadoop开源云计算平台》。在自然语言处理领域申请过一项发明专利。新出版书籍 《Hadoop核心技术》 。
会员免费
免费试看
35260人学习 2477课时
大数据Spark实战视频培训教程:本课程内容涉及,Spark虚拟机安装、Spark表配置、平台搭建、快学Scala入门、Spark集群通信、任务调度、持久化等实战内容。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
¥208.00 拼团
免费试看
297人学习 718课时
    本课程中,你将学习到,项目架构搭建,数据生产,数据消费,数据分析,以及数据展示等项目核心业务功能的实现。学习过程中,我们将使用Flume,Kafka,HBase,Hadoop,Echarts,Crontab等大数据框架完成整个业务的实现,并在学习过程中对各个框架的应用和原理进行梳理和剖析。 【视频特点】 通信运营商每时每刻会产生大量的通信数据,例如通话记录,短信记录,彩信记录,第三方服务资费等等繁多信息。数据量如此巨大,除了要满足用户的实时查询和展示之外,还需要定时定期的对已有数据进行离线的分析处理。 电信客服综合案例就是以此为切入点所开发的大数据实战案例。  在本课程中,你将学习到,项目架构搭建,数据生产,数据消费,数据分析,以及数据展示等项目核心业务功能的实现。学习过程中,我们将使用Flume,Kafka,HBase,Hadoop,Echarts,Crontab等大数据框架完成整个业务的实现,并在学习过程中对各个框架的应用和原理进行梳理和剖析。
¥199.00 拼团
免费试看
1665人学习 1721课时
本课程以CDH作为大数据平台,详细介绍CDH平台各个组件在生产环境的应用及开发,并结合实际的业务场景,离线数仓,实时数仓,构建企业核心的数据架构。 在实际的工作当中,大数据架构,运维或者开发人员会与多个公司团队合作,ETL团队,爬虫团队,算法团队,运营团队等等,指导大家如何与个个团队打交道,提升工作效率。减少团队之间不愉快的沟通。 希望学习者最好从事过数据库相关工作,有一些 JAVA开发基础,或者有其他工作经验,想学习大数据及数据仓库的同学,对于没有工作经验,或者对开发,数据完全小白的同学,建议先了解相关知识再学习。 本课程的宗旨只有一条,任何学习完本课程的同学,都能熟悉企业主流的数据架构,都有能力维护一个中等HADOOP集群,也就是1P左右的数据的集群或者多个集群。
¥800.00
免费试看
2655人学习 606课时
本课程主要讲解在实际项目开发中,企业构建大数据平台的方案及实战。详细阐述企业级大数据平台的架构设计、机器选型、集群规划、技术选型、资源规划等技术方案。实战演练基于Cloudera Manager(CDH6)安装部署、监控管理、运营维护大数据平台的各个服务组件。从理论经验到实战演练,从设计思想到流程实施,亲力亲测,你也绝对可以。推荐进阶课程:大数据运维尖刀班
¥99.00
免费试看
209人学习 253课时
课程由猎豹移动大数据架构师,根据Java在公司大数据开发中的实际应用,精心设计和打磨的大数据必备Java课程。通过本课程学习大数据新手能够少走弯路,以最短的时间系统掌握大数据开发必备语言Java,为后续大数据课程的学习奠定了坚实的语言基础。 课程特色 1.课程是由猎豹移动大数据架构师亲自授课 2.课程理论讲解透彻形象,手把手实战操作 3.课程包含大数据开发必备的所有Java知识 4.课程前后连贯、系统完整,不会出现跳讲和断讲 技术说明 1. 语言版本:JDK1.8 2. 开发工具:Eclipse 课程资料 免费提供完整的PPT资料 免费提供完整的Word文档 免费提供完整的随堂笔记 免费提供完整的课程代码 免费提供完整的软件包
¥12.00
免费试看
263人学习 549课时
如今大数据已经成了各大互联网公司工作的重点方向,而推荐系统可以说就是大数据最好的落地应用之一,已经为企业带来了可观的用户流量和销售额。特别是对于电商,好的推荐系统可以大大提升电商企业的销售业绩。国内外的知名电商,如亚马逊、淘宝、京东等公司,都在推荐系统领域投入了大量研发力量,也在大量招收相关的专业人才。打造的电商推荐系统项目,就是以经过修改的中文亚马逊电商数据集作为依托,并以某电商网站真实的业务架构作为基础来实现的,其中包含了离线推荐与实时推荐体系,综合利用了协同过滤算法以及基于内容的推荐方法来提供混合推荐。具体实现的模块主要有:基于统计的离线推荐、基于隐语义模型的离线推荐、基于自定义模型的实时推荐,以及基于内容的、和基于Item-CF的离线相似推荐。整个项目具有很强的实操性和综合性,对已有的大数据和机器学习相关知识是一个系统性的梳理和整合,通过学习,同学们可以深入了解推荐系统在电商企业中的实际应用,可以为有志于增加大数据项目经验的开发人员、特别是对电商业务领域感兴趣的求职人员,提供更好的学习平台。适合人群:1.有一定的 Java、Scala 基础,希望了解大数据应用方向的编程人员2.有 Java、Scala 开发经验,了解大数据相关知识,希望增加项目经验的开发人员3.有电商领域开发经验,希望拓展电商业务场景、丰富经验的开发人员4.有较好的数学基础,希望学br习机器学习和推荐系统相关算法的求职人员
¥128.00 拼团
免费试看
701人学习 20课时
购买课程后,可扫码进入学习群,获取赵强老师答疑 本系列课程,完全免费,旨在帮助更多的学员了解大数据,包括:基本思想、Hadoop和Spark的基础知识,为进一步学习大数据奠定基础。
会员免费
免费试看
197人学习 804课时
通过此案例可以学习大数据整体开发流程,课程是围绕一个大数据整理流程而做的教学课程,让大家明白大数据不同技术的相互协调,从收集数据,过滤数据,数据分析,数据展示,调度的使用而开发的课程,而且怎么从hadoop,hive应用快速的过度到spark上面而做的整套流程。学完此课程可以企业流程做一个整体的认识。 配套资料-答疑专属答疑群 购买课程后加入qq群 951117762 (备注订单号后四位)
¥198.00 拼团
免费试看
675人学习 188课时
Spark大数据实时分析系统课程旨在帮助同学们收获一份有含金量、能写在简历上的项目经验,课程无死角讲解项目每个环节。课程内容涉及项目业务介绍、技术选型与架构设计、项目的架构演进、手机端到服务端数据流程、日志采集设计与要求、日志采集拓扑结构、线上和本地集群资源规划、项目全流程开发、项目总结、项目面试21问。项目内容比较丰满,零基础的同学可以从基础学到项目,有基础的同学可以直接选择项目学习。
免费
免费试看
418人学习 832课时
随着大数据技术的不断发展壮大, Hive不再是大数据技术生态圈中一个普通的工具,而是在大数据分析和大数据仓库中占据着几乎不可替代的重要作用,大数据分析中Hive和Hbase、Hive和Spark SQL、Hive和Impala的结合使用愈加紧密,大数据仓库中Hive在数据仓库建模模块的作用暂时无可替代。所以,深入学好Hive是入门大数据分析、大数据仓库最好的选择。
¥199.00
免费试看
1026人学习 1694课时
该课程采用时下后的编程语言Python讲解,囊括了当前火的大数据技术Spark/Hadoop/Hive知识,学习环境是基于Docker搭建的5个容器。通过这门课程不仅可以学到Spark/Hadoop/Hive大数据知识,还可以学到当下后的云计算技术Docker. 任务作业: 很多人都想入门机器学习和人工智能,挑战高薪!殊不知人工智能和机器学习的基础是数据及数学,特别是在大数据时代,90%以上的公司不单单是招聘算法工程师,到猎聘Boss直聘上查找算法岗位,查看其招聘条件往往都需要熟练使用大数据平台。这门课程涵盖Docker云计算容器技术,要求学员学完本门课程能够使用Docker容器部署4个容器的Spark集群并能用学到的Docker技术制作一个微服务镜像并对外提供服务;本课程全面讲解了Spark原理及接口,要求学员学完本课程能用网络爬虫爬取全国各地的房价数据,并用Spark编写mapreduce程序分析房价分布情况;本课程涉及分布式机器学习SparkML,要求学员学完本课程,能用SVR,LinearRegreesion,多层感知机算法,决策树回归算法等算法进行房价预测。 人人都想入门人工智能,殊不知人工智能的入门准则是基础的算法和数据处理的能力,学完本课程希望人人拿高薪! (注意: 作业需写在CSDN博客中,请把作业链接贴在评论区,老师会定期逐个批改~~)
¥399.00 拼团
免费试看
555人学习 294课时
购买课程后,可扫码进入学习群,获取赵强老师答疑 本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本全面介绍大数据的整体内容,让学员深入理解并掌握运行机制和原理,从而进一步掌握大数据的相关内容。
¥181.00
免费试看
517人学习 40课时
随着大数据与人工智能技术的应用普及,海量多源异构数据急剧增加。传统大数据平台在面临多源异构数据处理时,面临数据采集处理能力不足、数据结构难以统一,数据运维困难等挑战,为企业探索数据价值带来了层层阻碍。那么,有没有办法解决上述问题呢?答案是肯定的,浪潮商用机器有限公司推出的基于POWER9架构的Hadoop+Spark的异构大数据平台,将能轻松应对多样化并发处理任务,实现异构资源灵活调配,为企业提供一个完美的异构大数据解决方案。本次公开课力邀浪潮商用机器的资深专家——刘长生先生,为您带来《异构大数据平台,让多源异构数据融合贯通!》主题分享,详细解读该异构大数据解决方案,诚邀您参加!
免费
猜你喜欢
相关培训 相关博客
  • docker快速搭建MySQL服务及常见问题拉取MySQL的docker 镜像创建 MySQL容器 启动服务器MySQL数据库的 数据持久化我们学习数据库, 肯定需要搭建所学习的数据库服务, 往往物理搭建数据库服务比较麻烦, 导致我们学习的时候会浪费大量的时间用于搭建数据库, 所以发现docker是个好东西, 我们可以用 docker 快速搭建MySQL, Redis, MongoDB 数据库,...
    2019-05-28 10:32:04
    阅读量:0
    评论:0
  • 对于很多初级开发者,或者还没什么实际开发经验的人来说,大数据相关技能看起来特别吓人,因为一堆特别复杂的英文名词,以及听起来难度极高的各种“架构”。但真正去学习上手,你就会发现,这个被传得神乎其技的技术,并没有想象中的那么难,甚至还有点有意思。对于每一个想往更高层次发展的技术人来说,后台数据处理,数据架构的搭建、数据性能的优化,都是绕不过去的技能。而且,随着企业数据量的快速增加,后台数据架构...
    2019-10-10 14:35:29
    阅读量:15
    评论:0
  • 用命令行以最快速简单的方式搭建MySQL数据库 文章首发于:博客园自己机器上还没有安装任何数据库环境,仅仅为了学习用就安装Oracle的话,会把WindowsXP拖得很慢,所以决定采用非安装版的MySQL搭建最简单的数据库环境。 1,下载并解压缩MySQL从官方网站下载MySQL5.5.8的压缩包文件mysql-5.5.8-win32.zip,132.5...
    2011-01-05 16:53:56
    阅读量:0
    评论:0
  • 4 代码生成器搭建环境4.1 思路分析工具的执行逻辑如下图所示:如上分析,得知完成代码生成器需要以下几个操作:用户填写的数据库信息,工程搭建信息需要构造到实体类对象中方便操作数据库表信息,数据库字段信息需要构造到实体类中构造Freemarker数据模型,将数据库表对象和基本配置存入到Map集合中借助Freemarker完成代码生成自定义公共代码模板4.2 搭建环境4.2....
    2019-12-31 11:35:48
    阅读量:134
    评论:1
  • 迅速搭建一个学习使用的大数据环境(持续更新)前言:​ 大数据环境的安装,有很多种,例如CDH,Ambari,这两种都可以快速的安装大数据环境,并且搭配了精美的bashboard,笔者也曾在学习过程中安装以上2种组件,安装完成后,并没有深度使用,总感觉缺少了自己一个个修改配置文件的实在感(为自己的lazy找借口,各位勿喷),本帖粗中有细,譬如kafka-manager的JMX通信,譬如mongo...
    2019-04-13 21:31:10
    阅读量:0
    评论:0
  • 大数据发展愈演愈烈,为了快速跟上技术发展的步伐,最近在学习大数据的相关技术,当然第一步,还是要学习大数据集群的搭建,将自己的一些小经验分享给大家,希望对你们有帮助,当然也感谢在我学习的过程,提供资料和帮助的科多大数据的余老师,话不多说,先上图伪分布:只有一台主要用搭建伪分布式准备三台,用于集群搭建快照克隆克隆出来的主机,它们的主机名、ip、MAC地址都是一样的。所以要进行一些基本配置。修改主机名、...
    2018-05-25 15:38:11
    阅读量:1828
    评论:0
  • 本篇博客主要介绍如何在PyTorch中更加快速便捷地搭建神经网络。示例代码:import torchfrom torch.autograd import Variableimport torch.nn.functional as Fimport matplotlib.pyplot as plt# 生成假数据n_data = torch.ones(100, 2)x0 = to...
    2018-09-05 09:46:12
    阅读量:0
    评论:0
  • 数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。下面我们来讲大数据开发核心流程。当我们接到一个需求,首先会进行需求分析,然后做工作流设计,比如这个任务是什么时候跑的、依赖于哪些业务。工作流设计完成后进行数据采集和数据同步。接下去就是数据...
    2018-12-26 11:06:04
    阅读量:272
    评论:0