大数据基础设施的基本概念相关课程
  • Hadoop大数据实战开发

    初级课

    Hadoop大数据实战开发
    80课时 2704分钟 杨力
    介绍大数据技术生态圈主流技术框架的应用与发展,介绍如何搭建Hadoop大数据分布式系统集群平台、大数据分布式文件系统HDFS 、大数据分布式并行计算框架MapReduce。 本课程介绍大数据的学习基础。 本课程介绍大数据的背景。 带你深入了解大数据,对大数据有不同的认识。 介绍大数据的基本概念和技术生态圈。 本课程以杨力老师主编的《Hadoop大数据开发实战》为参考,书中详细的介绍了各个步骤,有需要的同学可以留意一下。 该课程的后续课程为杨力老师主讲的《hive大数据离线应用开发》,想要更进一步的同学可以继续观看杨老师的系列视频。
    免费试看
  • 大数据Flink从入门到原理到电商数据分析实战项目

    高级课

    大数据Flink从入门到原理到电商数据分析实战项目
    78课时 1584分钟 张长志
    如今的大数据技术应用场景,对实时性的要求已经越来越高。作为新一代大数据流处理框架,由于非常好的实时性,Flink独树一帜,在近些年引起了业内极大的兴趣和关注。Flink能够提供毫秒级别的延迟,同时保证了数据处理的低延迟、高吞吐和结果的正确性,还提供了丰富的时间类型和窗口计算、Exactly-once 语义支持,另外还可以进行状态管理,并提供了CEP(复杂事件处理)的支持。Flink在实时分析领域的优势,使得越来越多的公司开始将实时项目向Flink迁移,其社区也在快速发展壮大。 目前,Flink已经成为各大公司实时领域的发力重点,特别是国内以阿里为代表的一众大厂,都在全力投入,不少公司为Flink社区贡献了大量源码。如今Flink已被很多人认为是大数据实时处理的方向和未来,很多公司也都在招聘和储备了解掌握Flink的人才。 本教程将Flink理论与电商数据分析项目实战并重,对Flink基础理论知识做了系统的梳理和阐述,并通过电商用户行为分析的具体项目用多个指标进行了实战演练。为有志于增加大数据项目经验、扩展流式处理框架知识的工程师提供了学习方式。 二、教程内容和目标 本教程主要分为两部分: 第一部分,主要是Flink基础理论的讲解,涉及到各种重要概念、原理和API的用法,并且会有大量的示例代码实现; 第二部分,以电商作为业务应用场景,以Flink作为分析框架,介绍一个电商用户行为分析项目的开发实战。 通过理论和实际的紧密结合,可以使学员对Flink有充分的认识和理解,在项目实战中对Flink和流式处理应用的场景、以及电商分析业务领域有更深刻的认识;并且通过对流处理原理的学习和与批处理架构的对比,可以对大数据处理架构有更全面的了解,为日后成长为架构师打下基础。 三、谁适合学 1、有一定的 Java、Scala 基础,希望了解新的大数据方向的编程人员 2、有 Java、Scala 开发经验,了解大数据相关知识,希望增加项目经验的开发人员 3、有较好的大数据基础,希望掌握Flink及流式处理框架的求职人员
    免费试看
  • Hive大数据离线应用开发

    初级课

    Hive大数据离线应用开发
    33课时 1036分钟 杨力
    本章将为大家解答以下问题:基于Hadoop的Hive工具的基本概念以及配置和启动。Hive的数据类型、表以及数据操作。如何用Hive进行数据查询。Hive的内置函数。如何用Hive实现电商的自动推荐。如何进行Sqoop的应用开发。Hive的UDF自定义函数介绍和应用。azkaban的介绍和实际应用。
    免费试看
  • Hadoop入门

    初级课

    Hadoop入门
    15课时 322分钟 单笑
    本次课程将带您认识大数据的基本概念,大数据的分布式存储技术,大数据的分布式计算技术。 通过次课程的学习您将明白什么是大数据,对大数据技术有一个深刻的认识,并且会掌握大数据技术中最核心的数据分布式存储系统HDFS和数据分布式并行计算框架MapReduce,再通过大数据的项目案例开发学习,让您对大数据技术的应用得到训练,是您步入大数据技术学习最好的入门途径。
    免费试看
  • 第七章:Python语言编程实战

    中级课

    第七章:Python语言编程实战
    12课时 194分钟 CSDN就业班
    1.Python语言学习路线及与大数据的关系 2.Python安装与开发环境搭建 3.Python语言HelloWord 4.Python语言包与库的基本概念 5.Python数据读取操作 6.Python函数基本使用 7.Python面向对象编程 8.Python数据结构基本使用
    免费试看
  • Java大数据培训学校全套教程-50)Hadoop与MapReduce最入门

    高级课

    Java大数据培训学校全套教程-50)Hadoop与MapReduce最入门
    27课时 280分钟 马克
    "java大数据培训学校全套教材"系列课程由750集视频构成,基本就 是1)时下流行的java培训学校主流内部教材,2)和市面上培训学校的通 行的课程体系几乎一样。所以这套课程都能自己学下来,等于上了培训学 校一次,完全可以找个java工程师的工作了。     通过学习Hadoop的安装与配置,hdfs常用命令,WordCount程序详解,Shuffle过程详解,WordCount程序结果分析,Hadoop,HDFS,MapReduce,NameNode和DataNode,yarn,ResourceManager,NodeManager的概念等让大家对Hadoop和MapReduce编程打下好的基础。 课程特色:专业细致,偏案例,理论强。 课程软件使用:必须下载 2018最新eclipse 4.7 oxygen版本 重要声明: 1) 如果感觉噪音大,可以选择不用耳机,加音箱或用电脑原声  2) 既然我们的名字叫最最最入门,这个讲义的特点就在于成本最低的, 让你最快速的,最容易的入门。大数据的最大的难点在于入门入不了,从而最终放弃。俗话说师傅领进门,修行在个人。只要入了门了,后面的事都好办。当然,既 然侧重点在于如何入门,内容选的就不是很多。那些已经入门的,或者想学到精通级别的同学,请千万不要选我这套课程,选课前,务必注意本章的学习目标和内容。想学更多,注意后边的课程。
    免费试看
  • Kafka大数据实战

    中级课

    Kafka大数据实战
    15课时 512分钟 李连宇
    讲解消息队列的作用及kafka的基本概念及特性,包括kafka的环境搭建,Kafka常见面试问题,Kafka的shell操作,Kafka工作原理,实战将所学的知识点应用到java小项目中;包括消息的产生、数据的存储、数据的消费、kafka读写数据如何保证高效性等多个知 识点,我们在课程中都会一一详细讲解。
    免费试看
  • 机器学习与推荐系统

    中级课

    机器学习与推荐系统
    65课时 1649分钟 缪传海
    一、机器学习与推荐系统课程简介 伴随着大数据时代的到来,作为发掘数据规律的重要手段,机器学习已经受到了越来越多的关注。而作为机器学习算法在大数据上的典型应用,推荐系统已成为各行业互联网公司营销体系中不可或缺的一部分,而且已经带来了真实可见的收益。 目前,推荐系统和机器学习已经成为各大公司的发力重点,众多知名公司(如亚马逊、netflix、facebook、阿里巴巴、京东、腾讯、新浪、头条等)都在着眼于将蕴含在庞大数据中的宝藏发掘出来,懂机器学习算法的大数据工程师也成为了新时代最紧缺的人才。 尚硅谷精心打造出了机器学习与推荐系统课程,将机器学习理论与推荐系统项目实战并重,对机器学习和推荐系统基础知识做了系统的梳理和阐述,并通过电影推荐网站的具体项目进行了实战演练。为有志于增加大数据项目经验、扩展机器学习发展方向的工程师提供最好的学习平台。 二、课程内容和目标 本课程主要分为两部分,机器学习和推荐系统基础,与电影推荐系统项目实战。 第一部分主要是机器学习和推荐系统基础理论的讲解,涉及到各种重要概念和基础算法,并对一些算法用python做了实现; 第二部分以电影网站作为业务应用场景,介绍推荐系统的开发实战。其中包括了如统计推荐、基于LFM的离线推荐、基于模型的实时推荐、基于内容的推荐等多个模块的代码实现,并与各种工具进行整合互接,构成完整的项目应用。 通过理论和实际的紧密结合,可以使学员对推荐系统这一大数据应用有充分的认识和理解,在项目实战中对大数据的相关工具和知识做系统的回顾,并且可以掌握基本算法,入门机器学习这一前沿领域,为未来发展提供更多的选择,打开通向算法工程师的大门。
    免费试看
  • 深入浅出大数据核心技术与应用--HBase及应用案例实践

    初级课

    深入浅出大数据核心技术与应用--HBase及应用案例实践
    13课时 149分钟 温春水
    1.掌握HBase的基本概念 2.掌握HBase的完全分布式搭建 3.掌握基于JavaAPI访问HBase
    免费试看
  • 大白话学懂机器学习与推荐系统实战

    初级课

    大白话学懂机器学习与推荐系统实战
    66课时 1657分钟 张长志
    本教程为官方授权出品 伴随着大数据时代的到来,作为发掘数据规律的重要手段,机器学习已经受到了越来越多的关注。而作为机器学习算法在大数据上的典型应用,推荐系统已成为各行业互联网公司营销体系中不可或缺的一部分,而且已经带来了真实可见的收益。 目前,推荐系统和机器学习已经成为各大公司的发力重点,众多知名公司(如亚马逊、netflix、facebook、阿里巴巴、京东、腾讯、新浪、头条等)都在着眼于将蕴含在庞大数据中的宝藏发掘出来,懂机器学习算法的大数据工程师也成为了新时代最紧缺的人才。 精心打造出了机器学习与推荐系统课程,将机器学习理论与推荐系统项目实战并重,对机器学习和推荐系统基础知识做了系统的梳理和阐述,并通过电影推荐网站的具体项目进行了实战演练,为有志于增加大数据项目经验、扩展机器学习发展方向的工程师提供更好的学习平台。 本课程主要分为两部分,机器学习和推荐系统基础,与电影推荐系统项目实战。 第一部分主要是机器学习和推荐系统基础理论的讲解,涉及到各种重要概念和基础算法,并对一些算法用Python做了实现; 第二部分以电影网站作为业务应用场景,介绍推荐系统的开发实战。其中包括了如统计推荐、基于LFM的离线推荐、基于模型的实时推荐、基于内容的推荐等多个模块的代码实现,并与各种工具进行整合互接,构成完整的项目应用。 通过理论和实际的紧密结合,可以使学员对推荐系统这一大数据应用有充分的认识和理解,在项目实战中对大数据的相关工具和知识做系统的回顾,并且可以掌握基本算法,入门机器学习这一前沿领域,为未来发展提供更多的选择,打开通向算法工程师的大门。 谁适合学: 1. 有一定的 Java、Scala 基础,希望了解大数据应用方向的编程人员 2. 有 Java、Scala 开发经验,了解大数据相关知识,希望增加项目经验的开发人员 3. 有较好的数学基础,希望学习机器学习和推荐系统相关算法的求职人员
    免费试看
更多
免费试看
9084人学习 2704课时
介绍大数据技术生态圈主流技术框架的应用与发展,介绍如何搭建Hadoop大数据分布式系统集群平台、大数据分布式文件系统HDFS 、大数据分布式并行计算框架MapReduce。 本课程介绍大数据的学习基础。 本课程介绍大数据的背景。 带你深入了解大数据,对大数据有不同的认识。 介绍大数据的基本概念和技术生态圈。 本课程以杨力老师主编的《Hadoop大数据开发实战》为参考,书中详细的介绍了各个步骤,有需要的同学可以留意一下。 该课程的后续课程为杨力老师主讲的《hive大数据离线应用开发》,想要更进一步的同学可以继续观看杨老师的系列视频。
免费
免费试看
35314人学习 2477课时
大数据Spark实战视频培训教程:本课程内容涉及,Spark虚拟机安装、Spark表配置、平台搭建、快学Scala入门、Spark集群通信、任务调度、持久化等实战内容。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
¥208.00 拼团
免费试看
13177人学习 65课时
Hadoop入门和大数据应用视频教程,该课程主要分享Hadoop基础及大数据方面的基础知识。 讲师介绍:翟周伟,就职于百度,Hadoop技术讲师,专注于Hadoop&大数据、数据挖掘、自然语言处理等领域。2009年便开始利用Hadoop构建商业级大数据系统,是国内该领域早的一批人之一,负责设计过多个基于Hadoop的大数据平台和分析系统。2011年合著出版《Hadoop开源云计算平台》。在自然语言处理领域申请过一项发明专利。新出版书籍 《Hadoop核心技术》 。
会员免费
免费试看
8678人学习 286课时
大数据技术在金融领域的应用与实战视频培训教程,系列课程是CSDN学院主题月专属视频,本期主题为 “金融大数据 ”,内容秉承干货实料的原则,邀请业内顶尖的数据技术讲师,共话大数据平台、Spark部署实践以及实现应用大数据支持业务发展等核心话题,旨在通过来自国内一线互联网公司的实践案例,为开发者提供一个有价值的高效技术交流平台,带你全面了解大数据在金融行业的应用与实战。
¥39.00 免费
免费试看
1719人学习 1721课时
本课程以CDH作为大数据平台,详细介绍CDH平台各个组件在生产环境的应用及开发,并结合实际的业务场景,离线数仓,实时数仓,构建企业核心的数据架构。 在实际的工作当中,大数据架构,运维或者开发人员会与多个公司团队合作,ETL团队,爬虫团队,算法团队,运营团队等等,指导大家如何与个个团队打交道,提升工作效率。减少团队之间不愉快的沟通。 希望学习者最好从事过数据库相关工作,有一些 JAVA开发基础,或者有其他工作经验,想学习大数据及数据仓库的同学,对于没有工作经验,或者对开发,数据完全小白的同学,建议先了解相关知识再学习。 本课程的宗旨只有一条,任何学习完本课程的同学,都能熟悉企业主流的数据架构,都有能力维护一个中等HADOOP集群,也就是1P左右的数据的集群或者多个集群。
¥800.00
免费试看
94人学习 106课时
课程由猎豹移动大数据架构师,根据Java在公司大数据开发中的实际应用,精心设计和打磨的大数据必备Java课程。通过本课程学习大数据新手能够少走弯路,以最短的时间系统掌握大数据开发必备语言Java,为后续大数据课程的学习奠定了坚实的语言基础。 课程特色 1.课程是由猎豹移动大数据架构师亲自授课 2.课程理论讲解透彻形象,手把手实战操作 3.课程包含大数据开发必备的所有Java知识 4.课程前后连贯、系统完整,不会出现跳讲和断讲 技术说明 1. 语言版本:JDK1.8 2. 开发工具:Eclipse 课程资料 免费提供完整的PPT资料 免费提供完整的Word文档 免费提供完整的随堂笔记 免费提供完整的课程代码 免费提供完整的软件包
¥12.00
免费试看
443人学习 832课时
随着大数据技术的不断发展壮大, Hive不再是大数据技术生态圈中一个普通的工具,而是在大数据分析和大数据仓库中占据着几乎不可替代的重要作用,大数据分析中Hive和Hbase、Hive和Spark SQL、Hive和Impala的结合使用愈加紧密,大数据仓库中Hive在数据仓库建模模块的作用暂时无可替代。所以,深入学好Hive是入门大数据分析、大数据仓库最好的选择。
¥199.00
免费试看
308人学习 718课时
    本课程中,你将学习到,项目架构搭建,数据生产,数据消费,数据分析,以及数据展示等项目核心业务功能的实现。学习过程中,我们将使用Flume,Kafka,HBase,Hadoop,Echarts,Crontab等大数据框架完成整个业务的实现,并在学习过程中对各个框架的应用和原理进行梳理和剖析。 【视频特点】 通信运营商每时每刻会产生大量的通信数据,例如通话记录,短信记录,彩信记录,第三方服务资费等等繁多信息。数据量如此巨大,除了要满足用户的实时查询和展示之外,还需要定时定期的对已有数据进行离线的分析处理。 电信客服综合案例就是以此为切入点所开发的大数据实战案例。  在本课程中,你将学习到,项目架构搭建,数据生产,数据消费,数据分析,以及数据展示等项目核心业务功能的实现。学习过程中,我们将使用Flume,Kafka,HBase,Hadoop,Echarts,Crontab等大数据框架完成整个业务的实现,并在学习过程中对各个框架的应用和原理进行梳理和剖析。
¥199.00 拼团
免费试看
223人学习 253课时
课程由猎豹移动大数据架构师,根据Java在公司大数据开发中的实际应用,精心设计和打磨的大数据必备Java课程。通过本课程学习大数据新手能够少走弯路,以最短的时间系统掌握大数据开发必备语言Java,为后续大数据课程的学习奠定了坚实的语言基础。 课程特色 1.课程是由猎豹移动大数据架构师亲自授课 2.课程理论讲解透彻形象,手把手实战操作 3.课程包含大数据开发必备的所有Java知识 4.课程前后连贯、系统完整,不会出现跳讲和断讲 技术说明 1. 语言版本:JDK1.8 2. 开发工具:Eclipse 课程资料 免费提供完整的PPT资料 免费提供完整的Word文档 免费提供完整的随堂笔记 免费提供完整的课程代码 免费提供完整的软件包
¥12.00
免费试看
701人学习 20课时
购买课程后,可扫码进入学习群,获取赵强老师答疑 本系列课程,完全免费,旨在帮助更多的学员了解大数据,包括:基本思想、Hadoop和Spark的基础知识,为进一步学习大数据奠定基础。
会员免费
免费试看
201人学习 804课时
通过此案例可以学习大数据整体开发流程,课程是围绕一个大数据整理流程而做的教学课程,让大家明白大数据不同技术的相互协调,从收集数据,过滤数据,数据分析,数据展示,调度的使用而开发的课程,而且怎么从hadoop,hive应用快速的过度到spark上面而做的整套流程。学完此课程可以企业流程做一个整体的认识。 配套资料-答疑专属答疑群 购买课程后加入qq群 951117762 (备注订单号后四位)
¥198.00 拼团
免费试看
278人学习 549课时
如今大数据已经成了各大互联网公司工作的重点方向,而推荐系统可以说就是大数据最好的落地应用之一,已经为企业带来了可观的用户流量和销售额。特别是对于电商,好的推荐系统可以大大提升电商企业的销售业绩。国内外的知名电商,如亚马逊、淘宝、京东等公司,都在推荐系统领域投入了大量研发力量,也在大量招收相关的专业人才。打造的电商推荐系统项目,就是以经过修改的中文亚马逊电商数据集作为依托,并以某电商网站真实的业务架构作为基础来实现的,其中包含了离线推荐与实时推荐体系,综合利用了协同过滤算法以及基于内容的推荐方法来提供混合推荐。具体实现的模块主要有:基于统计的离线推荐、基于隐语义模型的离线推荐、基于自定义模型的实时推荐,以及基于内容的、和基于Item-CF的离线相似推荐。整个项目具有很强的实操性和综合性,对已有的大数据和机器学习相关知识是一个系统性的梳理和整合,通过学习,同学们可以深入了解推荐系统在电商企业中的实际应用,可以为有志于增加大数据项目经验的开发人员、特别是对电商业务领域感兴趣的求职人员,提供更好的学习平台。适合人群:1.有一定的 Java、Scala 基础,希望了解大数据应用方向的编程人员2.有 Java、Scala 开发经验,了解大数据相关知识,希望增加项目经验的开发人员3.有电商领域开发经验,希望拓展电商业务场景、丰富经验的开发人员4.有较好的数学基础,希望学br习机器学习和推荐系统相关算法的求职人员
¥128.00 拼团
免费试看
2713人学习 606课时
本课程主要讲解在实际项目开发中,企业构建大数据平台的方案及实战。详细阐述企业级大数据平台的架构设计、机器选型、集群规划、技术选型、资源规划等技术方案。实战演练基于Cloudera Manager(CDH6)安装部署、监控管理、运营维护大数据平台的各个服务组件。从理论经验到实战演练,从设计思想到流程实施,亲力亲测,你也绝对可以。推荐进阶课程:大数据运维尖刀班
¥99.00
免费试看
711人学习 188课时
Spark大数据实时分析系统课程旨在帮助同学们收获一份有含金量、能写在简历上的项目经验,课程无死角讲解项目每个环节。课程内容涉及项目业务介绍、技术选型与架构设计、项目的架构演进、手机端到服务端数据流程、日志采集设计与要求、日志采集拓扑结构、线上和本地集群资源规划、项目全流程开发、项目总结、项目面试21问。项目内容比较丰满,零基础的同学可以从基础学到项目,有基础的同学可以直接选择项目学习。
免费
免费试看
634人学习 1758课时
本教程为授权出品 一、课程简介 数据仓库(Data Warehouse,可简写为DW或DWH),是面向分析的集成化数据环境,为企业决策制定过程,提供系统数据支持的战略集合,是国内外各大公司正在重点投入的战略级技术领域。 二、课程内容 《大数据电商数仓项目实战》视频教程,从项目架构的搭建,到数据采集模块的设计、数仓架构的设计、实战需求实现、即席查询的实现,我们针对国内目前广泛使用的Apache原生框架和CDH版本框架进行了分别介绍,Apache原生框架介绍中涉及到的技术框架包括Flume、Kafka、Sqoop、MySql、HDFS、Hive、Tez、Spark、Presto、Druid等,CDH版本框架讲解包括CM的安装部署、Hadoop、Zookeeper、Hive、Flume、Kafka、Oozie、Impala、HUE、Kudu、Spark的安装配置,透彻了解不同版本框架的区别联系,将大数据全生态系统前沿技术一网打尽。在过程中对大数据生态体系进行了系统的讲解,对实际企业数仓项目中可能涉及到的技术点都进行了深入的讲解和探讨。同时穿插了大量数仓基础理论知识,让你在掌握实战经验的同时能够打下坚实的理论基础。 三、课程目标 本课程以国内电商巨头实际业务应用场景为依托,对电商数仓的常见实战指标以及难点实战指标进行了详尽讲解,具体指标包括:每日、周、月活跃设备明细,留存用户比例,沉默用户、回流用户、流失用户统计,最近连续3周活跃用户统计,最近7天内连续3天活跃用户统计,GMV成交总额分析,转化率及漏斗分析,品牌复购率分析、订单表拉链表的设计等,让学生拥有更直观全面的实战经验。通过对本课程的学习,对数仓项目可以建立起清晰明确的概念,系统全面的掌握各项数仓项目技术,轻松应对各种数仓难题。 四、课程亮点 本课程结合国内多家企业实际项目经验,特别加入了项目架构模块,从集群规模的确定到框架版本选型以及服务器选型,手把手教你从零开始搭建大数据集群。并且总结大量项目实战中会遇到的问题,针对各个技术框架,均有调优实战经验,具体包括:常用Linux运维命令、Hadoop集群调优、Flume组件选型及性能优化、Kafka集群规模确认及关键参数调优。通过这部分学习,助学生迅速成长,获取前沿技术经验,从容解决实战问题。
¥398.00
免费试看
529人学习 40课时
随着大数据与人工智能技术的应用普及,海量多源异构数据急剧增加。传统大数据平台在面临多源异构数据处理时,面临数据采集处理能力不足、数据结构难以统一,数据运维困难等挑战,为企业探索数据价值带来了层层阻碍。那么,有没有办法解决上述问题呢?答案是肯定的,浪潮商用机器有限公司推出的基于POWER9架构的Hadoop+Spark的异构大数据平台,将能轻松应对多样化并发处理任务,实现异构资源灵活调配,为企业提供一个完美的异构大数据解决方案。本次公开课力邀浪潮商用机器的资深专家——刘长生先生,为您带来《异构大数据平台,让多源异构数据融合贯通!》主题分享,详细解读该异构大数据解决方案,诚邀您参加!
免费
猜你喜欢