精华内容
下载资源
问答
  • 大数据入门书籍推荐

    千次阅读 2020-03-04 21:59:54
    1.《数据的本质》 ...阿里巴巴集团前副总裁,首任阿里数据委员会会长——车品觉的《数据的本质》为我们带来了一种观察和应用大数据的全新视角和观点,他一直秉承着“假设数据都是可以获取的...

    1.《数据的本质》

     

    作者:车品觉

    无论是企业行为或是政府决策,还是个人文化和心智修为,判断世间千人万物,甚至是力图洞察时空转换之宏大宇宙的变化等,都可以也应该嵌入数据化思考。数据化思考正是我们在DT时代需要坚持的一个基本理念。

    阿里巴巴集团前副总裁,首任阿里数据委员会会长——车品觉的《数据的本质》为我们带来了一种观察和应用大数据的全新视角和观点,他一直秉承着“假设数据都是可以获取的”的理念去思考问题。他以阿里的经历告诉我们,数据在企业中的应用会经历四个阶段,数据驱动决策、数据驱动流程、数据驱动产品和数据驱动业务。他认为:智能时代,数据才是根本,用数据做好产品,用好产品拿到更多数据;数据是企业的资产,数据治理不应该仅仅是数据部门的工作,而是公司总体的战略;企业不仅要关注自己现在有什么数据,更要了解未来会欠缺什么。

     

     

     

    2.《大数据》

    作者:涂子沛

    随着全球竞争的不断深化,企业的地理优势将淡化,各种国家和地区性的保护措施也将逐步取消。企业间竞争的基础越来越取决于是否能以“低成本、高效率”的方式来开展业务,能否保证商务过程间的无缝隙、无摩擦对接,能否保证每一个商业决策的正确明智。要实现这些,企业必须广泛推行以事实为基础的决策方法,大量使用数据分析来优化企业的运营环节,通过基于数据的优化和对接,把业务流程和决策过程当中存在的每一分潜在价值都挤出来,从而节约成本、战胜对手、在市场上幸存。这种竞争,就是一种基于数据的竞争。《大数据》这本书描述了正在发生的数据革命,和它对商业产生的重大改变。

     

     

     

    3.《大数据时代》

    作者:(英)迈尔·舍恩伯格

    肯尼思·库克耶

     

     

     

     

    大数据是当今的热门话题,对我们的工作、生活和学习正在产生巨大的影响。大数据时代到底给我们带来怎样的变化?《大数据时代》这本书通过列举众多在公共卫生、商业服务领域大数据变革的案例来深刻剖析大数据时代带来的思维变革、商业变革和管理变革。大家可以通过阅读这本书,首先可以转变理念,建立大数据思维,想系统学习大数据的话,可以加入大数据技术学习交流扣扣君羊:522189307,让我们从因果关系的串联思维转变成相关关系的并联思维。其次让我们了解大数据将为人类的生活创造前所未有的可量化的维度,最后让我们认识到大数据为我们提供的不是最终答案,只是参考答案,大家要以开放的心态、创新的勇气去拥抱“大数据时代”。

     

     

    4.《大数据时代下半场-数据治理、驱动与变现》

    作者:(德)罗纳德·巴赫曼

    吉多·肯珀

    托马斯·格尔策

    有专家预言,未来的大数据就如150多年前人类开始大规模使用石油一样,将成为人类不可或缺的资源。如果说大数据的上半场主要任务是收集数据,那么,下半场的主要任务是由收集数据逐渐地转向数据治理、数据驱动及数据变现等方向。

    中国电信天然的是大数据的生产者、收集者,同时也是大数据的使用者和价值创造者。假如你需要在这个领域构建起一个完整的思考,去回答一个“有了数据后应该如何使用”的问题,这本书就可以在规律与方法上给到你具体帮助。同时,相信你在本书观点上,一定能结合自身在数据应用中的困惑,找到解决问题的新突破。

    5.《大数据分析:点“数”成金》

     

     

     

    作者:(美)奥尔霍斯特

     

     

    本书以大数据分析的商业及金融价值为主线,对大数据领域进行了深入的探索,不但阐明了大数据分析的重要性,更淋漓尽致地展现了大数据分析的具体过程。所谓“点‘数’成金”,关键在于“点”,也就是分析。大数据的价值不在于其“量”,而在于其“质”,怎样对海量的以TB甚至PB计的数据进行分析并从中提取有价值的可用信息,才是本书的重点所在。作者强调了数据的显性价值和隐性价值,并说明了怎样让海量数据的存储、备份和归档这类企业例行任务“开口说话”——重新定义市场、提高利润和识别新的商机。从而帮助企业提升智能化水平、解决实际问题、提升利润空间、提高生产率并发现更多的商业机会。

     

     

     

    6. 《大数据互联网大规模数据挖掘与分布式处理》

    作者:(美)莱斯科夫

    拉贾拉曼

    厄尔曼

     

    这是一本非常系统的工具书,主要聚焦在数据挖掘专业,从分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统7个方面给读者详细剖析了数据挖掘这个新兴学科。本书通过2位作者在斯坦福大学教授多年该课程的经验汇编而成,所以阅读过后会有非常体系以及学术的风格在其中。书中教授的技巧是从算法角度来看待数据挖掘,即数据算法应用于数据,而不是用数据来训练某种机器学习算法。本书在学习理论的同时,在每个章节里面均增加了习题部分,帮助读者能够更好的复习和掌握所学知识。作为初入数据挖掘专业,并想掌握这个技巧的读者来说是一本非常实用的书籍。

     

     

    7.《云端时代杀手级应用:大数据分析》

    作者:胡世忠

    通过大数据分析,可以让公司增加50%的新客户,降低30%的成本!这些如海潮般涌动的大量数据,正是云端时代的新金脉,已经创造出惊人的效益。这本书以科普的视角描述了云端时代的大数据分析应用,涉及各个行业,完整介绍了大数据在各产业的应用实况,为企业及政府部门提供应用的方向,同时提供了全球各地的实际应用案例,涵盖零售、金融、政府部门、能源、制造、娱乐、医疗、电信等各个行业,充分展现大数据分析产生的效益。本书出版于五年前,当时各行各业的大数据应用都还刚刚起步,蓦然回首,这其中的大数据思维和分析的基本方法所蕴含的普遍参考性和指导性,适合有志于进一步挖掘数据价值的同仁们一起学习。

    8.《大数据领导干部读本》

    作者:本书编写组

     

    正如图灵奖得主、关系数据库的鼻祖吉姆·格雷在演讲中提到,凭着他对社会科学的深刻洞察,指出科学的发展正进入数据密集型科研——科学史上的“第四范式”。因为研究生导师也是科技哲学方面的专家,所以对于科学史也有一些了解,科学发展史上有几个重要的范式。第一个范式是经验科学阶段,用总结归纳找出科学规律,第二个范式是理论科学阶段,是以演绎的方式发展理论、建构学科。第三个范式是计算科学阶段,正如书中所说,面对大量对于复杂的现象,归纳和演绎都无法满足科学的需求,科学家只能用超级计算机的运算能力处理大量的信息和建立复杂模型预测,并广泛的运营到军事、航天航空、核物理、天体运动等等。随着互联网的发展,人类活动所产生的数据量爆炸式,“摩尔定律”正在突破“第三范式”的合理性和承载力。正因为如此,以海量数据为核心的“第四范式”——数据密集型科研呼之欲出。当大数据时代汹涌而来时高层应该如何应对,《大数据领导干部读本》从什么是大数据开始,告诉领导干部大数据的前世今生,并上升到国家角度看政府如何进行数据治理。虽然是领导干部读本,但是内容深入浅出,亦适合大众阅读。

    展开全文
  • 大数据入门书籍有哪些-柠檬-学院.pdf
  • 下面加米谷大数据老师给大家推荐几本大数据入门到深入必看的经典书籍,希望能对大家有帮助。 大数据必看经典书籍 首先,大数据基础学习阶段,主要是Java基础的学习,包括Java语言基础、HTML、CSS与JavaScript以及...

    大数据领域,尤其是涉及到技术开发方向,是有着很庞杂的技术知识体系的,通过看书来打好理论基础是很多同学初学大数据的想法。下面加米谷大数据老师给大家推荐几本大数据从入门到深入必看的经典书籍,希望能对大家有帮助。

    大数据必看经典书籍

    首先,大数据基础学习阶段,主要是Java基础的学习,包括Java语言基础、HTML、CSS与JavaScript以及Web和数据库相关的知识。

    推荐书籍:《Effective Java》

    这本书主要推荐零基础或基础差的小伙伴读,针对初学Java可能遇到的编程问题,这本书都能找到有效、实用的解决方案,以及对于Java平台精妙之处的独到见解和优秀的代码范例。

    第二阶段,主要是Linux&Hadoop生态体系的学习,对于Linux体系、Hadoop离线计算大纲、分布式数据库Hbase、数据仓库Hive、数据迁移工具Sqoop、Flume分布式日志框架等要逐步去学习掌握。

    推荐书籍:

    《Big Data》

    在大数据的背景下,关于数据建模,数据层,数据处理需求分析以及数据架构和存储实现问题,这本书给出了很多独到的见解。

    《Hadoop权威指南》

    《Hadoop权威指南》,作为Hadoop的经典入门书籍,从Hadoop的缘起,由浅入深,结合理论和实践,全方位地介绍Hadoop框架体系结构。

    《Hive编程指南》

    《Hive编程指南》是一本Apache Hive的编程指南,对Hive的SQL方法HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合做了详细的介绍。

    第三阶段,是针对分布式计算框架的学习,尤其是Spark计算引擎的相关知识,要做到全面掌握。

    推荐书籍:

    《Spark快速大数据分析》

    这本书对Spark的用法,Spark的核心概念和基本原理有较为全面的介绍,不过多深入实现细节,主要关注上层用户的具体用法,适合初学者入门。

    《Spark机器学习:核心技术与实践》

    采用理论与大量实例相结合的方式,对于Spark数据分析和实现机器学习算法,Spark在各种企业级系统中的应用,做了相对全面的介绍,重点在Spark的应用探讨。

    以上就是今天为大家推荐的大数据必看经典书籍,大数据的学习,不管是书籍理论的学习,还是实际的编程实战,都是对于大数据技术的锻炼,只有掌握好了大数据技术,才能真正在大数据行业立足发展.

    展开全文
  • 大数据入门书籍推荐: 1.《大数据日知录:架构与算法》 作者: 张俊林,出版社:电子工业出版社 基本涵盖大数据相关技术架构和算法,只是出版时间略久,新书不好买。不介意的同学可以去淘淘二手书 2.《大数据技术...

    一位资深的大数据工程师推荐的,适合想要自学大数据的同学们

    大数据入门书籍推荐:
    1.《大数据日知录:架构与算法》  作者: 张俊林,出版社:电子工业出版社
       基本涵盖大数据相关技术架构和算法,只是出版时间略久,新书不好买。不介意的同学可以去淘淘二手书
    2.《大数据技术原理与应用:概念、存储、处理、分析与应用》(第2版)
       作者: 林子雨   出版社:人民邮电出版社
       定位是作为学校相应课程的指导教材,并有配套PPT可下载  http://dblab.xmu.edu.cn/post/5633/
     

    Hive学习资料:
    1. 书籍类,推荐 《Hive性能调优实战》 作者:林志煌,出版社: 机械工业出版社
    2. 官方网站提供比较详细使用操作介绍
    3. 与Hive类似的新产品很多,不建议在Hive的使用上花费太多时间,可以从几个点切入进去,并和其他同类产品做一些对比:
    1)文件格式:如Parquet、Orc,不同格式的优缺点,以及与传统关系型数据库存储结构的对比
    2)表的组织格式:Hive MetaStore,特别是Hive 分区表的创建、管理,以及基于分区表的查询
    3)作为对比,可以看看Iceberg、Hudi、Open Delta等新兴技术是怎么在表这一层组织元数据的,以及怎么支撑查询,和Hive相比有什么优缺点
    4)Hive与Trino/Presto,Impala的对比
    5)Hadoop相关的基础知识:HDFS、Yarn、Mapreduce
    6)对数据库原理、编译原理感兴趣的话,可了解下SQL解析、执行计划这块的原理
    7)数据倾斜问题:大数据领域的必考话题之一
     

    展开全文
  • 目录 第1章 大数据基础1 1.1 什么是大数据1 1.2 大数据处理涉及哪些方面3 1.3 为什么用Python解决大数据的问题5 1.4 关于编程的注意事项7 练习题7 第2章 Python环境的准备8 2.1 Python环境的准备8 2.1.1 Python8 ...

    本书系统地讲解了大数据处理相关的过程,并通过Python程序的例子讲解了如何使用Python语言对数据进行采集、存储、分析及可视化。本书的章节设计以目标为导向,首先介绍大数据处理各个环节要做什么事情,然后讲解如何使用Python达到对应的目标。

    本书有配套的课件、代码和课后练习题答案,有需要的读者可登录出版社网站,免费下载。书中给出的例子和数据文件都保存在source目录下对应章节的子目录下。

    目录

    第1章 大数据基础1

    1.1 什么是大数据1

    1.2 大数据处理涉及哪些方面3

    1.3 为什么用Python解决大数据的问题5

    1.4 关于编程的注意事项7

    练习题7

    第2章 Python环境的准备8

    2.1 Python环境的准备8

    2.1.1 Python8

    2.1.2 Anaconda10

    2.2 集成开发环境12

    2.2.1 PyCharm12

    2.2.2 Spyder15

    2.2.3 IPython和Jupyter18

    2.3 包的管理和维护19

    2.3.1 pip20

    2.3.2 conda和Anaconda22

    2.4 大数据处理常用的扩展包26

    2.4.1 NumPy26

    2.4.2 Pandas26

    2.4.3 Matplotlib27

    2.4.4 SciPy27

    2.4.5 scikit-learn28

    练习题28

    第3章 大数据获取29

    3.1 如何获取数据29

    3.2 HTML的基础知识30

    3.2.1 HTML页面的获取与显示30

    3.2.2 单次请求与响应32

    3.2.3 HTML网页内容和结构34

    3.3 HTML页面的解析36

    3.3.1 使用正则表达式提取信息36

    3.3.2 使用XPath提取信息44

    3.3.3 使用BeautifulSoup提取信息47

    3.4 页面的获取59

    3.4.1 使用urllib60

    3.4.2 使用requests库获取网页67

    3.4.3 使用selenium获取网页74

    3.4.4 网页抓取面临的问题79

    3.5 Python爬虫框架Scrapy82

    练习题87

    第4章 大数据存储90

    4.1 文件存储91

    4.1.1 CSV92

    4.1.2 XML97

    4.1.3 JSON103

    4.1.4 Excel108

    4.2 数据库存储110

    4.2.1 关系型数据库通用流程110

    4.2.2 SQLite关系型数据库113

    4.2.3 MySQL关系型数据库118

    4.2.4 NoSQL数据库125

    练习题129

    第5章 大数据的数学基础132

    5.1 基本的数据结构和运算132

    5.1.1 数组对象的创建与属性132

    5.1.2 数组对象的元素级运算138

    5.2 矩阵运算141

    5.2.1 数组的合并、拆分及切片141

    5.2.2 矩阵的乘积与线性代数144

    5.3 统计与概率计算150

    5.4 随机数生成153

    练习题157

    第6章 数据预处理158

    6.1 数据清洗158

    6.1.1 缺失值处理158

    6.1.2 噪声数据处理163

    6.1.3 数据错误发现与修复167

    6.2 数据集成167

    6.3 数据转换176

    6.3.1 z-score规范化177

    6.3.2 最大最小规范化182

    6.3.3 属性转换184

    6.4 数据归约186

    练习题187

    第7章 数据挖掘与分析189

    7.1 模型选择与验证189

    7.1.1 模型选择189

    7.1.2 模型验证190

    7.2 分类算法192

    7.2.1 分类学习的性能评估193

    7.2.2 逻辑回归197

    7.2.3 支持向量机201

    7.2.4 朴素贝叶斯204

    7.2.5 决策树207

    7.2.6 实例分析211

    7.3 回归预测215

    7.3.1 回归学习的性能评估215

    7.3.2 线性回归216

    7.3.3 支持向量机(回归)217

    7.3.4 等式回归218

    7.3.5 决策树(回归)218

    7.3.6 实例分析219

    7.4 聚类分析222

    7.4.1 基于距离的聚类223

    7.4.2 基于密度的聚类算法225

    7.4.3 基于层次的聚类算法227

    7.4.4 聚类的性能评价228

    7.4.5 实例分析231

    7.5 主成分分析232

    练习题232

    第8章 大数据可视化235

    8.1 数据可视化基础235

    8.2 使用Matplotlib绘图239

    8.2.1 准备环境239

    8.2.2 图表相关的术语240

    8.3 使用Matplotlib绘制常见图表242

    8.3.1 散点图242

    8.3.2 折线图246

    8.3.3 条形图248

    8.3.4 直方图252

    8.3.5 面积图253

    8.3.6 饼图254

    8.3.7 箱形图256

    8.4 进阶功能258

    8.4.1 子图258

    8.4.2 中文显示262

    8.4.3 组合图形与标注264

    8.5 如何画出更好的图267

    展开全文
  • 大数据入门

    2017-09-16 21:42:08
    刚开始接触大数据生态圈,经过两周的努力终于在自己实验室的机子上搭建成功了hadoop环境(伪分布模式),对于所有涉及到的知识全部是第一次学习和实践,包括虚拟机安装、虚拟化相关知识、虚拟机上安装Ubuntu系统、终端...
  • 大数据学习入门书籍推荐

    万次阅读 2016-11-08 16:33:41
    大数据学习入门书籍推荐你现在正坐在一座金矿之上,这些金子或被深埋于备份、存档数据之中,或正藏在你眼前的数据集里,它们是提升公司效益、拓展新的商业关系、制订更直观决策的秘诀所在,足以使你的企业更上一层...
  • 大数据入门必读好书推荐

    千次阅读 2020-04-24 14:31:42
    学习大数据,除了网课,一些经典的技术书籍是非常实用且有帮助的。 为了跟上技术更迭的节奏,不落人后,最好的方式是继续刷新自己的知识,同时保持上手的经验。在这行业中要取得成功,需要完美的项目经验和技...
  • 大数据入门(Big Data- A Primer)-2015年Springer英文原版,0积分 一本很不错的大数据英文书籍
  • 作为一个零基础大数据入门学习者该看哪些书? 就目前公司招聘和其他所了解到的大数据专业的工作内容,偏重方向和技术选型有所不同。挖矿老司机就不同职业学习的书籍进行了分类推荐。 1.大数据工程师  在...
  • 2019 大数据必备书籍推荐

    千次阅读 2019-04-11 21:34:48
    历史大浪淘沙经过5次信息革命,终于迎来大数据时代,给信息领域灌入了强劲的血液,催生了很多新生力量,而各行各业谁也无法离开数据存活。尤其近几年来,全球范围内掀起了一股“大数据”热,各地政府、大小企业都在...
  • 大数据书单

    2018-06-30 23:21:05
    之前一直忙着换工作的事,才发现已经一个月没写东西了。入职新公司,开始做数据...知乎上推荐的大多是paper,以及英文原版书籍,看起来会比较麻烦;豆瓣上好像还行,但是不能按照评分排序,比较蛋疼。最后加上京东评...
  • 作为一个零基础大数据入门学习者该看哪些书?今天科多大数据老师做了一些整理作为参考,希望可以帮助到那些对大数据感兴趣的同学。 1. 大数据工程师 在互联网公司广泛招聘,偏平台业务方向,ETL和OLTP等,主要...
  • 大数据,big data,大数据是指不能用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。这句话至少传递两种信息:大数据是海量的数据,另外大数据处理无捷径,对分析处理技术提出了更高的要求。 其实...
  • 大数据方向,适合初学者的书籍

    千次阅读 2018-11-07 13:00:38
    人们想开始学习大数据的时候,最常问我的问题是,“我应该学Hadoop(hadoop是一款开源软件,主要用于分布式存储和计算,他由HDFS和MapReduce计算框架组成的,他们分别是Google的GFS和MapReduce的开源实现。...
  • Hadoop入门大数据应用

    万人学习 2015-09-01 17:01:44
    Hadoop入门大数据应用视频教程,该课程主要分享Hadoop基础及大数据方面的基础知识。 讲师介绍:翟周伟,就职于百度,Hadoop技术讲师,专注于Hadoop&大数据、数据挖掘、自然语言处理等领域。2009年便开始利用...
  • 今天向大家推荐一批大数据书籍,大家可以在业余的时候阅读,加深对大数据的了解,分享给大家看看~ 1.数据之巅 内容简介: 在《数据之巅》这本书中,从小数据时代到大数据的崛起,作者以宏大的历史观、文化观、...
  • 大数据方向的工作目前分为三个主要方向: 01.大数据工程师 ...三、学习资源推荐(书籍、博客、网站) 一、大数据工程师的技能要求 推荐一个大数据学习群 142973723每天晚上20:10都有一节【免费的】大数据...
  • 学习大数据,除了网课,一些经典的技术书籍是非常实用且有帮助的。 为了跟上技术更迭的节奏,不落人后,最好的方式是继续刷新自己的知识,同时保持上手的经验。在这行业中要取得成功,需要完美的项目经验和...
  • 一本书读懂大数据(每个人都看得懂的大数据入门书)-黄颖在线阅读百度网盘下载(635f)书名:一本书读懂大数据(每个人都看得懂的大数据入门书)作者:黄颖格式:EPUB, HTMLZ, PDF路径:点击打开出版:吉林出版集团有限责任...
  • 2019大数据领域十大必读书籍

    万次阅读 2019-04-27 10:43:55
    相信身边有很多应届毕业生以及想转行大数据的,状态大多都是:万脸懵逼。 老司机教你:看书、写代码、多交流。 2019你看了几本书呢?小编为大家精心挑选了大数据领域里十本有价值的书,先干掉这几本书,再和老...
  • 大数据学习书籍

    千次阅读 2018-04-24 17:31:15
    可是看到很多漫天大数据书籍真的有些头疼了,不知道该从哪一本开始阅读。 学习这种事,泛泛而读真的不如术业有专攻,而且还要循序渐进比较好,今天我将学习大数据的同学分为两类,推荐的书籍可以有一定差别的,想...
  • 推荐一个大数据学习群 119599574晚上20:10都有一节【免费的】大数据直播课程,专注大数据分析方法,大数据编程,大数据仓库,大数据案例,人工智能,数据挖掘都是纯干货分享, 一、整体了解数据分析——5小时 新人们...
  • 2021最全大数据学习路线(建议收藏)

    万次阅读 多人点赞 2021-05-12 21:24:05
    大数据是未来的趋势,在数字化转型时代,把握大数据是关键的!
  • 大数据或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。在移动互联网快速发展的当下,越来越多的工作岗位会运用到大数据技术。了...
  • 大数据学习的有哪些相关书籍

    千次阅读 2019-11-23 19:35:27
    时间过的真快,马上大半年都要过去了,今天推荐最近读的大数据专业书,当然也读了几本心灵鸡汤,特别分享于你。 1、阿里巴巴数据技术及产品部的《大数据之路:阿里巴巴大数据实践》 它山之石,可以攻玉,大公司实践...
  • 作为一个零基础大数据入门学习者该看哪些书?今天做了一些整理作为参考,希望可以帮助到那些对大数据感兴趣的同学。 大数据工程师 在互联网公司广泛招聘,偏平台业务方向,ETL和OLTP等,主要是基于Hadoop技术栈来...
  • 大数据自学书籍推荐

    千次阅读 2019-04-22 15:52:21
    可是看到很多漫天大数据书籍真的有些头疼了,不知道该从哪一本开始阅读。  学习这种事,泛泛而读真的不如术业有专攻,而且还要循序渐进比较好,今天我将学习大数据的同学分为两类,推荐的书籍可以有一定差别的,...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 13,471
精华内容 5,388
关键字:

大数据入门书籍