精华内容
下载资源
问答
  • 数据可视化在各个领域都得到了广泛的应用,例如,产品销售数据的可视化,统计样本数据可视化,机器学习数据可视化等。因此,掌握一些数据可视化的技能是非常有必要的。在这篇文章中我们会简单的介绍一下基于Python的...

    数据可视化就是使用图形图表等方式来呈现数据,图形图表能够高效清晰地表达数据包含的信息。数据可视化在各个领域都得到了广泛的应用,例如,产品销售数据的可视化,统计样本数据可视化,机器学习数据可视化等。因此,掌握一些数据可视化的技能是非常有必要的。

    在这篇文章中我们会简单的介绍一下基于Python的数据可视化。Python有很多非常优秀易用的数据可视化的库,作为入门文章我们这里使用Python的matplotlib,事实上Python中很多可视化库都是基于matplotlib开发的,例如pandas等。下面我们将使用几种不同数据图表来讲解基于matplotlib的数据可视化。

    线段图

    线条图适合用来呈现基于时间序列或有固定间隔的序列数据。横轴表示时间或者间隔,而纵轴则表示对应的数值。例如,店铺每天的销售额,旅游景点每天游客接待量等。现在假设我们有某个店铺最近一年的的销售额数据,使用线段图可以非常直接的呈现出来。

    代码和线图图如下:

    条形图

    条形图主要是用来将数据分类显示,横轴表示数据的类型,而纵轴则表示对应类型的数值。例如,我们有5种不同类型产品的销售量,利用条形图我们可以非常方便的把数据呈现出来。

    柱状图

    柱状图,也叫直方图,通常用来呈现变量的分布。它将数据按照一定的区间分组,而纵轴表示位于这一区间数据的个数。例如,下面我们生成一组正态分布的随机数据,柱状图按照一定的区间分组数据,并统计位于各个区间的数据量。

    箱线图

    箱线图用来显示一组数据的分散情况。在箱线图中,数据集的50%被一个矩形覆盖,既矩形的底边位于数据集的25%处,矩形的顶边位于数据集的75%处;在矩形中心既数据集50%处有一条横线;矩形顶边和底边差值的1.5倍称为IRQ值,离矩形底边和顶边IRQ处分别画一条称为边缘的线。所有位于边缘线以外的数据点称为异常点。

    下面我们随机的生成三组数据,并使用箱线图呈现每组数据的分散情况。

    散点图

    散点图是数据在直角坐标系平面的分布图。散点图是非常有用的的显示两组变量之间的关系。例如身高和体重之间的关系,产品价格与销量之间的关系等。

    下面的代码中,我们随机的生成1000组数据,然后使用散点图呈现出来。

    最后

    这篇文章里我们简单的讨论了如何使用matplotlib绘制条形图和柱状图等基本的图表,后续文章中我们介绍更多的python可视化库和一些更复杂的绘图。

    展开全文
  • 行为科学统计(第七版).[]Frederick J Gravetter.pdf
  • 本书以趣味的方式介绍了统计学习的一字儿基础知识,让你可以看到生活中处处是统计学习的影子,可以是初学者的一本良好的入门书。
  • 数学之美 第二版 pdf

    千次阅读 2018-11-14 18:41:55
    数学之美 第二版 pdf

    分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow

    也欢迎大家转载本篇文章。分享知识,造福人民,实现我们中华民族伟大复兴!

                   

    下载地址:网盘下载

     

     

     

    内容简介  · · · · · ·

    作者简介  · · · · · ·

    吴军博士,毕业于清华大学和美国约翰•霍普金斯大学,是著名自然语言处理和搜索专家,硅谷风险投资人。获奖畅销书《浪潮之巅》及《数学之美》的作者。

    吴军博士是谷歌公司早期员工之一。在谷歌,他和辛格(美国工程院院士,世界著名搜索专家)、Matt Cutts(谷歌反作弊官方发言人)等三位同事一起开创了网络搜索反作弊的研究领域,并因此获得谷歌工程奖。2003年,他和谷歌全球架构的总工程师朱会灿博士等共同成立了中日韩文搜索部门。吴军博士是当前谷歌中日韩文搜索算法的主要设计者。在谷歌期间,他还领导了许多研发项目,得到了当时公司首席执行官埃里克•施密特和创始人谢尔盖•布林的高度评价。

    2010年—2012年,他加盟腾讯公司,出任负责搜索和搜索广告的副总裁,同时担任国家重大专项“新一代搜索引擎和浏览器”项目的总负责人。2012年回到谷歌,负责开发了被认为是“下一代搜索”的谷歌自动问答系统。同年,他作为创始合伙人共同创立了中关村硅谷风险投资基金(ZPark Venture)。

    吴军博士在国内外发表过数十篇论文,曾获得全国人机语音智能接口会议的最佳论文奖和Eurospeech的最佳论文奖。他还获得了十余项美国和国际专利。

    吴军博士还担任约翰•霍普金斯大学工学院董事会董事和校国际事务委员会顾问,他也长期担任中国工业和信息化部的专家顾问。同时,他也是数家投资基金、创业公司的董事和顾问。

    目录  · · · · · ·

    第二版出版说明
    序言1
    序言2
    前言
    第1 章 文字和语言 vs 数字和信息
    第2 章 自然语言处理 — 从规则到统计
    第3 章 统计语言模型
    第4 章 谈谈分词
    第5 章 隐含马尔可夫模型
    第6 章 信息的度量和作用
    第7 章 贾里尼克和现代语言处理
    第8 章 简单之美 — 布尔代数和搜索引擎
    第9 章 图论和网络爬虫
    第10章 PageRank — Google的民主表决式网页排名技术
    第11章 如何确定网页和查询的相关性
    第12章 有限状态机和动态规划 — 地图与本地
    第13章 Google AK-47 的设计者 — 阿米特· 辛格博士
    第14章 余弦定理和新闻的分类
    第15章 矩阵运算和文本处理中的两个分类问题
    第16章 信息指纹及其应用
    第17章 由电视剧《暗算》所想到的 — 谈谈密码学的数学原理
    第18章 闪光的不一定是金子 — 谈谈搜索引擎
    第19章 谈谈数学模型的重要性
    第20章 不要把鸡蛋放到一个篮子里 — 谈谈最
    第21章 拼音输入法的数学原理
    第22章 自然语言处理的教父马库斯和他的优秀弟子们
    第23章 布隆过滤器
    第24章 马尔可夫链的扩展 — 贝叶斯网络
    第25章 条件随机场、文法分析及其他
    第26章 维特比和他的维特比算法
    第27章 上帝的算法 — 期望最大化算法
    第28章 逻辑回归和搜索广告
    第29章 各个击破算法和Google 云计算的基础
    第30章 Google 大脑和人工神经网络
    第31章 大数据的威力——谈谈数据的重要性
    附录
    后记
    索引

     

     

     

    下载地址:网盘下载

     

               

    给我老师的人工智能教程打call!http://blog.csdn.net/jiangjunshow

    这里写图片描述
    展开全文
  • 2019年第24周地产周报:统计局销售数据回落,房企集中发行美元债.pdf
  • 本文作者:黄小伟,《表哥有话讲》大表哥一枚,目前就职杭州有赞数据分析团队!刚刚入手 舰哥(李舰)新作《统计之美:人工智能时代的科学思维》,很欣喜!借用魏老师的话来说就是:...

    本文作者:黄小伟,《表哥有话讲》大表哥一枚,目前就职杭州有赞数据分析团队!


    刚刚入手 舰哥(李舰)新作《统计之美:人工智能时代的科学思维》,很欣喜!借用魏老师的话来说就是:"观本书96个统计相关故事,有趣、有味、有智慧,如饮醇酒,如沐春风"。人工智能时代,越来越多的人浮于工具、概念层面,对于核心理论的认知极为浅薄,对于没有数理背景的从业者而言,通过本书可以快速建立起一套以实际应用为导向的知识结构,在AI道路上,你会走的更扎实!

    借此机会,力荐《统计之美:人工智能时代的科学思维》给大家!

    640?wx_fmt=jpeg


    作者简介

    李舰,统计学本科、软件工程硕士、商学博士,数据科学领域的多年从业者,见证并参与了统计学从冷门专业到显学的过程。是“统计之都”社区的核心成员之一、开源社区的活跃贡献者,致力于数据科学在实体行业中的应用。

    海恩,在硅谷著名互联网企业从事数据分析工作,业余时间亦喜欢自己抓数据做点好玩的分析。


    本书目录

    第1 章 统计与科学1

    1.1 随机的世界 2

    1.1.1 打台球的物理学家,确定、不确定与随机2

    1.1.2 上帝掷骰子吗,决定论与随机性4

    1.1.3 连环杀手的归案,随机与均匀 6

    1.1.4 扔硬币的数学家们,大数定律9

    1.2 认识概率 11

    1.2.1 游戏奖金的分配,概率论的发展 11

    1.2.2 6 连号和14 连号,概率的计算 13

    1.2.3 主持人背后的山羊,条件概率 16

    1.2.4 寻找失踪的核潜艇,贝叶斯概率18

    1.3 统计思想和模型 20

    1.3.1 女士品茶,假设检验 20

    1.3.2 “渣男”去死,最大似然 23

    1.3.3 六西格玛的奇迹,小概率 25

    1.3.4 牛顿的苹果,模型拟合27

    1.4 统计与科学 29

    1.4.1 智多星与神机军师,统计预测29

    1.4.2 深蓝与阿尔法狗,归纳和演绎 31

    1.4.3 中药与西药,临床试验33

    1.4.4 所有模型都是错的,科学和否定 36


    第2 章 数据与数学38

    2.1 数据与空间 39

    2.1.1 多维世界的虫子,坐标和向量 39

    2.1.2 黑客帝国和变形金刚,矩阵简介 42

    2.1.3 九章算术与线性方程,线性方程组 45

    2.1.4 二十八宿与黄道十二宫,线性变换 48

    2.2 随机变量和分布 51

    2.2.1 伯努利的硬币,随机分布 51

    2.2.2 相亲多少次与神奇的37,离散型分布 54

    2.2.3 棣莫弗的正态,连续型分布 56

    2.2.4 醉鬼的步伐,随机过程 58

    2.3 认识数据 59

    2.3.1 忒修斯之船,数据、测量与变量 59

    2.3.2 从性别到体重,数据的尺度 61

    2.3.3 周岁与虚岁,连续变量与离散变量 63

    2.3.4 一份体检记录,数据分析的基本数据结构 65

    2.4 数理统计基础 66

    2.4.1 管中窥豹与一叶知秋,总体和样本 66

    2.4.2 恶赌鬼的诡计,数字特征 68

    2.4.3 被平均的工资,统计量 70

    2.4.4 小李飞刀与孔雀翎,参数估计 72


    第3 章 数据可视化76

    3.1 历史上的统计图形 77

    3.1.1 河图与洛书,可视化简介 77

    3.1.2 伦敦霍乱的防治,空间可视化 78

    3.1.3 南丁格尔的玫瑰,玫瑰花瓣图 79

    3.1.4 拿破仑远征,自定义统计图形 81

    3.2 数据与可视化 83

    3.2.1 女王的裙子,数据可视化83

    3.2.2 画布与宣纸,图形设备 84

    3.2.3 深水王子与针眼画师,绘图语言的变迁 86

    3.2.4 “挑战者”号航天飞机,直观的可视化 88

    3.3 基础统计图形 90

    3.3.1 老忠实喷泉的秘密,分布图 90

    3.3.2 统计图形的奠基人,条形图和饼图 91

    3.3.3 古老国度的诗云,坐标变换 93

    3.3.4 飞翔的动态气泡图,动态可视化 95

    3.4 数据之间的关系 97

    3.4.1 东上相的轨道,散点图 97

    3.4.2 五十州的最高峰,箱线图 99

    3.4.3 泰坦尼克号的幸存者,马赛克图 100

    3.4.4 切尔诺夫的笑脸,样本关系的可视化 102


    限于篇幅,本文只列举了前3章目录


    Q&A

    上帝掷骰子吗?

    相亲多少次就该做出决定了?

    奶茶是应该先加奶还是先加茶?

    美国的总统大选为何永远测不准?

    AI的神经和人的神经有什么不同?

    “渣男”到底该不该给原谅的机会?

    摇号买房,为什么武汉的6连号存疑,老河口的14连号反而没问题?

    ......

    书中运用统计知识给你提供靠谱的答案

    640?wx_fmt=png

    640?wx_fmt=png

    640?wx_fmt=png


    本书京东链接:


    展开全文
  • 目前,人工智能的火热程度不言而喻了,很多打算入行的朋友都会觉得这一块是不是对数学要求很高... 这次的图书是《统计之美:人工智能时代的科学思维》,是关于统计学及其相关领域的,涉及到概率论、大数据、人工智能...
    目前,人工智能的火热程度不言而喻了,很多打算入行的朋友都会觉得这一块是不是对数学要求很高,的确,就我目前接触的小范围领域来说,坚实的数学基础是必不可少的,它可以让你轻松地实现一些重要理念的推导,对后期的进一步发展也是至关重要的,所以最近打算充充电,找回当年学习数学的感觉。
            这次的图书是《统计之美:人工智能时代的科学思维》,是关于统计学及其相关领域的,涉及到概率论、大数据、人工智能等,是一本不错的入门或者是复习书籍。这本书由96个小故事组成,每个小故事对应一个专业知识点,可以让你简单愉快地完成那些晦涩高深概念的理解,就这一点而言甚得朕心~~~
           ok,这次的读书笔记做的思维导图,这样会更加直接,有喜欢此书的朋友可以入手了,最近当当貌似在搞活动……
    先看下本书的全貌吧:
    以下是根据本书内容制作的思维导图,由于是第一次做思维导图,很多地方还不是很规范,请大家多多指教:

    转载于:https://www.cnblogs.com/beyond9305/p/10855914.html

    展开全文
  • 20210416-投中研究院-投中统计:一季度制造类上市公司最爱做LP,碳中和投资超45亿美金.pdf
  • 中国东盟国家统计年鉴十四马来西亚主要统计指标数据六马来西亚主要统计指标数据数据来源东盟秘书处数据来源马来西亚统计部网站专题篇中国和东盟国家主要经济社会指标中国东盟国家统计年鉴年马来西亚及其指数数据来源...
  • 统计与自适应信号处理 【】Dimitris G. Manolakis 等著 周正 等译 电子工业出版社
  • 数学之美 (第二版) pdf

    千次阅读 2018-02-05 20:49:00
    下载地址:网盘下载内容简介······几年前,“数学之美”系列文章原刊载于谷歌黑板报,获得上百万次点击,得到读者高度评价。读者说,读了“数学之美”,才发现大学时学的数学知识,比如马尔可夫链、矩阵计算,...
  • 2021年薪酬报告系列创意设计美容医院行业薪酬报告薪酬调查.pdf
  • Solutions Manual for statistical and adaptive signal processing []Dimitris G. Manolakis\ Vinay K....统计与自适应信号处理【】Dimitris G. Manolakis等著 全书课后习题详细解答,共467页。
  • 计算统计(Geof_H_Givens).pdf
  • 第一章 统计与科学 写在前面 本章主要介绍了一些统计学的基本概念,在此整理书中给出的定义(书中的定义大多来自于维基百科)。若有一些不理解的概念,可去书中看看对应的介绍,作者用生动的案例解释了这些概念的...
  • 报告中指出,全球光伏制造设备出货金额在2011第二季度达到了20.3亿美元。出货金额在2011年一季度下跌了19%之后,实现季度增长17
  • 【作 者】()Steven M.Kay 【丛 书 名】 国外电子与通信教材系列 本书是一部经典的有关统计信号处理的权威著作。全书分为两卷,分别讲解了统计信号处理基础的估计理论和检测理论。. 第一卷详细介绍了经典估计...
  • 超清文字版,适合经济学专业使用,作者系美国康奈尔大学讲座教授。
  • 《大数据时代》之后的必读作。《大数据时代》改变了我们的思维,《数据统治世界》将改变我们利用数据的方式。揭示5大统计式思维,让你可以解决在商业、金融、科学、公共卫生以及犯罪调查中遇到的难题!他用难以胜...
  • 关于介绍数据缺失的算法的书,《缺失数据》作者:()阿利森 ,供需要的下载
  •  《统计数字会撒谎》一书是由美国统计专家达莱尔·哈夫写就的传世作,该书引发的“编造虚假信息”话题受到美国社会持续普遍的关注和美国权威媒体的激烈争论。它自50年代出版以来就不断一版再版,并被翻译成多种...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 7,791
精华内容 3,116
关键字:

统计之美pdf