精华内容
下载资源
问答
  • 数据图表展示

    2019-11-03 14:24:03
    数据的预处理是在对数据分类或分组之前所的必要处理,内容包括数据的审核、筛选、排序等。 1.1数据预处理 1.1.1 数据审核 数据审核就是检查数据中是否有错误。通过原始数据(raw data),需要从完整性和准确性两个...

    数据的预处理

    数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。

    1.1数据预处理

    1.1.1 数据审核
    数据审核就是检查数据中是否有错误。通过原始数据(raw data),需要从完整性和准确性两个方面去审核。

    • 完整性审核:主要检查应调查的单位或者个体是否有遗漏,所有的调查项目是否填写齐全。
    • 准确性审核:主要是检查数据是否有错误,是否存在异常值等。如果记录错误,则纠正,否则保留。

    如果是二手数据,应着重于审核数据的时效性和实用性。

    1.1.2 数据筛选(data filter)
    是根据需要找出符合特定条件的某类数据。

    1.1.3 数据排序
    数据排序是指按一定的顺序将数据排列,以便研究者通过浏览数据发现一些明显特征趋势,找到解决问题的线索。

    同时排序还有利于对数据进行检查纠错。

    1.1.4 数据透视表
    可以对数据表的重要信息按使用者的习惯或分析要去进行汇总和作图,形成一个符合要求的交叉表(列联表)。使用时首行必须有列标题
    由两个或两个以上变量交叉分类的频数分布也称列联表(contingency table)。
    二维的列联表又称交叉表(cross table)

    1.2 品质数据的整理与展示

    数据经过预处理后,可根据需要进一步的做分类分组。处理时,不同类型的数据的处理方式和适用的处理方法是不同的。
    对品质数据主要是做分类整理。对数值型数据主要是做分组整理。前者包括分类数据和顺序数据。

    1.2.1 分类数据的整理和展示
    分类数据本身就是对事物的一种分类。因此首先列出所分的类别,然后计算每一页的频数、频率、或比例、比率等,即可形成频数分布表。最后根据需求进行合理的图形展示。

    1. 频数和频数分布
    • 频数(frequency)是落在某一特定类别或组中的数据个数。
      把各个相应得频数全部列出,并用表格的形式表现出来,就是频数分布。

    • Excel中生成频数分布表的形式
      【透视表】
      【直方图】

    1. 分类数据的图示
    • 条形图(bar chart)
      使用宽度相同的条形的高度的或长短来表示数据多少的图形,条形图可以横置或纵置,纵置是也称柱形图(column chart),同时还分为简单条形图和复式条形图。
    • 帕累托图(Pareto chart)
      该图是按各类别出现的频数多少排序后绘制的条形图。通过对条形的排序,很容易看出数据多少。
    • 饼图(pie chart )
      使用圆形及圆内扇形角度来表示数值大小的图形。它主要表是一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题有用。
    • 环形图
      简单饼图只能表示一个样本个部分的所占比例。多个样本叠加在一起,需要挖去中间叠加的部分,就是环形图。
      与饼图类似,环形图可以显示多个样本各部分所占的相应比例,有利于对构成做比较研究。

    1.2.2 顺序数据的整理和展示
    以上介绍的都适用于对顺序数据的整理和图示。但一些顺序数据的整理和图示方法并不适用分类数据。除以上还可以计算累积频数和累积频率(百分比)

    1 . 累积频数和累积频率
    累积频数(cumulative frequencies ) 是将各有序类别或组的频数逐渐累加起来得到的频数,频数的累积方法有两种:一是从类别顺序的开始一方向类别顺序的最后一方累加数值(数值型数据则是从数值小的到数值大的累加频数),称向上累积。与之相反,则是向下累积。
    通过累积频数,可以很容易看出某一类别(或数值)向下或向上的频数之和。
    **累积频率(百分比)**是将各类别或者分组的百分比累加起来,同时也有向上累积和向下累积两种方法。

    2 . 顺序数据的图示
    根据累积频数和累积频率可以绘制累积频数分布或频率图。
    在这里插入图片描述

    1.3数值型数据的整理和展示

    1.3.1 数据分组

    数据分组是根据统计研究的需要,将原始数据按照某种标准分成不同的组别,分组后的数据成为分组数据(grouped data)
    其目的是观察数据分布特征,然后计算各组数据频数,就形成了频数分布表。
    方法有单变量值分组和组距分组两种。单变量值适合离散变量。
    组距变量就是将全部变量分成若干个区间,一个区间为一组。最小值为下限(lower limit),反之上限(upper limit)

    组距(class width):指一组数据上限与下限的差
    组中值 (class midpoint):(上限值+下限值)/ 2

    1.3.2 数值型数据的图示
    以上图示饼图、环形图及累积分布均是用于数值型数据
    以下图示并不适用于分类数据和顺序数据。

    1.分组数据:直方图(histogram)
    用于展示分组数据分布的一种图形,它是用矩形的宽度和高度(即面积)来表示频数分布的。另外显示数据频数分布特征的还有折线图、曲线图等。
    直方图用于数值型数据,条形图用于分类数据。

    2 . 未分组数据:茎叶图和箱线图、

    • 茎叶图(stem-and-leaf display)是反映原始数据分布的图形。它由茎和叶两部分构成,其图形是由数字构成的,通常高位数表示茎,最后一位数字表示叶。通过图形,可以看出数据的分布形状和离散状况。比如:分布对称、数据是否集中、是否有离散点。
      茎叶图类似于横置的直方图,相比之下,茎叶图即能给出原始值,还有数据分布状况。茎叶图用于小量数据。
    • 箱线图(box plot)
      根据一组数中最大值,最小值,中位数,两个四分位数,这个五个特征值绘制成的。在这里插入图片描述

    通过箱线图的形状查看数据分布特征。
    在这里插入图片描述

    3 . 时间序列数据:线图
    如果数值型数据是在不同时间取得的,即时间序列数据,则可以绘制线图。
    线图(line plot) 主要用于反应现象随时间变化的特征。

    4 . 多变量数据的图示:以上为单变量的图示方法,多变量即可用散点图,气泡图,雷达图,

    • 散点图(scatter diagram) 使用二维坐标展示两个变量之间关系的一种图形。 横坐标x,纵坐标y,点(x,y)
    • 气泡图(bubble chart )可用于展示三个变量之间的关系。横轴。纵轴。第三个变量为气泡的大小。
    • 雷达图(radar chart)显示多个变量的常用方法,又称蜘蛛图(spider chart)

    数据类型的主要图示方法;

    在这里插入图片描述

    1.4合理使用图表

    1.4.1鉴别图表的优劣准则
    特征:
    (1)显示数据
    (2)注意力集中图形内容,不是制作程序
    (3)避免歪曲
    (4)强调数据间的比较
    (5)服务于明确的目的
    (6)有统计描述和文字说明
    准则:
    (1)精心设计,洞察问题
    (2)复杂观点阐述简明、确切、高效
    (3)最短时间提供最多内容
    (4)多维
    (5)表述数据真实

    1.4.2 统计表设计
    首先合理安排表结构,其次表头明确包括(表号、总标题、表中数据),再次格式整洁,最后加上注释。

    展开全文
  • 数据的预处理是在对数据分类或分组之前所的必要处理,内容包括数据的审核、筛选、排序等。 数据审核 数据审核就是检查数据中是否有错误。对于通过调查取得的原始数据,主要从完整性和准确性两个方面去审核。 ...

    鄙人学习笔记



    数据的预处理

    数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。

    • 数据审核

    数据审核就是检查数据中是否有错误。对于通过调查取得的原始数据,主要从完整性和准确性两个方面去审核。

    • 数据筛选

    数据筛选是根据需要找出符合特定条件的某类数据。

    • 数据排序

    数据排序是指按一定顺序将数据排列,以便研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。

    品质数据的整理与展示

    分类数据的整理与图示

    • 频数

    频数是落在某一特定类别或组中的数据个数。把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来,称为频数分布

    • 列联表

    由两个或两个以上变量交叉分类的频数分布表也称为列联表。二维的列联表(两个变量交叉分类)也称为交叉表。

    • 比例和比率

    比例也称构成比,它是一个样本(或总体)中各个部分的数据与全部数据之比,通常用于反映样本(或总体)的构成或结构。
    比率样本(或总体)中不同类别数据之间的比值,由于比率不是部分与整体之间的对比关系,因而比值可能大于1.

    • 条形图

    条形图是用宽度相同的条形的高度或长短来表示数据多少的图形。条形图可以横置或纵置,纵置时也称为柱形图。

    条形图:

    • 帕累托图

    该图是按各类别数据出现的频数多少排序后绘制的条形图。图中左侧的纵轴给出了计数值,即频数.右侧的纵轴给了累积百分比。

    帕累托图:

    • 饼图

    饼图是用圆形及圆内扇形的角度来表示数值大小的图形。它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。

    饼图:

    • 环形图

    环形图是由两个及两个以上大小不一的饼图叠在一起,挖去中间的部分所构成的图形。[补]

    环形图:

    • 环形图与饼图

    环形图与饼图类似,但又有区别。环形图中间有一个“空洞”,每个样本用一个环来表示,样本中的每一部分数据用环中的一段表示。因此环形图可显示多个样本各部分所占的相应比例,从而有利于对构成的比较研究。

    顺序数据的整理与图示

    • 累积频数和累计频率

    累积频数是将各有序类别或组的频数逐级累加起来得到的频数。
    累积频率或累积百分比是将各有序类别或组的百分比逐级累加起来,它也有向上累积和向下累积两种方法。

    数值型数据的整理与展示

    • 数据分组

    数据分组是根据统计研究的需要,将原始数据按照某种标准分成不同的组别.分组后的数据称为分组数据

    数据分组的方法有单变量值分组和组距分组两种。
    单变量值分组是把每一个变量值作为一组,这种分组通常只适合离散变量,且在变量值较少的情况下使用。
    在连续变量或变量值较多的情况下,通常采用组距分组。
    在组距分组中.一个组的最小值称为下限,一个组的最大值称为上限。

    • 分组和编制频数分布表的具体步骤

    ①确定组数
    一组数据分多少组合适呢?一般与数据自身的特点及数据的多少有关。一般情况下.一组数据所分的组数不应少于5组且不多于15组。
    ②确定各组的组距(组距是一个组的上限与下限的差)
    ③根据分组整理成频数分布表

    采用组距分组时,需要遵循不重不漏原则。

    • 不重不漏原则

    不重是指一项数据只能分在其中的某一组,不能在其他组中重复出现;不漏是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。

    • 上组限不在内原则

    为解决不重的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内。

    • 开口组

    在组距分组中,如果全部数据中的最大值和最小值与其他数据相差悬殊.为避免出现空白组(即没有变量值的组)或个别极端值被漏掉,第一组和最后一组可以采取"XX以下”及“XX以上”这样的开口组。开口组通常以相邻组的组距作为其组距。

    • 组中值

    组中值是每一组中下限值与上限值中间的值。
    即:

    使用组中值代表一组数据时有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组中值两侧呈对称分布。如果实际数据的分布不符合这一假定,用组中值作为一组数据的代表值会有一定的误差。

    • 直方图

    直方图是用于展示分组数据分布的一种图形,它是用矩形的宽度和高度(即面积)来表示频数分布的。
    直方图:

    • 直方图与条形图的区别

    直方图与条形图不同。
    ①条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度在树枝上均有意义。
    ②由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
    ③条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。

    • 茎叶图

    茎叶图是反映原始数据分布的图形。它由茎和叶两部分构成,其图形是由数字组成的。通过茎叶图,可以看出数据的分布形状及数据的离散状况。
    茎叶图:

    • 箱线图

    箱线图是由数据的最大值、最小值、中位数、两个四分位数这五个特征值绘制而成的,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。

    箱线图:

    注意! 若观察值超过了上四分位数加1.5倍四分位差,或者小于下四分位数减1.5倍四分位差,则在箱线图中会作为离群点被单独标出。[补]

    比如:

    通过箱线图的形状可以看出数据分布的特征:

    • 线图

    如果数值型数据是在不同时间上取得的,即时间序列数据。则可以绘制线图。线图主要用于反映现象随时间变化的特征。
    线图:

    • 散点图

    散点图是用二维坐标展示两个变量之间关系的一种图形。

    散点图:

    • 气泡图

    气泡图可用于展示三个变量之间的关系。它与散点图类似,绘制时将一个变量放在横轴,另一个变量放在纵轴.第三个变量则用气泡的大小来表示。
    气泡图:

    • 雷达图

    雷达图是显示多个变量的常用图示方法,也称为蜘蛛图。
    雷达图:

    展开全文
  • 非专业人员如何在几分钟内快速地...而这样一个数据报告把仪表盘、图表,各种类型的表格、各种类型的筛选器拖到页面上,这样就完成了。 比如说一个图表,我们可以选择某一个数据模型,或者就选刚才用户画像...
    非专业人员如何在几分钟内快速地做出来一个数据分析图表(图片见附件)?永洪提供了二十多种主题风格,可以满足不同喜好的用户。

    做这样一个图表跟做PPT是一样的,做PPT是把文字、文本框、图片等不同的元素,直接拖到页面上面。而做这样一个数据报告把仪表盘、图表,各种类型的表格、各种类型的筛选器拖到页面上,这样就完成了。

    比如说做一个图表,我们可以选择某一个数据模型,或者就选刚才用户画像的数据模型,这个模型里所有的字段都会列在左边的列表里面,跟做菜一样的,所有的素材、原材料都在里面,后面就可以自由发挥了,想要什么就呈现什么。比如从简单往复杂演化,看不同产品利润的情况是什么样的,我就把产品和利润这两个字段分别拖到横轴和纵轴上面,这是简单的需求,快速展现了不同的产品利润情况是怎样的。
    分析图表

    假设这个时候需求变了,我想要按照日期看利润的情况了。很简单,把日期这个字段拖上来,覆盖产品的字段,这是一个维度,我们就马上看到利润随日期变化的趋势了。如果想看不同产品、不同日期的利润情况,我们可以将两个维度组合在一起,不同产品用不同的颜色进行区分显示,得到每个产品利润的趋势。如果想看不同产品和不同区域的组合,也是同样的道理。所以,维度的调整和组合是可以任意更改的。

    对于可视化来讲,图表不只是为了好看,它本身也有业务含义,比如气泡和词云适合看集中度,散点适合看大实体数量分布的情况等等。在不同的场景下看不同的业务意义的时候,需要用到不同的图表类型,我们可以自由切换。对于利润的总和、平均数的统计函数,我们都可以在里面选择,换一个计算公式,同样是实时计算的地直接呈现结果。这样我们就不用像过去那样提一个问题,直到IT部门做出结果才能知道答案的情况,现在我想知道,马上就可以看到。

    很多人觉得做一个预测,用平方和、方差已经不能满足需求了。在上午我们也强调了另外一个重点,作为一站式的大数据分析平台,我们可以在一个界面和平台上,让用户既完成描述性分析,又完成深度分析的过程。比如说常用的分析算法封装到前端,让一些业务用户,即便完全不懂数据挖掘、机器学习的用户,也可以很容易的使用。

    假如想要对六个月的利润的总和进行预测,我们只需要简单配置几个选项,可能有注册日期、下单日期、购买日期,每个日期字段当做时间列。这时后台就会开始对数据做一个预测的计算,然后呈现一个结果。因为做挖掘的算法的复杂度,比做描述性分析的汇总统计的复杂度要大,花的时间也会相对长一些。我们看到的蓝色曲线是历史数据,右边还有橘色的数据,这是未来六个月的预测。我们还可以拿一些数据做一些对比,看预测准不准,来调优算法的参数,这需要专业的人做,或者换一种算法做预测。一个平台上面,做深度分析也好、探索分析也好,都可以几分钟之内快速地进行操作和实现。
    展开全文
  • 统计学习一:数据图表展示 参加此统计学习小组主要是巩固python语言,故所有笔记都以python代码实现 一、数据预处理 1.数据审核、筛选、排序 表一: 姓名 统计学成绩 数学成绩 英语成绩 经济学...

    在这里插入图片描述
    本周内容总结:
    在这里插入图片描述
    参加此统计学习小组主要是巩固python语言,故所有笔记都以python代码实现

    一、数据预处理

    1.数据审核、筛选、排序

    表一:

    姓名 统计学成绩 数学成绩 英语成绩 经济学成绩
    张松 69 68 84 86
    王翔 91 75 95 94
    田雨 54 88 67 78
    李华 81 60 86 64
    赵颖 75 96 81 83
    宋媛 83 72 66 71
    袁方 75 58 76 90
    陈风 87 76 92 77
    # 找出统计学成绩等于75的学生
    df1 = df[df['统计学成绩'] == 75]
    
    # 找出英语成绩最高的前三名学生
    df2 = df.nlargest(3, columns='英语成绩')
    # df2 = df.nsmallest(3, columns='英语成绩')  #英语成绩最低的前三名学生
    
    # 找出四门课程成绩都大于70分的学生
    df3 = df[(df['统计学成绩'] > 70) & 
             (df['数学成绩'] > 70) & 
             (df['英语成绩'] > 70) & 
             (df['经济学成绩'] > 70)]
    
    # 排序,升序ascending=False,降序ascending=Trued
    df4 = df.sort_values(by='统计学成绩', ascending=False)
    

    2.数据透视表

    表二:

    编号 性别 家庭所在地区 平均月生活费(元) 月平均衣物支出(元) 买衣物首选因素
    1 大型城市 800 200 价格
    2 中小城市 600 180 款式
    3 大型城市 1000 300 品牌
    4 中小城市 400 40 价格
    5 中小城市 500 150 款式
    6 乡镇地区 800 80 品牌
    7 中小城市 600 180 品牌
    8 乡镇地区 400 120 价格
    9 中小城市 1000 300 款式
    10 大型城市 600 180 款式
    11 中小城市 500 150 价格
    12 乡镇地区 300 30 价格
    13 乡镇地区 500 50 价格
    14 中小城市 300 35 价格
    15 中小城市 1000 300 款式
    16 大型城市 800 350 款式
    17 中小城市 500 150 款式
    18 乡镇地区 1000 100 价格
    19 中小城市 800 80 价格
    20 乡镇地区 800 240 品牌
    21 大型城市 500 50 品牌
    22 大型城市 300 30 价格
    23 大型城市 500 150 款式
    24 中小城市 500 150 价格
    25 大型城市 300 30 价格
    26 大型城市 400 200 价格
    27 中小城市 1000 300 品牌
    28 中小城市 500 50 款式
    29 大型城市 700 70 款式
    30 中小城市 500 50 价格
    # 数据透视表,行变量为性别,列变量为家庭所在地区
    df1 = df.pivot_table(index='性别', columns='家庭所在地区', values='平均月生活费(元)')
    

    二、品质数据的分类与展示

    品质数据:包括分类数据和顺序数据,一般为非数字型数据。分类数据一般为无序数据,顺序数据一般为有序数据。

    表三(部分):

    顾客性别 饮料类型
    碳酸饮料
    绿茶
    矿泉水
    矿泉水
    碳酸饮料
    矿泉水
    碳酸饮料
    绿茶
    果汁
    碳酸饮料
    矿泉水

    1.条形图

    频数:df.value_count()

    # 频数分布表
    data = [(df.loc[:, x].value_counts()) for x in df.columns]
    
    # 条形图
    fig = plt.figure()
    fig.set(alpha=0.2)  # 设定图表颜色alpha参数
    plt.subplot2grid((1, 2), (0, 0))  # 在一张大图里分列几个小图,位置是(0,0)
    data1 = df['顾客性别'].value_counts(ascending=True)
    data1.plot(kind='bar',           
               title='顾客性别')
    print(data1)
    plt.xlabel("顾客性别")
    plt.ylabel("频数")
    plt.subplot2grid((1, 2), (0, 1))
    data2 = df['饮料类型'].value_counts(ascending=True)
    data2.plot(kind='bar',           
               title='饮料类型')
    plt.xlabel("顾客性别")
    plt.ylabel("频数")
    

    在这里插入图片描述

    注:

    条形图:条形图用长条形表示每一个类别,长条形的长度表示类别的频数,宽度表示表示类别。多用于分类数据。

    直方图:直方图是一种统计报告图,形式上也是一个个的长条形,但是直方图用长条形的面积表示频数。多用于数值型数据。

    2.饼图

    # 饼图
    # 控制饼图为正圆
    plt.axes(aspect='equal')
    # plot方法对序列进行绘图
    data2.plot(kind='pie',  # 选择图形类型           
    		   autopct='%.1f%%',  # 饼图中添加数值标签           
    		   radius=1,  # 设置饼图的半径           
    		   startangle=180,  # 设置饼图的初始角度           
    		   counterclock=False,  # 将饼图的顺序设置为顺时针方向           
    		   title='不同类型饮料构成的饼图',  # 为饼图添加标题           
    		   wedgeprops={'linewidth': 1.5, 'edgecolor': 'green'},  # 设置饼图内外边界的属性值    			  textprops={'fontsize': 10, 'color': 'black'})  # 设置文本标签的属性值
    plt.show()
    

    在这里插入图片描述

    三、数值型数据的整理与展示

    数值型数据:数字尺度测量的观察值,通常用数值来表现。

    表四(部分):

    销售量
    234
    143
    187
    161
    150
    228
    153
    166
    154
    174
    156
    203
    159
    198
    160

    1.直方图

    # 按照固定区间长度绘制频率分布直方图
    # bins_interval 区间的长度
    # margin        设定的左边和右边空留的大小
    def probability_distribution(data, bins_interval=1, margin=1):
        bins = range(min(data), max(data) + bins_interval - 1, bins_interval)
        print(len(bins))
        for i in range(0, len(bins)):
            print(bins[i])
        plt.xlim(min(data) - margin, max(data) + margin)
        plt.title("Probability-distribution")
        plt.xlabel('Interval')
        plt.ylabel('Probability')
        # 频率分布density=True,频次分布density=False
        prob,left,rectangle = plt.hist(x=data, bins=bins, density=False, histtype='bar', color=['r'])
        plt.show()
        
    if __name__ == '__main__':
        df = pd.read_excel('data/1_table4.xlsx')
        data = df['销售量'].values
        # print(data)
        probability_distribution(data=data, bins_interval=10, margin=10)
    

    在这里插入图片描述

    2.茎叶图

    # 茎叶图
    def stem(data, n):
        for k,g in groupby(sorted(data),key = lambda x: math.floor(x/n)):
            lst = map(str, [d % n for d in list(g)])
            print(k, '|', ' '.join(lst))
    

    注:此茎叶图有点点问题,待解决。

    3.箱线图

    # 箱线图
    def boxplot(data):
        plt.boxplot(data, labels=['销售量(台)'])
        plt.title('某电脑公司销售量数据的箱线图')
        plt.show()
    

    在这里插入图片描述

    4.散点图

    散点图:两个变量之间的关系。一个变量放在横轴,另一个变量放在纵轴。

    表五:

    温度 降雨量 产量
    6 25 2250
    8 40 3450
    10 58 4500
    13 68 5750
    14 110 5800
    16 98 7500
    21 120 8250
    # 散点图
    # 输入产量与温度数据
    rainfall = df['降雨量'].values
    production = df['产量'].values
    colors = np.random.rand(len(rainfall))  # 颜色数组
    plt.scatter(rainfall, production, s=200, c=colors)  # 画散点图,大小为 200
    plt.xlabel('降雨量')  # 横坐标轴标题
    plt.ylabel('产量')  # 纵坐标轴标题
    plt.title('小麦产量与降雨量的散点图')
    plt.show()
    

    在这里插入图片描述

    5.气泡图

    气泡图:三个变量之间的关系。一个变量放在横轴,一个变量放在纵轴,另一个变量用气泡的大小来表示。

    # 气泡图
    tem = df['温度'].values
    size = production
    plt.scatter(tem, rainfall, s=production, c=colors, alpha=0.6)  # 画散点图, alpha=0.6 表示不透明度为 0.6
    plt.xlabel('温度')  # 横坐标轴标题
    plt.ylabel('降雨量')  # 纵坐标轴标题
    plt.title('小麦产量与降雨量和温度的气泡图(气泡大小表示产量)')
    plt.show()
    
    # 气泡图
    tem = df['温度'].values
    size = production
    plt.scatter(tem, rainfall, s=production, c=colors, alpha=0.6)  # 画散点图, alpha=0.6 表示不透明度为 0.6
    plt.xlabel('温度')  # 横坐标轴标题
    plt.ylabel('降雨量')  # 纵坐标轴标题
    plt.title('小麦产量与降雨量和温度的气泡图(气泡大小表示产量)')
    plt.show()
    

    展开全文
  • echarts 数据更新图表却没有重绘

    千次阅读 2020-10-23 09:26:30
    问题:当后端返回的数据层级太深时,数据后端返回了前端也获取到了并且重新赋值到了图表对应的数据中去,但是图表就是没有更新。 解决:这里要深入理解setOption这个方法 myChart.setOption({...},true) ...
  • 《统计学(第六版)》贾俊平 第3章 数据图表展示 原始数据 raw data 原始数据即为通过调查取得的未经处理的数据数据筛选 data filter 数据筛选是根据需要找出符合特定条件的某类数据。 频数 frequency 频数是落在...
  • 数据图表展示 一、数据预处理 1. 数据审核:原始数据(完整性和准确性);二手数据(适用性和时效) 2. 数据筛选:高级筛选 姓名 统计学成绩 数学成绩 英语成绩 经济学成绩 张松 69 68 84 86 王翔 91 75 95 94...
  • 你知道那里有一个图表图表会显示你想要查看的数据,但是在没有一些试验和错误的情况下知道哪个图表适合你并不容易。本文与您正在分析的数据类型以及您想要回答的问题进行配对,以帮助您找到适合您需求的图表。那么...
  • 数据可视化的爱好者Severino Ribecca,他在自己的网站上收录了 60 种可视化图表样式以及它们分别适用于什么样的场景,并且推荐了相应的制作工具。 值得一看。 点阵图 点阵图表 (Dot Matrix Chart) 以点为单位...
  • 开源的数据图表工具 Redash 的学习

    千次阅读 2019-09-22 14:14:44
    Redash 是一款开源的BI工具,提供了基于web的数据库查询和数据...Redash 提供了这么一种简单便捷的方式将这些工作标准化:在web页面上输入sql语句,使用查询返回的结果构造数据可视化图表,用户可以将这些图表结果拖...
  • Unity数据可视化图表插件XCharts 1.0发布

    万次阅读 多人点赞 2019-10-26 22:26:16
    A powerful,easy-to-use,configurable charting and data visualization library ...一款基于UGUI的功能强大、易用、参数可配置的数据可视化图表插件。支持折线图、柱状图、饼图、雷达图、散点图、热力图等常见图表
  • 但是很多设计师不懂可视化当中不同用途的图表规范,只是为了设计出好看的数据图表,在不停的寻找设计灵感参考,最终发现了即使有漂亮的可视化数据图表,但却不能用在自己的项目上非常可惜。 为什么会出现这样的情况...
  • 转自:大数据分析和人工智能大家好,我是小五????可视化图表种类如此之多,什么场景下应该用什么图表展示,是一个让人头秃的难题。数据可视化的爱好者Severino Ribecca,他在自己...
  • 比如,我们有一份样例数据,里面是各人在一段时间内查看汽车资讯的次数。   其中,只查看了一次的占绝大多数,查看了两次,3次,4次的递减。   那么我们把查看多少次,算作这些人群中比较‘关注’的人呢?   这...
  • 本节书摘来自华章计算机《Excel数据可视化:一样的数据不一样的图表》一书中的第1章,第1.1节,作者 恒盛杰资讯,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 第 1 章 整理图表背后杂乱无章的数据源 ●...
  • 利用Kibana图表化Elasticsearch中的数据

    万次阅读 2017-11-28 18:18:23
    利用Kibana图表化Elasticsearch中的数据1. 背景Kibana 是一个开源分析和可视化平台,旨在可视化操作 Elasticsearch 。Kibana可以用来搜索,查看,和存储在 Elasticsearch 索引中的数据进行交互。可以轻松地进行高级...
  • tableau具有非常强大的自定义筛选功能,使得动态图表相当地酷炫。那Excel可以做出一样酷炫的动态图表吗?答案必须是个大大的Yes! 本文总结三种常用的动态图表制作方法:数据透视表+切片器,vlookup+match+数据验证,...
  • 交互对于标准图表,您为要查看的每个数据视图创建一张图表,但它们不交互。而对于数据透视图,只要创建单张图表就可通过更改报表布局或显示的明细数据以不同的方式交互查看数据图表类型标准图表的默认图表类型为...
  • import './echarts'// 引入表格
  • Grafana用mysql数据源展示图表实践

    千次阅读 2020-03-08 23:51:32
    公司风险部门的同学平常都是在impala中查看T+1的业务数据,希望技术部门提供一个看板,能够实时查看当前各个业务线的数据调用情况,所以有了这篇文章,grafana平常用influxdb、kairosDB作为数据源比较多,现在记录...
  • python小白,在“一心学”公众号学习了一点疫情数据分析可视化的课程,记录下来,供小白参考。 目录 一、基本数据的查看和初步处理...第一章内容发布在(使用Python制作疫情数据分析可视化图表(一))https://blog....
  • Davinci数据可视化-新增图表类型-旭日图 官网链接 概叙 由于网上并没有太多Davinci 教程文档,自己想新增一些其它的图表类型,对于我这个小白来说,花费了一些时间,避免一些朋友像我一样浪费时间。这里把代码贴出来...
  • grafana图表配置-筛选功能

    万次阅读 2018-07-10 17:17:01
    通过 servicename 与 method 可以筛选曲线,并且 method 的分类会跟随大类 servicename 变动。 2、配置过程 (1)功能面板页面 ## servicename tag SHOW TAG VALUES FROM licai_gw_cloud_asc WITH KEY = &...
  • 在 Excel的强大功能中,图表可算是“三大元老”之最,它最丰富多彩、最直观简略、最通俗易懂、最形象美观……而这本《Excel数据可视化——一样的数据不一样的图表》就是告诉你如何让图表千变万化,其寓意却依然不离...
  • DataGear看板的dg-chart-theme属性,提供了简单且强大的自定义图表主题功能。 通常,只需要设置其color、backgroundColor、actualBackgroundColor值即可, 看板会根据它们自动生成标题、图例、提示框、高亮框等相关...
  • 导读:相比于科学,数据分析更像是一门艺术。创建样式优美的数据可视化是这个艺术中不可缺少的部分。然而,某些人认为优美的,也会有人觉得难以接受。和艺术类似,随着数据分析的快速演变,人们的观念和品味也一直在...
  • 在用echarts折线图的时候,一开始查询的是全部,显示了3条数据,然后筛选后只查询一条数据的值,重新setOption后发现图表上还是3条数据。 接着开始后台打印console.log(data),发现确实只有一条数据的值,说明值已...
  • 大部分人对数据进行可视化时,只是一种图表的堆砌,先把需要的单个图表做完,然后简单地罗列组合在一起,最后改变一下整体颜色,就完成了。整个过程虽然不能说错,但并没有把图表的优势发挥出来。下面分享一些用图表...
  • 数据通过图表的形式展现出来将大大的提升可读性和阅读效率 本例包含柱状图、折线图、散点图、热力图、复杂柱状图、预览面板等 技术栈 vue2.xvuex 存储公共变量,如色值等vue-router 路由element-ui 饿了么...
  • 数据分析-web图表展示-收集

    千次阅读 2015-03-27 11:01:34
    在大数据时代,数据具有以下特性:   实时性:必须快速的收集分析数据、并对...  多种数据集成支持方式:数据的来源不只是限于数据库,数据将支持团队协作数据数据仓库、文本等多种方式,并能够通过互联网进行展现

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 19,554
精华内容 7,821
关键字:

如何筛选数据做图表