精华内容
下载资源
问答
  • python数据可视化图表
    2022-02-25 20:48:04

    数据可视化的概述

    1.1什么是数据可视化
    数据可视化是借助图形化的手段将一组数据以图形的形式表示,并利用数据分析和开发工具发现其中未知信息的数据处理过程。数据可视化其实是一个抽象的过程,简单来说就是将一个不易描述的事务形成一个感知画面的过程,即从数据空间到图形空间的映射。
    1.2常见的数据可视化方式
    折线图、柱形图、条形图、堆积图、直方图、箱型图、饼图、散点图、气泡图、误差棒图、雷达图、统计地图、3D图表

    常见的数据可视化

    matplotlib、seaborn、ggplot、bokeh、pygal、pyecharts

    安装matplotlib

    (1)从Anaconda官网下载安装文件,双击启动安装程序,进入欢迎使用Anaconda3的界面
    在这里插入图片描述
    (2)【I Agree】按钮进入用户选择安装类型的界面
    在这里插入图片描述
    (3)选择采用“Just Me”方式进行安装。
    在这里插入图片描述
    (4)单击【Next】按钮进入用户选择Anaconda安装位置界面,默认安装路径。
    在这里插入图片描述
    (5)保持默认配置。第一选项为将Anaconda添加到计算机的环境变量中,第2个选项为允许Anaconda使用Python3.7,这里保持默认配置。
    在这里插入图片描述
    一直【Next】,在【Finish】,自动在默认的浏览器中打开登录或注册“AnacondaCloud”的界面,最后单击启动Jupyter Notebook(anaconda3)启动程序。
    在这里插入图片描述
    单击【New】——>【Python3】按钮,即可创建并打开一个由系统自动命名的"Untitled.ipynb"文件,在文件中编写导入pyplot模块的语句。
    ![在这里插入图片描述](https://img-blog.csdnimg.cn/d92055

    使用matplotlib绘制简单的图表

    使用 plot()绘制折线图
    使用pyplot的pla0函数可以快速绘制折线图。
    x :表示x轴的数据。
    y :表示y轴的数据。
    fmt:表示快速设置线条样式的格式字符串。
    label :表示应用于图例的标签文本。
    plot()函数会返回一个包含Line2D 类对象( 代表线条)的列表。
    在这里插入图片描述
    在这里插入图片描述

    绘制柱形图或堆积图柱形图

    使用bar()绘制柱形图或堆积柱形图
    该函数常用参数的含义如下。
    x:表示柱形的x坐标值。
    height:表示柱形的高度。
    width:表示柱形的宽度,默认为0.8。
    bottom:表示柱形底部的y坐标值,默认为0。
    align:表示柱形的对齐方式,有’center’和’edge’两个取值,其中’center’ 表示将柱形与 刻度线居中对齐; ‘edge’ 表示将柱形的左边与刻度线对齐。
    tick_ label :表示柱形对应的刻度标签。
    xerr, yerr: 若未设为None,则需要为柱形图添加水平 /垂直误差棒。
    error_kw:表示误差棒的属性字典。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    更多相关内容
  • Python数据可视化图表大全

    千次阅读 2022-04-19 01:08:56
    数据可视化的爱好者Severino Ribecca,他在自己的网站上收录了 60 种可视化图表样式以及它们分别适用于什么样的场景,并且推荐了相应的制作工具。值得一看。点阵图点阵图表 (Dot Matrix Chart) 以点为单位显示离散...

    可视化图表种类如此之多,什么场景下应该用什么图表展示,是一个让人头秃的难题。

    数据可视化的爱好者Severino Ribecca,他在自己的网站上收录了 60 种可视化图表样式以及它们分别适用于什么样的场景,并且推荐了相应的制作工具。

    值得一看。

    点阵图

    27026f182dce668bfc43ebb383b3f93e.png

    点阵图表 (Dot Matrix Chart) 以点为单位显示离散数据,每种颜色的点表示一个特定类别,并以矩阵形式组合在一起。

    适合用来快速检视数据集中不同类别的分布和比例,并与其他数据集的分布和比例进行比较,让人更容易找出当中模式。

    点数图

    6376d02129de48100924e9f69735165e.png

    点数图 (Point & Figure Charts)也称为「P&F 图」,使用由 X 和 O 符号组成的一系列方格来显示特定资产的供需关系。

    这种图表与时间无直接关系,主要集中看资产的过滤价格表现;它也不会显示交易量,其目的只是显示任何供需关系上的变化,称为「突破」(breakouts)。

    推荐制作的工具有:rpnf。

    弧线图

    50cd6e5e919b3fe842ad10753dad0397.png

    弧线图 (Arc Diagram) 是二维双轴图表以外另一种数据表达方式。在弧线图中,节点将沿着 X轴放置,然后再利用弧线表示节点与节点之间的连接关系。

    弧线图适合用来查找数据共同出现的情况。但缺点是:不能如其他双轴图表般清楚显示节点之间的结构和连接,而且过多连接也会使图表难于阅读。

    推荐的制作工具有:Protovis (编程语言)、D3 (编程语言)。

    折线图

    0cd5dfd0b30b80004c766b0ba03f651c.png

    折线图用于在连续间隔或时间跨度上显示定量数值,最常用来显示趋势和关系。

    此外,折线图也能给出某时间段内的「整体概览」,看看数据在这段时间内的发展情况。

    推荐的制作工具有:MS Excel、Apple Numbers、D3、DataHero、Datamatic、Datawrapper、Envision.js、Google Charts、Google Docs、Infogr.am、OnlineChartTool.com、SlemmaVega。

    平行坐标图

    aaf80c311fb14ec22fe5911e532c5f46.png

    平行坐标图 (Parallel Coordinates Plots) 能显示多变量的数值数据,最适合用来比较同一时间的多个变量,并展示它们之间的关系。

    当数据密集时,平行坐标图容易变得混乱、难以辨认。解决办法是通过互动技术,突出显示所选定的一条或多条线,同时淡化所有其他线条,让我们能更集中研究感兴趣的部分,并滤除干扰数据。

    推荐的制作工具有:D3、Protovis、RAWGraphs、The R Graph Gallery、Vega。

    网络图

    7dd58905cc2ff999bd1d3be0e27f5467.png

    也称为「网络地图」或「节点链路图」,用来显示事物之间的关系类型。

    这些节点通常是圆点或小圆圈,但也可以使用图标。

    网络图主要有分别为「不定向」和「定向」两种。不定向网络图仅显示实体之间的连接,而定向网络图则可显示连接是单向还是双向(通过小箭头)。

    网络图数据容量有限,并且当节点太多时会形成类似「毛球」的图案,使人难以阅读。

    推荐的制作工具有:Cytoscape、Datamatic、Gephi、Graph-tool、Mike Bostock's Block、Plot.ly、sigmajs、Vega、ZoomCharts。

    象形图

    39958053edb4fa3a79b68ce98889959f.png

    象形图 (Pictogram Chart) 也称为「象形统计图」,使用图案来显示数据量。

    使用图案能克服语言、文化和教育水平方面的差异,是更具代表性的数据显示方法。举个例子,如果数据是「5 辆车」,图中便会显示 5 个汽车图案。

    推荐的制作工具有:Infogr.am、jChart。

    直方图

    de1258d773b7298da84909f821f76d54.png

    直方图适合用来显示在连续间隔或特定时间段内的数据分布,有助于估计数值集中位置、上下限值以及确定是否存在差距或异常值;也可粗略显示概率分布。

    推荐的制作工具有:MS Excel、Apple Numbers、D3、Datavisual、Google Docs、Infogr.am、OnlineChartTool.com、Protovis、R Graph Gallery、Slemma。

    密度图

    563c9a73560ef7fe443cd8c1f1dec724.png

    密度图 (Density Plot) 又称为「密度曲线图」,用于显示数据在连续时间段内的分布状况。

    这种图表是直方图的变种,使用平滑曲线来绘制数值水平,从而得出更平滑的分布,并且它们不受所使用分组数量的影响,所以能更好地界定分布形状 。

    推荐的制作工具有:The R Graph Gallery、Cookbook for R。

    人口金字塔

    6a21a209529db6a643c53345b52d06f4.png

    人口金字塔 (Population Pyramid) 也称为「年龄性别金字塔」,是彼此背靠背的一对直方图,显示所有年龄组和男女人口的分布情况。

    人口金字塔最适合用来检测人口模式的变化或差异。多个人口金字塔放在一起更可用于比较各国或不同群体之间的人口模式。

    推荐制作的工具有:AnyChart、D3 (重叠版本)、Vega、ZingChart。

    条形图

    63d4dedfc2782ae3c4180e0293198d8d.png

    条形图 (Bar Chart) 也称为「棒形图」或「柱形图」,采用水平或垂直条形(柱形图)来比较不同类别的离散数值。


    图表其中一条轴代表要比较的具体类别,另一条则用作离散数值的标尺。

    条形图的离散数据是分类数据,针对的是单一类别中的数量多少,而不会显示数值在某时间段内的持续发展。

    推荐的制作工具有:MS Excel & Apple Numbers、AnyChart、D3 、DataHero、Datamatic、Datawrapper、Google Charts、Google Docs、Infogr.am、OnlineChartTool.com、Protovis、Slemma、Vega、ZoomCharts。

    多组条形图

    7ebe9509e0fc2a358302aecaa3cc2712.png

    多组条形图也称为「分组条形图」或「复式条形图」,是条形图的变种。

    多组条形图通常用来将分组变量或类别与其他数据组进行比较,也可用来比较迷你直方图,每组内的每个条形将表示变量的显著间隔。

    但缺点是,当有太多条形组合在一起时将难以阅读。

    推荐的制作工具有:D3、DataHero、Datavisual、Datawrapper、Infogr.am、NVD3.js、R Graph Gallery、Slemma、Vega、Visage、ZoomCharts。

    堆叠式条形图

    c5b62dc5b94047fcc1ff49c0a10419d6.png

    跟多组条形图不同,堆叠式条形图 (Stacked Bar Graph) 将多个数据集的条形彼此重迭显示,适合用来显示大型类别如何细分为较小的类别,以及每部分与总量有什么关系。

    堆叠式条形图共分成两种:

    • 简单堆叠式条形图。将分段数值一个接一个地放置,条形的总值就是所有段值加在一起,适合用来比较每个分组/分段的总量。

    • 100% 堆叠式条形图。会显示每组占总体的百分比,并按该组每个数值占整体的百分比来绘制,可用来显示每组中数量之间的相对差异。

    推荐的制作工具有:MS Excel、Apple Numbers、AnyChart、Datavisual、Datawrapper、Infogr.am、Slemma、ZingChart、ZoomCharts。

    不等宽柱状图

    da3b0f496fc5e4402c409a04c4eb48b2.png

    不等宽柱状图 (Marimekko Chart)也称为「马赛克图」,用来显示分类数据中一对变量之间的关系,原理类似双向的 100% 堆叠式条形图,但其中所有条形在数值/标尺轴上具有相等长度,并会被划分成段。

    不等宽柱状图的主要缺点在于难以阅读,特别是当含有大量分段的时候。此外,我们也很难准确地对每个分段进行比较,因为它们并非沿着共同基线排列在一起。

    因此,不等宽柱状图较为适合提供数据概览。

    推荐的制作工具有:D3。

    面积图

    cdf970d6696450719fc8e262d5b705a6.png

    面积图 (Area Graph) 是折线图的一种,但线下面的区域会由颜色或纹理填满。

    跟折线图一样,面积图可显示某时间段内量化数值的变化和发展,最常用来显示趋势,而非表示具体数值。

    两种较常用的面积图是分组式面积图和堆叠式面积图。分组式面积图在相同的零轴开始,而堆叠式面积图则从先前数据系列的最后数据点开始。

    推荐的制作工具有:MS Excel & Apple Numbers、D3、DataHero、Datamatic、Google Charts、Google Docs、Infogr.am、Protovis、Slemma、VegaOnlineChartTool.com。

    比例面积图

    829324cf4adc9216d49686b7547b949a.png

    非常适合用来比较数值和显示比例(尺寸、数量等),以便快速全面地了解数据的相对大小,而无需使用刻度。

    比例面积图通常使用正方形或圆形,常见技术错误是,使用长度来确定形状大小,而非计算形状中的空间面积,导致数值出现指数级的增长和减少。

    推荐的制作工具有:D3、Datamatic、Datavisual、Infogr.am

    堆叠式面积图

    cdb299447ffb313afd849ec522805c01.png

    堆叠式面积图 (Stacked Area Graph) 的原理与简单面积图相同,但它能同时显示多个数据系列,每一个系列的开始点是先前数据系列的结束点。

    堆叠式面积图使用区域面积来表示整数,因此不适用于负值。总的来说,它们适合用来比较同一间隔内多个变量的变化。

    推荐的制作工具有:MS Excel、Apple Numbers、DataHero、Datavisual、Google Docs、Infogr.am、OnlineChartTool、Slemma、Vega、ZingChart、ZoomCharts。

    量化波形图

    cfdcd52aff1e74b5c439afa3e98eeb5c.png

    这种图表是堆叠式面积图的一种变体,但其数值并非沿着固定直线轴来绘制,而是围绕着不断变化的中心基线。

    通过使用流动的有机形状,量化波形图 (Stream Graph) 可显示不同类别的数据随着时间的变化,这些有机形状有点像河流,因此量化波形图看起来相当美观。

    在量化波形图中,每个波浪的形状大小都与每个类别中的数值成比例。与波形图平行流动的轴用作时间刻度。我们也可以用不同颜色区分每个类别,或者通过改变色彩来显示每个类别的附加定量值。

    此外,当他们以互动形式展示时,比静态或印刷出来更有效率。

    推荐的制作工具有:Bob Rudis' GitHub、D3、infogr.am、JSFiddle、Lee Byron's GitHub、NVD3.js、plotDB、Protovis、RAWGraphs、Stream graph generator。

    雷达图

    70491e4bcdf4ff0311f97af64adffdb9.png

    雷达图 (Radar Chart) 又称为「蜘蛛图」、「极地图」或「星图」,是用来比较多个定量变量的方法,可用于查看哪些变量具有相似数值,或者每个变量中有没有任何异常值。

    此外,雷达图也可用于查看数据集中哪些变量得分较高/低,是显示性能表现的理想之选。

    每个变量都具有自己的轴(从中心开始)。所有的轴都以径向排列,彼此之间的距离相等,所有轴都有相同的刻度。轴与轴之间的网格线通常只作指引用途。每个变量数值会画在其所属轴线之上,数据集内的所有变量将连在一起形成一个多边形。

    推荐的制作工具有:Amcharts、AnyChart、Google Docs、jChartFX、Online Chart Tool、ZingChart。

    桑基图

    cbef287959648ba9b94889a180bec1aa.png

    桑基图 (Sankey Diagram) 用来显示流向和数量。

    在每个流程阶段中,流向箭头或线可以组合在一起,或者往不同路径各自分开。我们可用不同颜色来区分图表中的不同类别,或表示从一个阶段到另一个阶段的转换。

    推荐的制作工具有:RAWGraphs、Sankey Diagram Generator、Sankey Diagrams Blog Software List、Sankey Flow Show、SankeyMATIC、Tamc。

    平行集合图

    e7981e6f805ad18cc36e8d1ba23582fe.png

    平行集合图与桑基图类似,都显示流程和比例,但平行集合图不使用箭头,它们在每个所显示的线集 (line-set) 划分流程路径。

    每个线集对应于一个维度/数据集,其数值/类别由该线集内的不同线段所表示。每条线的宽度和流程路径,均由类别总数的比例份数所决定。每条流程路径都可以用不同颜色代表,以显示和比较不同类别之间的分布。

    推荐工具有:EagerEyes: ParallelSets、Jason Davies、Sankey Diagram Generator、SankeyMATIC。

    误差线

    b0c46f9fc474893997e7598641aa67c3.png

    误差线可以作为一项增强功能来显示数据变化,通常用于显示范围数据集中的标准偏差、标准误差、置信区间或最小/最大值。

    误差线总是平行于定量标尺的轴线,可以是垂直或水平显示(取决于定量标尺是在 Y 轴还是 X 轴上)。

    推荐的工具有:AnyChart、Highcharts、plotly、Vega。

    树形结构图

    52e6caed302fa246a7953eb5e13b8eae.png

    树状结构图 (Treemap) 是一种利用嵌套式矩形显示层次结构的方法,同时通过面积大小显示每个类别的数量。

    每个类别会获分配一个矩形区域,而其子类别则由嵌套在其中的小矩形代表。当不同数量被分配到各个类别时,这些矩形的面积大小会与此数量成正比显示。

    Ben Shneiderman 最初开发树状结构图用来在计算机上显示大量文件目录,而不会占用太多屏幕空间,因此树状结构图是一种紧凑而且节省空间的层次结构显示方式,可让人快速了解结构。

    推荐的制作工具有:AnyChart、D3、Datamatic、Google Charts、Google Docs、Infogr.am、jChartFX、RAWGraphs、Slemma、Vega、ZingChart。

    圆堆积图

    ca60929523fd37c82147ba81b9611a18.png

    圆堆积 (Circle Packing) 也称为「圆形树结构图」,是树形结构图的变体,使用圆形(而非矩形)一层又一层地代表整个层次结构。

    每个圆形的面积也可用来表示额外任意数值,如数量或文件大小。我们也可用颜色将数据进行分类,或通过不同色调表示另一个变量。

    虽然圆堆积看起来漂亮,但不及树形结构图般节省空间(因为圆圈内会有很多空白处),可是它实际上比树形结构图更能有效显示层次结构。

    推荐的制作工具有:D3、D3 Zoomable、RAWGraphs。

    饼图

    4905c66f8710cd4dc030dd83c0e22479.png

    饼形图 (Pie Chart) 把一个圆圈划分成不同比例的分段,以展示各个类别之间的比例。

    饼形图适合用来快速展示数据比例分布,但主要缺点是:不能显示太多项目、通常需要图例说明、不能准确比较。

    制作工具有很多:D3、DataHero、Datamatic、Datavisual、Datawrapper、Google Charts、 Google Docs、Infogr.am、Protovis、OnlineChartTool.com、Slemma、ZingChart...

    圆环图

    7d90153a321909980d25202e908980bb.png

    圆环图 (Donut Chart) 基本上就是饼形图,只是中间的部分被切掉。

    不过,圆环图还是比饼形图略有优势,它让人不再只看「饼」的面积,反面更重视总体数值的变化:专注于阅读弧线的长度,而不是比较「饼与饼」之间的比例不同。

    另外,圆环图中间的空白处更可以用来显示其他信息,因此更能节省空间。

    推荐的制作工具有:D3、DataHero、Datamatic、Datavisual、Datawrapper、Google Docs、Infogr.am、Protovis、Slemma、Visage、ZingChart、ZoomCharts。

    南丁格尔玫瑰图

    fde0fae0bbe5279a1eeadb2974487c87.png

    南丁格尔玫瑰图 (Nightingale Rose Charts) 又称为「极面积图」。

    统计学家和医学改革家佛罗伦萨‧南丁格尔 (Florence Nightingale) 曾在克里米亚战争期间使用这种图表传达士兵身亡情况,故得名。

    在南丁格尔玫瑰图中,代表数值的是分段面积,而不是其半径。

    推荐的制作工具有:Datamatic、Infogr.am。

    旭日图

    e313bd87a1cbacd9c218c850f13ccdbf.png

    也称为「多层饼形图」或「径向树图」,通过一系列的圆环显示层次结构,再按不同类别节点进行切割。

    推荐的制作工具有:Aculocity、D3、JavaScript InfoVis Toolkit、MS Office、Protovis、RAWGraphs、

    螺旋图

    19296121864ec7b50309001d5fef944f.png

    也称为「时间系列螺旋图」,沿阿基米德螺旋线 (Archimedean spiral) 画上基于时间的数据。

    图表从螺旋形的中心点开始往外发展。螺旋图十分多变,可使用条形、线条或数据点,沿着螺旋路径显示。

    螺旋图很适合用来显示大型数据集,通常显示长时间段内的数据趋势,因此能有效显示周期性的模式。

    推荐的制作工具有:Arpit Narechania's Block。

    径向条形图

    52770741421216bab8f34008edfa5bb1.png

    径向条形图是在极坐标系上绘制的条形图。

    虽然看起来很美观,但径向条形图上条形的长度可能会被人误解。

    推荐制作工具有:AnyChart。

    径向柱图

    bde1e39a2ed02e1ed443cd4cd03c5365.png

    也称为「圆形柱图」或「星图」。

    这种图表使用同心圆网格来绘制条形图。每个圆圈表示一个数值刻度,而径向分隔线则用作区分不同类别或间隔(如果是直方图)。

    条形通常从中心点开始向外延伸,但也可以别处为起点以显示数值范围(如跨度图)。此外,条形也可以如堆叠式条形图般堆叠起来。

    推荐的制作工具有:jChartFX、Bokeh。

    热图

    6b574bac7791cc18a11364724c4d1ac5.png

    热图 (Heatmap) 通过色彩变化来显示数据,当应用在表格时,热图适合用来交叉检查多变量的数据。

    热图适用于显示多个变量之间的差异;显示当中任何模式;显示是否有彼此相似的变量;以及检测彼此之间是否存在任何相关性。

    由于热图依赖颜色来表达数值,它比较适合用来显示广泛数值数据,因为要准确地指出色调之间的差异始终有难度,也较难从中提取特定数据点(除非在单元格中加入原始数据)。

    推荐的制作工具有:MS Excel、Apple Numbers、Amcharts、AnyChart、Highcharts、jChartFX、plot.ly、R Graph、Zing Chart。

    散点图

    b90e89c191a1effcaa0c324367657215.png

    散点图 (Scatterplot) 也称为「点图」、「散布图」或「X-Y 点图」,用来显示两个变量的数值(每个轴上显示一个变量),并检测两个变量之间的关系或相关性是否存在。

    图表中可加入直线或曲线来辅助分析,并显示当所有数据点凝聚成单行时的模样,通常称为「最佳拟合线」或「趋势线」。

    如您有一对数值数据,可使用散点图来查看其中一个变量是否在影响着另一个变量。可是请记住,相关性并非因果关系,也有可能存在另一个变量在影响着结果。

    推荐的制作工具有:MS Excel、Apple Numbers、D3、DataHero、Datavisual、Google Charts、Google Docs、Infogr.am、OnlineChartTool.com、Vega、Visage、ZingChart。

    气泡图

    f704e8e6a848b31e466eeea668a60190.png

    气泡图是一种包含多个变量的图表,结合了散点图和比例面积图,圆圈大小需要按照圆的面积来绘制,而非其半径或直径。

    通过利用定位和比例,气泡图通常用来比较和显示已标记/已分类的圆圈之间的关系。

    可是,过多气泡会使图表难以阅读,但我们可以在图表中加入交互性功能来解决这个问题(点击或把鼠标悬停在气泡上以显示隐藏信息),也可选择重组或筛选分组类别。

    推荐制作的工具有:AnyChart、Google Charts、Google Docs、Infogr.am、jChartFX、Online Chart Tool、RAWGraphs、Slemma、Visage、ZingChart

    气泡地形图

    45d2c5eb9414f3f1af922523d3381999.png

    在这种数据地图中,指定地理区域上方会显示圆形图案,圆形面积与其在数据集中的数值会成正比。

    气泡地图适合用来比较不同地理区域之间的比例,而不会受区域面积的影响。但气泡地图的主要缺点在于:过大的气泡可能会与地图上其他气泡或区域出现重迭。

    推荐的制作工具有:AnyChart、CARTO、Datavisual、Khartis、Google docs、Polymaps、ZoomCharts。

    地区分布图

    471b968580b2b60dff9a0bf6023a07bd.png

    地区分布图通常用来显示不同区域与数据变量之间的关系,并把所显示位置的数值变化或模式进行可视化处理。

    我们在地图上每个区域以不同深浅度的颜色表示数据变量,例如从一种颜色渐变成另一种颜色、单色调渐进、从透明到不透明、从光到暗,甚至动用整个色谱。

    但缺点是无法准确读取或比较地图中的数值。此外,较大的地区会比较小区域更加显眼,影响读者对数值的感知。

    绘制地区分布图时的常见错误:对原始数据值(例如人口)进行运算,而不是使用归一化值(例:计算每平方公里的人口)。

    推荐的制作工具有:amMaps、D3、d3.geomap、Google Charts、Google Docs、DataHero、Datamatic、Datawrapper、Infogr.am、Kartograph、Polymaps、Slemma、Target Map.com、Vega。

    点示地图

    94c79cea8b5dd42496ef8bd5e0ea42db.png

    点示地图 (Dot Map) 也称为「点示分布图」或「点示密度图」。在地理区域上放置相等大小的圆点,旨在检测该地域上的空间布局或数据分布。

    点示地图共有两种:一对一(每点代表单一计数或一件物件)和一对多(每点表示一个特定单位,例如 1 点 = 10棵树)。

    点示地图非常适合用来查看物件在某地域内的分布状况和模式,而且容易掌握,能提供数据概览。

    推荐的制作工具有:AnyChart、CARTO、Datavisual、Infogr.am、Khartis、mbostock's blocks、R Graph Gallery、ZoomCharts。

    连接地图

    9b9c17bea868a22eb9d127096ed6f585.png

    连接地图 (Connection Map) 是用直线或曲线连接地图上不同地点的一种图表。

    连接地图非常适合用来显示地理连接和关系,也可以通过研究连接地图上的连接分布或集中程度来显示空间格局。

    推荐的制作工具是:AnyChart、ECharts、Javascript Maps、Curved、Straight、ZoomCharts。

    流向地图

    051e83c317d07c4b6a0a936ac99050d7.png

    流向地图 (Flow Map) 在地图上显示信息或物体从一个位置到另一个位置的移动及其数量,通常用来显示人物、动物和产品的迁移数据。

    单一流向线所代表的移动规模或数量由其粗幼度表示,有助显示迁移活动的地理分布。

    推荐的制作工具有:AnyChart。

    甘特图

    9b9557438956409e0b2e704cadc84b52.png

    甘特图 (Gantt Chart) 通常用作项目管理的组织工具,显示活动(或任务)列表和持续时间,也显示每项活动何时开始和结束。

    甘特图适合用来规划和估计整个项目的所需时间,也可显示相互重迭的活动。

    推荐的制作工具有:AnyChart、Amcharts、DHTMLX、GanttPro、Google Charts、Redbooth、RAWGraphs、Smartsheet。

    箱形图

    d03d07e91727db5e580913b4d5bd8680.png

    箱形图又称为「盒须图」或「箱线图」,能方便显示数字数据组的四分位数,可以垂直或水平的形式出现。

    从盒子两端延伸出来的线条称为「晶须」(whiskers),用来表示上、下四分位数以外的变量。异常值 (Outliers) 有时会以与晶须处于同一水平的单一数据点表示。

    箱形图通常用于描述性统计,是以图形方式快速查看一个或多个数据集的好方法。

    推荐的制作工具有:AnyChart、D3、Protovis、R AWGraphs、R Graph Gallery、ZingChart。

    子弹图

    8bcfb9a282dc7bafe80f04ea2d467c28.png

    子弹图 (Bullet Graph) 的功能类似于条形图,但加入更多视像元素,提供更多补充信息。

    子弹图最初由 Stephen Few 开发,用来取代仪表盘上如里程表或时速表这类图形仪表,解决显示信息不足的问题,而且能有效节省空间,更可除掉仪表盘上一些不必要的东西。

    推荐的制作工具有:am chartsAnyChart、D3、DimpleJS、IgniteUI、jChartFX 、moderndata.plot.ly、NVD3.js、Protovis。

    蜡烛图

    532c5ab382e3af5bfce8a82212d820d6.png

    又名「日本K线图」,通常用来显示和分析证券、衍生工具、外汇货币、股票、债券等商品随着时间的价格变动。

    蜡烛图通过使用烛台式的符号来显示多种价格信息,例如开盘价、收盘价、最高价和最低价,每个代表单一时间段(每分钟、每小时、每天或每月)的交易活动。每个烛台符号沿着 X 轴上的时间刻度绘制,显示随着时间推移的交易活动。

    但是,蜡烛图只能显示开盘价和收盘价之间的关系,而非两者之间所发生的事件,因此也无法用来解释交易波动的缘由。

    推荐的制作工具有:Aaron Beppu's Block、amcharts、AnyChart、CanvasJS、ECharts、Google Chart、Google Docs、infogr.am、plotly、Protovis、ZingChart、ZoomCharts

    跨度图

    997b3dcd4a956cc7242f61311354c86b.png

    也称为「范围条形/柱形图」或「浮动条形图」,用来显示数据集内最小值和最大值之间的范围,适合用来比较范围,尤其是已分类的范围。

    跨度图只集中显示极端数值,不提供任何关于最小值和最大值之间的数值、整体平均值或数据分布等其他信息。

    推荐制作工具有:AnyChart、D3, Arpit Narechania's Block、ZingChart。

    卡吉图

    8a5614834a77dfebe2ecd94dc5b4115a.png

    卡吉图 (Kagi Chart)能通过一系列线段显示价格表现,进而显示特定资产的一般供需水平。由于与时间无直接关系,它能更清晰地显示重要的价格走势。

    推荐的制作工具有:D3、Arpit Narechania's Block、FusionCharts、Ragu Ramaswamy's Block、Wolfram Mathematica、

    美国线

    5dc7cdad5d4335352206daf27698a8dc.png

    美国线 (Open-high-low-close Charts) 也称为「OHLC 图」或「价格图」,通常用作交易工具,显示和分析证券、货币、股票、债券等商品随时间的价格变动。

    推荐的制作工具有:Amcharts、AnyChart、ByteMuse.com、CanvasJS、jChartFX、Plotly、vaadin、Zing Chart。

    弦图

    fb15606f05a08794aebe323d0115c4c9.png

    弦图 (Chord Diagram) 可以显示不同实体之间的相互关系和彼此共享的一些共通之处,因此这种图表非常适合用来比较数据集或不同数据组之间的相似性。

    节点围绕着圆周分布,点与点之间以弧线或贝塞尔曲线彼此连接以显示当中关系,然后通过每个圆弧的大小比例再给每个连接分配数值。此外,也可以用颜色将数据分成不同类别,有助于进行比较和区分。

    推荐的制作工具有:Circos、D3、R Graph Gallery、ZingChart。

    非彩带弦图

    0d3f6f95279f1d81c1346cbea8d7cb02.png

    非彩带弦图 (Non-ribbon Chord Diagram) 是弦图的一个精简版本,仅显示节点和连接线,更加强调数据之间的连接关系。

    推荐的制作工具有:Circos。

    树形图

    85c8f26fc67ecf2bb73f0aa9bceab2e4.png

    树形图 (Tree Diagram) 也称为「组织图」或「链路图」,是通过树状结构表示层次结构的一种方式。

    其结构通常由没有上级/父级成员的元素开始(根节点),然后加入节点,再用线连在一起,称为分支,表示成员之间的关系和连接。最后是枝叶节点(或称为末端节点),是没有子节点的成员。

    树形图通常用于表示家庭关系和血统、分类学、进化科学、计算机科学与数学等,也是企业和组织的管理工具。

    推荐的工具有:Datamatic、Google Charts、Google Docs、giffy、Zoomcharts。

    流程图

    584cfc84674c42cf1cabe8bc869d2b20.png

    流程图 (Flow Chart) 使用一系列相互连接的符号绘制出整个过程,从而解释复杂和/或抽象的过程、系统、概念或算法的运作模式。

    不同符号代表不同意思,每种都具有各自的特定形状。流程图以弧形矩形表示流程的开始和结束;线段或箭头用于显示从一个步骤到另一个步骤的方向或流程;简单的指令或动作用矩形来表示,而当需要作出决定时,则使用钻石形状...

    推荐的制作工具有:asciiflow、Creately、draw.io、gliffy、GoJS、Google Drawings、LucidChart、MS Visio。

    脑力激荡图图

    3e932d68ea6c98b5be4cdfb5cabb43aa.png

    脑力激荡图也称为「心智图」,可以将相关想法、单词、图像和概念联合在一起。

    脑力激荡图经常在项目初期使用,用来产生想法、查找关联、分类想法、组织信息、显示结构和一般学习。

    推荐的制作工具有:Coggle、MindMup

    记数符号图表

    3d15d1e46c995d4dffe2d4c872fc6bdd.png

    记数符号图表 (Tally Chart) 既是记录工具,也可通过使用标记数字系统来显示数据分布频率。

    在绘制记数符号图表时,将类别、数值或间隔放置在同一个轴或列(通常为 Y 轴或左侧第一列)上。每当出现数值时,在相应的列或行中添加记数符号。

    完成收集所有数据后,把所有标记加起来并把总数写在下一列或下一行中,最终结果类似于直方图。

    推荐的制作工具有:纸和笔。

    日历图

    3bb75fdeb6efd1a9db519525f5861ee2.png

    人类曾开发出各种日历系统作为组织工具,帮助我们提前做好计划。我们也把日历当作可视化工具,适用于显示不同时间段的活动事件的组织情况。

    今天我们最常用的日历形式是公历,每个月份的月历由七个垂直列组成(代表每周七天),另有约五至六行以水平方式代表星期。

    可是,日历格式并没有严格规定,所以市面上有各式各样不同的设计,只要能以时间顺序显示日期或时间单位便可。

    推荐的制作工具有:TimeandDate.com、Calendar Creator、ZingChart

    时间线

    3d42b4f53d11416c8a425fdb01cddc0a.png

    时间线 (Timeline) 是以时间顺序显示一系列事件的图象化方式,主要功能是传达时间相关信息,用于分析或呈现历史故事。

    如果是按比例绘制的时间线,我们可以通过查看不同事件之间的时间间隔,了解事件发生的时间或即将在何时发生,从中查找时间段内的事件是否遵循任何模式,或者事件在该时间段内如何分布。

    有时时间线会与图表相互结合,显示定量数据随时间的变化。

    推荐的制作工具有:Google Charts、Timeline.js、Tiki-Toki、Vega。

    时间表

    51cf319f63d9aeaab95bf650867316f7.png

    时间表 (Timetable) 可用作预定事件、任务和行动的引用和管理工具。

    使用表格按时间顺序和/或字母顺序组织数据,能有助用户快速进行引用。

    象形图

    d55c7143ae9ee4371dfe91b8555389c9.png

    说明图旨在使用笔记、标签和图例来解释说明所显示的图像,以便解释概念或方法、描述物件或场所、显示事情的运作变化或帮助了解所显示的主题。

    所使用的图像可以是象征性、图像化或真实相片。

    茎叶图

    1418752655744777846220b815b365e8.png

    茎叶图 (Stem & Leaf Plots) 又称为「枝叶图」,是一种按位数 (place value)组织数据的方法,可用来显示数据分布。

    不变的位数由小至大、由上至下显示在中间的「茎」(通常是以十为单位),每个位数之内的数据则会成为「叶」并横向延伸。

    除了向读者快速提供数据分布信息之外,茎叶图也可用于突出异常值和查找模式。如果您有两个数据集,则可使用背对背或双重茎叶图来比较两者。

    推荐的制作工具有:CalculatorSoup、Easycalculation.com、Protovis。

    文氏图

    ee9e63f6bcb725de7ccc9d6d368429d7.png

    文氏图 (Venn Diagram) 也称为「集合图」,显示集与集之间所有可能存在的逻辑关系,每个集通常以一个圆圈表示。

    每个集都是一组具有共同之处的物件或数据,当多个圆圈(集)相互重迭时,称为交集 (intersection),里面的数据同时具有重迭集中的所有属性。

    推荐工具有:Datamatic、gliffy、R Graph Gallery、ZingChart。

    小提琴图

    1fc23fb3673061626bb68656ac3b0268.png

    小提琴图 (Violin Plot) 结合了箱形图和密度图的特征,主要用来显示数据的分布形状。

    中间的黑色粗条表示四分位数范围,从其延伸的幼细黑线代表 95% 置信区间,而白点则为中位数。

    推荐的制作工具有:The R Graph Gallery、seaborn、z-m-k's Blocks。

    字云图

    28d971077752861ffc065aef539628ec.png

    字云图 (Word Cloud) 也称为「标签云图」、「词云」等,每个此的大小与其出现频率成正比,以此显示不同单词在给定文本中的出现频率,然后将所有的字词排在一起,形成云状图案。

    在字云图上使用颜色通常都是毫无意义的,主要是为了美观,但我们可以用颜色对单词进行分类。

    推荐的制作工具有:D3、Datamatic、Infogr.am、R Graph Gallery、Vega、Visage、Wordclouds.com、Wordle、ZingChart。

    推荐阅读  点击标题可跳转

    56917237919151e1599d251c9294d68f.gif

    展开全文
  • waffle可以使用该pywaffle软件包创建该图表,并用于显示较大人群中各组的组成。 #! pip install pywaffle # Reference: ...
  • 可视化图表包括直方图,折线,散点,三维,二维,经纬图等 代码和示例,
  • Echarts是一款由百度公司开发的开源数据可视化JS库,pyecharts是一款使用python调用echarts生成数据可视化的类库,可实现柱状图,折线图,饼状图,地图等统计图表。 2、柱状图 适用场合是二维数据集(每个数据点...
  • 本人博客中数据挖掘与数据分析板块的Python数据可视化的例子的数据集 本人博客中数据挖掘与数据分析板块的Python数据可视化的例子的数据集 本人博客中数据挖掘与数据分析板块的Python数据可视化的例子的数据集 本人...
  • 一百万行定宽数据python数据可视化文档,python数据可视化编程实战配套文档,读取定宽数据一百万行定宽数据python数据可视化文档
  • Python数据可视化编程实战是一本使用Python实现数据...《Python数据可视化编程实战》适合那些对Python编程有一定基础的开发人员,可以帮助读者从头开始了解数据数据格式、数据可视化,并学会使用Python可视化数据
  • Python数据图表可视化

    2021-06-21 01:46:24
    数据分析是一门重要的技能,职场中掌握了数据分析技术往往能让人另眼相看,而数据可视化数据分析的结果展示最有效的手段,本视频是Pandas数据分析课程的后续课程,可以掌握各种图表的绘制方法,通过实际案例的讲解...
  • python基于51job数据可视化图表展示源码,基于51job工作招聘数据可视化图表展示 web 数据挖掘,ECharts可视化。python基于51job数据可视化图表展示源码,基于51job工作招聘数据可视化图表展示 web 数据挖掘,ECharts...
  • 第一章内容发布在(使用Python制作疫情数据分析可视化图表(一))https://blog.csdn.net/yue__yang/article/details/104538235,请自行食用。 二、时间序列与区域划分 1、数据类型转换为时间序列 在数据中,有一个...
  • PYTHON数据可视化编程实战,全文高清pdf版本 Python Data Visualization Cookbook.pdf 人民邮电出版社 掌握和使用正确的数据可视化方法
  • 主要介绍了Python数据可视化处理库PyEcharts柱状图、饼图、线性图常用实例详解,需要的朋友可以参考下
  •  Matplotlib是Python中最常用的可视化工具之一,可以非常方便地创建海量类型地2D图表和一些基本的3D图表,可根据数据集(DataFrame,Series)自行定义x,y轴,绘制图形(线形图,柱状图,直方图,密度图,散布图等等...
  • 主要给大家介绍了关于Python数据可视化教程之利用Matplotlib实现各种图表的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面来一起看看吧
  • 个人Python学习,数据可视化项目的笔记记录(一),原创。
  • 本书包含以下内容: ·安装和使用IPython ·使用Python虚拟环境 ·安装并定制化NumPy和matplotlib ·绘制一般的和高级的...·使用地图可视化数据 ·创建3D动画数据可视化 ·从各种格式导入数据 ·导出数据到各种格式
  • echarts是百度开源的一个数据可视化 JS 库,主要用于数据可视化。pyecharts 是一个用于生成 Echarts 图表的类库。实际上就是 Echarts 与 Python 的对接。 使用 pyecharts可以生成独立的网页,也可以在 flask , ...
  • 主要介绍了Python数据可视化实现正态分布(高斯分布),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
  • Python数据可视化[印]科斯·拉曼(Kirthi Raman)【扫描版】,PDF格式
  • Python数据可视化

    2021-02-24 22:45:44
    Echarts是百度开源的一个数据可视化JS库。主要用于数据可视化。pyecharts兼容Python2和Python3。目前版本为0.1.2首先开始来绘制你的第一个图表Tip:可以按右边的下载按钮将图片下载到本地add()主要方法,用于添加...
  • 阅读本文大约需要 3 分钟 ...言归正传,经过了01-03这3篇文章的积累,相信大家对Python数据分析也有了一定的认知,今天OF向大家介绍轻松学Python数据分析系列的第4部分:数据可视化图表(1读取.

    阅读本文大约需要 3 分钟

    摘 要

    不要把生命献给平庸低俗,工作应该是快乐的,如果你不喜欢,就放下,无所谓的。经历了2020-2021年的这些时光,OF越来越希望将自己的时间用在喜欢的事上,比如分享这些可能毫不起眼的数据分析知识,哪怕是有一位读者能够被我们的上进态度所激励,或者能学到一个知识点,OF都会心满意足。

    言归正传,经过了01-03这3篇文章的积累,相信大家对Python数据分析也有了一定的认知,今天OF向大家介绍轻松学Python数据分析系列的第4部分:数据可视化图表(1读取数据集->2数据处理->3数据可视化图表)。

    • 主要内容:Excel 办公自动化和数据分析

    • 适用人群:办公室职员 / Python 初学者 / 有志从事数据分析工作的人员

    • 准备内容:Anaconda-Spyder,pandas、seaborn、matplotlib.pyplot库

    不会安装库的可以参考如下教程:

    Anaconda如何安装Python库​

    图标

    一、读取数据集

    OF在第03篇文章中已经介绍过了如何下载、读取数据集(文末有01-03篇的链接),就不再赘述。先读取一个目标数据集,以下例子的数据集是在Kaggle下载的(澳大利亚的房产数据),如果需要该数据集也可以私信我。

    import pandas as pd
    house = pd.read_csv(r'D:\XX\housetest.csv')

    拿到这样一个数据集,我们先看看里面有些什么样的数据(把我们要分析的数据列展现出来):

    二、数据处理

    承接03篇的数据处理方式,我们先观察地下室总面积列的数据。

    import pandas as pd house = pd.read_csv(r'D:\XX\housetest.csv') 
    
    print(house["TotalBsmtSF"].isnull().sum())

    输出结果:

    1

    我们可以看到,该列有一个数据是空值,处理缺失值可以分为两类:删除缺失值和缺失值插补。我们以平均数插补为例:

    import pandas as pd 
    house = pd.read_csv(r'D:\XX\housetest.csv') 
    #将house数据集中"地下室总面积"列数组赋给price_null 
    price_null = pd.isnull(house["TotalBsmtSF"]) 
    #将house数据集中"地下室总面积"不为空值的数组赋给good_price 
    good_price = house[price_null == False]["TotalBsmtSF"] 
    #计算good_price的平均值 
    mean_price = good_price.mean() 
    #补充所有缺失值以mean_price这个数值 
    house.loc[price_null == True, "TotalBsmtSF"] = mean_price

    三、读取可视化图表

    经过了数据处理,我们可以开始对数据进行分析了。举个例子,想要统计各种HouseStyle房子的数量,我们可以采用seaborn的barplot。(seaborn教程:https://seaborn.pydata.org/examples/index.html)

    知识点1:完整的数据分析步骤(1读取数据集->2数据处理->3可视化图表呈现)

    import pandas as pd
    import seaborn as sns
    import matplotlib.pyplot as plt
    #1 读取数据集
    house = pd.read_csv(r'D:\XX\housetest.csv')
    
    #2 数据处理
    #将house数据集中"地下室总面积"列数组赋给price_null
    price_null = pd.isnull(house["TotalBsmtSF"])    
    #将house数据集中"地下室总面积"不为空值的数组赋给good_price
    good_price = house[price_null == False]["TotalBsmtSF"]    
    #计算good_price的平均值
    mean_price = good_price.mean()       
    #补充所有缺失值以mean_price这个数值
    house.loc[price_null == True, "TotalBsmtSF"] = mean_price     
    
    #3 可视化图表
    df = house.copy()
    #统计各种房子样式的数量并按降序排序
    house_count = df.groupby('HouseStyle')['TotalBsmtSF'].count().sort_values(ascending=False).reset_index()
    sns.barplot(x="HouseStyle", y="TotalBsmtSF", data=house_count)
    plt.show()

    输出结果:

    上述这个例子为大家快速简单地呈现了可视化的效果,接下来OF要通过这个数据集和seaborn库,来呈现一些常用的图表。

    知识点2:柱形图countplot/barplot

    1)countplot比较简单,计数并画成柱状图。

    import pandas as pd
    import seaborn as sns
    import matplotlib.pyplot as plt
    house = pd.read_csv(r'D:\XX\housetest.csv')
       
    # 建立matplotlib图表
    f, ax1 = plt.subplots(1, 1, figsize=(10, 6), sharex=True)
    
    # 生成柱形图
    x1 = house["HouseStyle"]
    sns.countplot(x=x1, ax=ax1, palette="Greens_d")
    
    # 展现图表
    plt.show()

    输出结果:

    2)barplot,呈现两列数据的关系,这里有个要注意的,因为x,y轴设置了中文字体显示,所以需要加两行代码,否则x,y轴的标题就不显示了。

    plt.rcParams['font.sans-serif']=['SimHei'] #显示中文标签
    plt.rcParams['axes.unicode_minus']=False   #这两行需要手动设置

    完整代码如下:

    import pandas as pd
    import seaborn as sns
    import matplotlib.pyplot as plt
    house = pd.read_csv(r'D:\XX\housetest.csv')
    #将house数据集中"地下室总面积"列数组赋给price_null
    price_null = pd.isnull(house["TotalBsmtSF"])    
    #将house数据集中"地下室总面积"不为空值的数组赋给good_price
    good_price = house[price_null == False]["TotalBsmtSF"]    
    #计算good_price的平均值
    mean_price = good_price.mean()       
    #补充所有缺失值以mean_price这个数值
    house.loc[price_null == True, "TotalBsmtSF"] = mean_price     
    
    # 建立matplotlib图表
    f, ax1 = plt.subplots(1, 1, figsize=(12, 7), sharex=True)
    plt.rcParams['font.sans-serif']=['SimHei'] #显示中文标签
    plt.rcParams['axes.unicode_minus']=False   #这两行需要手动设置
    
    # 生成Sequential类型的柱形图
    x1 = house["HouseStyle"]
    y1 = house["TotalBsmtSF"]
    sns.barplot(x=x1, y=y1, ax=ax1, data=house)
    ax1.set_title('HouseStyle各户型地下室面积情况', fontsize=20)
    ax1.set_xlabel("户型")
    ax1.set_ylabel("地下室面积")
    
    # 展现图表
    plt.show()

    输出结果:

    看了上图,大家会看到黑色的一条柱子,这条柱子指的是y轴(地下室总面积)的范围,可能数据呈现的并不直观,那么我们用boxplot更好些。

    知识点3:箱形图,它能显示出一组数据的 最大值、最小值、中位数及上下四分位数。

    代码,也比较简单,直接将柱形图代码中的sns.barplot,改为sns.boxplot。

    输出结果:

    如果需要再增加一个区域维度,呈现各区域各户型的地下室面积情况,我们需要使用hue属性。

    import pandas as pd
    import seaborn as sns
    import matplotlib.pyplot as plt
    house = pd.read_csv(r'D:\Mechtouch\Pyproject\historypro\datadiagram\housetest.csv')
    #将house数据集中"地下室总面积"列数组赋给price_null
    price_null = pd.isnull(house["TotalBsmtSF"])    
    #将house数据集中"地下室总面积"不为空值的数组赋给good_price
    good_price = house[price_null == False]["TotalBsmtSF"]    
    #计算good_price的平均值
    mean_price = good_price.mean()       
    #补充所有缺失值以mean_price这个数值
    house.loc[price_null == True, "TotalBsmtSF"] = mean_price     
    
    # 建立matplotlib图表
    f, ax1 = plt.subplots(1, 1, figsize=(12, 7), sharex=True)
    plt.rcParams['font.sans-serif']=['SimHei'] #显示中文标签
    plt.rcParams['axes.unicode_minus']=False   #这两行需要手动设置
    
    # 生成柱形图
    x1 = house["HouseStyle"]
    y1 = house["TotalBsmtSF"]
    hue1 = house["MSZoning"]
    sns.boxplot(x=x1, y=y1, ax=ax1, hue=hue1, data=house)
    ax1.set_title('HouseStyle各户型地下室面积情况', fontsize=20)
    ax1.set_xlabel("户型")
    ax1.set_ylabel("地下室面积")
    
    # 展现图表
    sns.despine(offset=10, trim=True)

    输出结果:

    知识点4:直方图和密度图的集合体、线性回归图

    如果我们想把几张图一起显示(横向或纵向),在建立matplotlib时,把参数调整成对应数量

    #纵向数量改第一个参数,横向数量改第二个参数
    f, [ax1, ax2] = plt.subplots(1, 2, figsize=(15, 5))

    完整代码如下:

    import pandas as pd
    import seaborn as sns
    import matplotlib.pyplot as plt
    house = pd.read_csv(r'D:\XX\housetest.csv')
    columns = ['LotArea', 'TotalBsmtSF']
    df = pd.DataFrame(house, columns=columns)
    # 建立matplotlib图表
    f, [ax1, ax2] = plt.subplots(1, 2, figsize=(15, 5))
    # 建筑面积的分布情况
    sns.distplot(df['LotArea'], bins=20, ax=ax1, color='r')
    sns.kdeplot(df['LotArea'], shade=True, ax=ax1)
    # 各建筑面积和地下室面积的关系
    sns.regplot(x='LotArea', y='TotalBsmtSF', data=df, ax=ax2)
    plt.show()

    输出结果:

    结 语

    今天,OF简要介绍了制作数据可视化图表的流程和几种图表的作法,在第5篇关于项目实战的文章中我们将实战一些小项目。OF主要为大家介绍最完整、最简单、最实用的方法来学习办公自动化和数据分析,用Pandas对Excel的数据处理已经足够了。预计还有最后一期展现一个完整的项目实战,尽请期待!

    1、Pandas的数据结构,即基础原理

    轻松学Python数据分析1-最简单实用的Pandas讲解

    2、数据读取和生成

    轻松学Python数据分析2-Excel读取和生成

    3、Pandas的数据处理

    轻松学Python数据分析3-数据处理

    4、数据可视化图表(本篇文章)

    5、项目实战

    • 若有读者对选材和内容有任何建议,请随时评论或私信我,只要是好的建议,OF一定不会辜负大家,会有惊喜🎁送上。

    • 若学员对知识点有疑问或想学习更有用的知识,也请随时评论或私信我,请相信OF的诚意,一定会努力帮助大家发现-解决问题,提高自身的核心竞争力。

    展开全文
  • 《Python数据可视化编程实战》适合那些对Python编程有一定基础的开发人员,可以帮助读者从头开始了解数据数据格式、数据可视化,并学会使用Python可视化数据。 Python数据可视化编程实战目录 第1章 准备工作环境 ...
  • 今天小编就为大家分享一篇Python数据可视化:泊松分布详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • 下面小编就为大家带来一篇基于Python数据可视化利器Matplotlib,绘图入门篇,Pyplot详解。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
  • 《Python数据可视化编程实战》是一本使用Python实现...《Python数据可视化编程实战》适合那些对Python编程有一定基础的开发人员,可以帮助读者从头开始了解数据数据格式、数据可视化,并学会使用Python可视化数据
  • Python数据据可可视视化化教教程程之之Matplotlib实实现现各各种种图图表表实实例例 这篇文章主要给大家介绍了关于Python数据可视化教程之利用Matplotlib实现各种图表的相关资料文中通过示例 码介绍的非常详细对...
  • Python-Data-Visualization-Cookbook python数据可视化第2版 高清版带目录 pdf电子书

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 37,597
精华内容 15,038
关键字:

python数据可视化图表