精华内容
下载资源
问答
  • Excel数据分析图表应用案例精粹_光盘 杨广于 清华大学出版社,2012 目录 第1章 公式与函数基本操作 1  1.1 Excel公式的基本操作 1  1.1.1 公式的输入与编辑 1  1.1.2 公式中的运算符 2  1.1.3 单元格的引用...
  • 数据分析|数据的整理&展示

    千次阅读 2019-10-31 18:25:23
    展示基本都是理论~目录数据预处理品质数据的整理与展示数值型数据的整理与展示数据展示数据预处理数据审核:(检查数据中的错误)原始数据(完整性审核,准确性审核)二手数据(适用性审核,时效性审核,确认是否必要....

    统计学:是收集、整理(筛选、纠错)、分析(找规律:备注)、表述(用图表列示)和解释数据的科学。统计学在数据科学是非常重要的,同时是数据工程师必备的技能;本章主要讲数据的整理&展示基本都是理论~

    目录

    1. 数据预处理

    2. 品质数据的整理与展示

    3. 数值型数据的整理与展示

    4. 数据展示

    数据预处理

    数据审核:(检查数据中的错误)

        原始数据(完整性审核,准确性审核)

        二手数据(适用性审核,时效性审核,确认是否必要做进一步的加工整理)

    筛选:找出符合条件的数据

    排序 :升序和降序、寻找数据的基本特征

    品质数据的整理与展示

    分类数据的整理与展示:

    基本过程:

        1.列出各类别

        2.计算各类别的频数

        3.制作频数分布表

        4.用图像显示数据

    频数:落在各类别中的数据的个数

    比例:某一类别数据占全部数据的比值

    百分比:将比例转成分母为100的形式

    比率:不同类别直接的比值

    顺序数据的整理与展示:

    –亦可计算累计频数(累积百分比):将各类别的频数逐级累加

    –亦可计算累计频率:将各类别的频率(百分比)逐级累加

    –累积有两种:向上累积(沿顺序方向累加)与向下累积(逆顺序方向累加)

    数值型数据的整理与展示

    数据分组

    什么是单变量分组?(概念要点)

    1.将一个变量值作为一组

    2.适合于离散变量

    3.适合于变量值较少的情况

     

    什么是组距分组?(概念要点)

    1.将变量值的一个区间作为一组

    2.适合于连续变量

    3.适合于变量值较多的情况

    4.必须遵循“不重不漏”的原则

    5.可采用等距分组,也可采用不等距分组

    数据展示

    直方图

    1.用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布

    2.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram)

    3.直方图下的总面积等于1

    折线图

    1.折线图也称频数多边形图(Frequency polygon)

    2.是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉。

    3.折线图的两个终点要与横轴相交,具体的做法是

    第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴。

    折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的。

    茎叶图(未分组数据)

    1.用于显示未分组的原始数据的分布

    2.由“茎”和“叶”两部分构成,其图形是由数字组成的

    3.以该组数据的高位数值作树茎,低位数字作树叶

    4.对于n(20≤n≤300)个数据,茎叶图最大行数不超过

     L = [ 10 × log 10 n ]

    5.    茎叶图类似于横置的直方图,但又有区别

    l直方图可大体上看出一组数据的分布状况,但没有给出具体的数值

    l茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息

    注:茎叶图第一行数据 树茎:10   树叶:788   数据个数:3   表示 为数据 107,108,108

    箱线图

    1.用于显示未分组的原始数据或分组数据的分布

    2.箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成

    3.其绘制方法是:

    首先找出一组数据的5个特征值,即最大值、最小值、中位数Me 和两个四分位数(下四分位数QL和上四分位数QU)

    连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接

    往期精选

    机器学习|梯度下降法

    机器学习|逻辑回归

    机器学习|决策树


    关注公众号,加小编微信即可拉入线上交流群

    展开全文
  • 性能测试-性能狗(Perfdog)测试与数据分析

    千次阅读 多人点赞 2020-12-15 16:37:22
    腾讯WeTest客户端性能测试工具:PerfDog性能狗为您提供专业的性能测试工具服务:#性能数据采集:安卓平台、iOS平台、H5、小程序、小游戏等性能数据#性能数据管理:账户信息管理、性能数据管理、图表展示、编辑、版本...

    常见的腾讯性能测试工具:腾讯gt、腾讯wetest、腾讯perfdog
    目前我们做的性能属于前端(属于用户体验),后台是属于服务器的。这里介绍性能狗测试:

    @前言

    一、PerfDog是谁?

    PerfDog性能狗是移动全平台iOS\Android性能测试工具平台,快速定位分析性能问题,提升APP应用及游戏性能和品质,收集无需ROOT/越狱,手机硬件、游戏及应用无需做任何更改,极简化即插即用。

    二、PerfDog提供什么服务?

    腾讯WeTest客户端性能测试工具:PerfDog性能狗为您提供专业的性能测试工具服务:#性能数据采集:安卓平台、iOS平台、H5、小程序、小游戏等性能数据#性能数据管理:账户信息管理、性能数据管理、图表展示、编辑、版本对比、性能测试任务管理#团队协作:支持随时随地创建任务,成员邀请、管理、测试任务及数据共享和查看#测试报告:可通过截图录屏等查看到明确的执行步骤,并展示时间轴、截图轨迹、性能轨迹、测试日志等内容。

    三、使用性能狗

    工具:性能狗在这里插入图片描述
    下载网址:https://perfdog.qq.com/
    登录方式:TAPD账号
    平台:安卓、IOS平台
    其他工具:无线网卡
    性能参数:FPS、Jank、FTime、CPU、GPU、Memory、Battery、Network、CTemp等
    建议:IOS需要无线网卡才能连接成功。电脑最好使用win7系统,win 7能驱动无线网卡

    1.测试前准备:

    1、 自己的设备的其他应用全都关闭。
    2、 电量充足,一般70%以上。(其实测试50%以上就行了,但是在测试过程中会耗电)
    3、 不能边充电边进行性能测试。
    4、 保持登录应用的账号不要被其他人挤掉,不然可能测试的性能数据作废了。
    5、 设备。至少要准备三台测试机,覆盖目前的高、中、低配手机(主要看cpu),如果是ios需要更多的机型。

    *PS:
    高档机 骁龙8开头的
    中档机 骁龙6,7开头的
    低档机 骁龙4开头
    (档位高低标准也要看项目方要求,以下只是举例,仅供参考)
    举例机型表

    2.测试时注意点:

    1、 测试过程中,打点和loading 区分开来,loading 会掉帧厉害,战斗测试战术结束加载前打点
    2、 每次录制完一段数据必须杀进程。不然内存会一直升
    3、 个人觉得手机烫,放置一两分钟
    4、 定位、网络、自动锁屏、数据同步、省点模式全部关掉,不录垃圾数据

    3.测试步骤:

    1、在电脑上安装好PerfDog的软件,并登陆。
    2、打开该软件并使用数据线连接手机,选择要测试的手机设备。(有线网络和无线网络,这里使用的是无线网络)
    在这里插入图片描述

    3、在PerfDog上勾选好性能测试需要的参数(不勾选截图,截图记录会影响性能。其余的能勾选的都勾选上。截图是定位问题用的,如果是要定位问题就勾选,而且截图只能在有线情况下使用。)
    在这里插入图片描述
    在这里插入图片描述

    4、在PerfDog上选好需要进行测试的APP,并在手机上打开该APP。(这里需要测试的应用是QQ)
    在这里插入图片描述

    5、 (待游戏趋于稳定状态开始录制,一般等待2分钟)在PerfDog上点击开始进行性能录制
    在这里插入图片描述

    6、按照性能测试用例开始执行(点击tab标记用例)
    7、 选中需要的性能数据,右键上传到PerfDog云端web及本地生成excel表格
    在这里插入图片描述
    8、结束测试
    1、可以在保存excel文件的路径里看到测试的数据
    2、也可以在云端看到自己测试的数据(性能数据同步上传到了PerfDog云端web看板)
    进入云端:点击右上角“云”icon,登录TAPD,进入云端。
    在这里插入图片描述

    进入云端进行查看:
    在这里插入图片描述

    四、性能数据分析

    参数解释:
    FPS: the number of frame rate by the process each second 帧率,每秒播放的图片。可用连环画理解,帧率越高,画面感越好
    Avg(FPS):Average(FPS) 平均帧数(一段时间内的平均FPS)
    FPS >=18[%]
    FPS>=25[%]
    Var(FPS): Variance(FPS) 帧率方差(一段时间内的FPS方差)
    Drop(FPS):降帧次数(平均每小时相邻两个FPS点下降大于8帧的次数)
    Jank:1秒内卡顿次数
    Jank(/10min):平均每10分钟的卡顿次数
    BigJank(/10min):平均每10分钟的严重卡顿次数
    FTime:上下帧画面显示时间间隔,帧的耗时
    Delta(FTime):增量耗时,平均每小时两帧之间时间差>100ms的次数
    Render:渲染器利用率
    Tilter:Tilter利用率
    Network(Recv/Send 测试目标进程流量)
    Battery Power(Current电流、Voltage电压、Power功率)(注:与仪器测试误差<3%左右)

    01 性能测试主要分析参数

    FPS、CPU、GPU、Memory

    FPS:帧率
    帧率简单来说就是一秒内播放了多少帧的图片,如果说帧率越高那么代表画面越流畅,越清晰。
    在性能参数中,关于FPS常见的参数就是AvgFPS(平均帧率)、VarFPS(掉帧次数,就是掉帧超过8的次数)、FPS>=18、FPS>=25、Jank、BigJank

    CPU:中央处理器
    在性能参数中,关于CPU常见的参数就是AvgAppCPU(APP平均CPU使用率)、AppCPU<=60%、AppCPU<=80%、AvgCtemp

    GPU:图像处理器
    在性能参数中,关于GPU常见的参数只有就是AvgGUsage(平均GPU使用率)

    Memory:内存
    在性能参数中,关于Memory常见的参数就是AvgMemory(平均内存)、PeakMemory(峰值内存)

    02 场景用例编写分析

    1.大厅遍历主要是测试:

    第一、相对于挂机对于FPS的关注反而会降低。
    第二、每个功能打开关闭是否释放内存。
    第三、CPU占用率和温度。
    

    2.核心场景各模式要怎么测?
    核心场景是测试:

    第一、各种不同模式的玩法的数据。
    第二、需要总结出不同模式的差异,对数据有个预期。
    第三、设计场景上尽量能设计出每个模式相同的操作或者有一段相同的操作单独打label。
    第四、连续录制几个模式,查看数据。
    

    3.核心内容要怎么测?
    核心内容是测试:

    第一、对应游戏的核心玩法中的常见极端环境。
    第二、核心内容和各种模式不同,它主要是要测一个极端环境下数据的稳定。
    第三、该测试可能会多次录制,进行对比。
    第四、如果数据有问题会进行多次录制,分析场景,定位问题。
    

    4.核心场景新增内容
    什么样的新增内容要怎么测?
    新增内容是测试:

    第一、新增的内容对核心场景有影响。
    第二、新增内容对之前场景数据有影响。
    第三、主要有涉及特效、新模块、新地图等。
    

    03 Perfdog走势图分析

    数据陷阱:
    你在看数据表的时候发现不了问题,但是你打开走势图就很明显可以发现问题。

    1.一个比较正常的数据:
    从入场开始比较正常的一个数据。
    在这里插入图片描述
    内存泄露:
    数据存在内存泄露。(内存在一直上升,可能会导致系统崩溃)
    在这里插入图片描述
    以上差不多了,如有问题请联系我~~~

    展开全文
  • 3D可视化是一种新的管理、分析和交互数据的方式,它能实现实时反射、实时折射、动态阴影等高品质,逼真的实时渲染3D图像。3D数据可视化与一般数据可视化主要区别是更立体,更真实,更有沉浸感。越来越多企业政府需要...

    目前,数据可视化的表现形式分为2D和3D。典型的2D格式数据,通常由电子表格或统计图中的数字组成。而3D数据可视化是指我们实际可以获取并用于规划,制定决策,定位客户等。既表现为将我们在传统图表中看不到的内容实现可视化。

    3D可视化是一种新的管理、分析和交互数据的方式,它能实现实时反射、实时折射、动态阴影等高品质,逼真的实时渲染3D图像。3D数据可视化与一般数据可视化主要区别是更立体,更真实,更有沉浸感。越来越多企业政府需要通过这样的表现形式来凸显自己的政绩或者实力,应用于城市智慧建设、军事电子沙盘、智慧交通等项目实现3D可视化数据

    3D数据可视化除了前端实现和后端与硬件设备的接口,最重要的一点就是UI设计。而与传统的UI设计不同的是,3D数据可视化更多是向空间、建模形式的表达,因此对设计师的三维的理解和空间的交互转变能力尤为重要。
    在这里插入图片描述

    链环科技」数据3D可视化设计分析
    视觉能力:在设计当中,视觉是最基本的能力,主要满足数据可视化当中对于场景、物体的视觉能力,数据图表的视觉效果,对于地图、建筑、数据的视觉表达。通常风格以科技感的风格为主,因此考验的更多是我们设计师的想象力、对于科技产品的表达能力。

    数据可视化能力:需要具备很强的数据表达能力,即将用户想的数据现象通过数据化设计表现出来,理解数据之间的真正含义,对图表的深刻理解才能做出优秀的设计

    三维交互能力:三维软件的交互和二维的不同,虽然在移动端有Z轴的概念,但和3D可视化的项目不同

    建模能力:在实际的工作当中,很多建筑物不能单靠三维想象来进行设计稿创作,因此需要C4D之类的三维建模软件,保证设计感和物体的优质表现能力

    在这里插入图片描述

    3D可视化数据优势

    1.智能建模,还原立体场景

    360度立体视角,还原现实场景,查看相应设备指标、人流状况等信息

    2.实时监测,掌握一手信息

    实现智慧公安,智慧城市、各项数据实时刷新,掌握最新数据信息资源

    3.准确对接,推进项目建设

    特效还原问题数据,进行清洗入库跟踪场景。各项数据处理进度和信息传递过程清晰明了

    4.持续跟踪,把握数据脉搏

    数据持续监控,随时查看最新状态。异样情况即可处理。掌握数据终端进行人员、设备、天气、等指标分析

    在这里插入图片描述

    展开全文
  • 在大多数工业应用和金融商业应用中, X-Y Chart 是一个主要的工具来显示个相关数据或监控实时过程与分析过程品质. 在许多军事应用领域或运动过程控制控制领域(比如机器人运动控制、航空器飞行控制),(弧度模态图...
  • 数据可视化

    2021-01-21 09:24:41
    数据可视化,把数据做成图表数据分析 一、Matplotlib 1.介绍 Matplotlib是一个Python 2D绘图库,它可以在各种平台上以各种硬拷贝格式和交互式环境生成出具有出版品质的图形。 可以通过调用函数轻松方便地绘制...

    数据可视化


    提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档


    前言

    数据可视化,把数据做成图表,数据分析


    一、Matplotlib

    1.介绍


    Matplotlib是一个Python 2D绘图库,它可以在各种平台上以各种硬拷贝格式和交互式环境生成出具有出版品质的图形。
    可以通过调用函数轻松方便地绘制数据分析中常见的各种图像,比如折线图、条形图、柱状图、散点图、饼图等。

    2.常见图形种类及意义

    A.折线图

    折线图:能够显示数据的变化趋势,反映事物的变化情况。(变化)


    B.散点图

    散点图:用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。判断变量之间是否存在数量关联趋势,展示离群点(分布规律)。

    C.柱状图

    柱状图:排列在工作表的列或行中的数据可以绘制到柱状图中。
    特点:绘制离散的数据,能够一眼看出各个数据的大小,比较数据之间的差别。(统计/对比)

    D.直方图

    直方图:由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据范围,纵轴表示分布情况。

    特点:绘制连续性的数据展示一组或者多组数据的分布状况(统计)。

    E.饼图

    饼图:用于表示不同分类的占比情况,通过弧度大小来对比各种分类。
    特点:分类数据的占比情况(占比)。

    在这里插入图片描述

    3.Matplotlib图像结构

    Matplotlib图像结构有三层:


    1. 第一层是底层的容器层,主要包括Canvas、Figure、Axes;
    2. 第二层是辅助显示层,主要包括axis、spines、grid、legend、title等;
    3. 第三层为图像层,即通过plot、scatter等方法绘制的图像。
      在这里插入图片描述在这里插入图片描述

    A.容器层

    容器层里有三层:Canvas,Figure,Axes:


    Canvas是位于最底层的系统层,在绘图的过程中充当画板的角色,即放置画布(Figure)的工具,用户一般接触不到。
    >Figure是Canvas上方的第一层,也是需要用户来操作的应用层的第一层,在绘图的过程中充当画布的角色,我们可以设置画布的大小和分辨率等。
    Axes是应用层的第二层,在绘图的过程中相当于画布上的绘图区的角色。一个Figure对象可以包含多个Axes对象,每个Axes都是一个独立的坐标系,绘图过程中的所有图像都是基于坐标系绘制的。

    在这里插入图片描述

    B.辅助显示层

    辅助显示层为Axes(绘图区)内的除了根据数据绘制出的图像以外的内容,
    主要包括Axes外观(facecolor)、边框线(spines)、坐标轴(axis)、坐标轴名称(axis label)、坐标轴刻度(tick)、坐标轴刻度标签(tick label)、网格线(grid)、图例(legend)、标题(title)等内容。

    在这里插入图片描述

    C.图像层

    图像层指Axes内通过plot、scatter、bar、histogram、pie等函数根据数据绘制出的图像。
    在这里插入图片描述

    4.初始制图步骤(折线图)

    A.引入模块

    from matplotlib import pyplot as plt
    

    B.制作折线图(plt.plot(x,y)

    制作折线图的过程和方法:


    1.绘制二维图形需要确定x、y值:图形中点的值(x, y值的个数要相同)
    2.plt.plot(x,y):根据传过来的x,y值进行绘制折线图 ==plot方法的参数:==

    color=‘green’:设置线的颜色
    alpha=0.5:设置线的透明度,让其拥有似漏非漏的感觉
    inestyle=’—’:设置线的样式,- 实线(solid)、-- 短线(dashed)、-. 短点相间线(dashdot)、:虚点线(dotted)
    linewidth=3:设置线的宽度
    marker=‘o’:设置折点的样式,默认是什么都没有,折点有没有其他的样式呢?当然,向下看
    在这里插入图片描述


    3.plt.show():显示绘制的图形

    B.制作柱状图(plt.bar(x,height,width,color))

    代码参数

    x:记录x轴上的标签
    height:记录每个柱形的高度
    width:设置柱形的宽度
    color:设置柱形的颜色,传入颜色值的列表,例如:['blue','green','red']。
    
    from matplotlib import pyplot as plt
    from matplotlib import font_manager
    a = ['流浪地球','疯狂的外星人','飞驰人生','大黄蜂','熊出没·原始时代','新喜剧之王']
    b = [38.13,19.85,14.89,11.36,6.47,5.93]
    
    my_font = font_manager.FontProperties(fname='/data/course_data/data_analysis/STSONG.TTF')
    plt.figure(figsize=(20,8),dpi=80)
    
    # 绘制柱状图
    rects = plt.bar(a,b,width=0.3,color=['red','green','blue','cyan','yellow','gray'])
    plt.xticks(a,fontproperties=my_font)
    plt.yticks(range(0,41,5),range(0,41,5))
    
    # 在条形图上加标注(水平居中)
    for rect in rects:
        height = rect.get_height()
        plt.text(rect.get_x() + rect.get_width() / 2, height+0.3, str(height),ha="center")
    plt.show()
    

    plt.text(x,y,s,ha,va)

    • 函数为每个柱形标注高度数值。
    • 函数中前两个参数分别为标注数据的坐标,x和y坐标,
    • 参数s记录标注的内容,参数ha和va分别用于设置水平和垂直方向的对齐方式。

    rects是plt.bar()的返回值,里面包含了每一个柱形为每个柱形添加数值标注需要逐个添加,所以我们设置了一个循环来完成这项操作。

    for rect in rects:
        height = rect.get_height()
        plt.text(rect.get_x() + rect.get_width() / 2, height+0.3, str(height),ha="center")
    

    通过get_height()、get_x()、rect.get_width()等方法可以分别拿到柱形图的高度,左侧边的x值,柱子的宽度。然后,使用plt.text添加上文字,这样就可以清晰地看出每个柱形的高度了。

    B.制作直方图(plt.hist())

    直方图一般用来描述等距数据,柱状图一般用来描述名称(类别)数据或顺序数据。直观上,直方图各个长条形是衔接在一起的,表示数据间的数学关系;条形图各长条形之间留有空隙,区分不同的类。

    plt.hist(data, bins, facecolor, edgecolor)

    • data:绘图用到的数据
    • bins:控制直方图中的区间个数
    • facecolor:矩形的填充颜色
    • edgecolor:条形的边框颜色

    C.标题

    制作图的时候,我们需要让其他人清楚这张图的含义是什么,图中x轴表示什么,y轴表示什么

    plt.xlabel('Time')#X轴标题
    plt.ylabel("Temp")#Y轴标题
    plt.title('Title')#整个图的标题
    

    ※练习示例

    本次练习我们使用上节课的爱奇艺视频数据,共有6万多条电影数据,每条数据包含12列信息,文件的路径为/data/course_data/data_analysis/aiqiyi.xlsx,以下获取的前五条数据,现在我们需要画出电影产量与年份的趋势图。

    import pandas as pd
    from matplotlib import pyplot as plt
    df = pd.read_excel('/data/course_data/data_analysis/aiqiyi.xlsx')
    # 根据上映时间分组
    groups = df.groupby('上映时间')
    # 根据评分获取出年份和数量的Series
    num_series = groups['评分'].count()
    # 获取出年份列表
    year_list= num_series.index.tolist()
    # 获取出数量列表
    num_list= num_series.values.tolist()
    
    # 绘制折线
    plt.plot(year_list,num_list) 
    plt.xlabel('year')
    plt.ylabel("Number")
    plt.title('Number/year')
    plt.show()
    

    D.中文显示

    首先我们创建一个字体对象,然后在需要添加中文的地方添加了fontproperties属性.

    我们可以根据需求创建更多的字体对象,还可以通过size属性设置字体的大小,
    这样就可以让我们的图像中文显示的更加多样化。
    

    from matplotlib import font_manager
    my_font = font_manager.FontProperties(fname=’/data/course_data/data_analysis
    添加字体属性
    plt.ylabel(“次数”,fontproperties=my_font)
    plt.xlabel(“时间”,fontproperties=my_font)
    plt.title(‘每分钟跳动次数’,fontproperties=my_font)

    from matplotlib import pyplot as plt
    from matplotlib import font_manager
    import random
    # 创建字体对象
    my_font = font_manager.FontProperties(fname='/data/course_data/data_analysis/STSONG.TTF',size=18)
    x = range(0,120)
    y = [random.randint(10,30) for i in range(120)]
    # 添加字体属性
    plt.ylabel("次数",fontproperties=my_font)
    plt.xlabel("时间",fontproperties=my_font)
    # 设置标题
    plt.title('每分钟跳动次数',fontproperties=my_font)
    plt.plot(x,y)
    plt.show()
    

    E.自定义X轴刻度

    方法1:更改画布大小(plt.figure)

    plt.figure(figsize=(a, b), dpi=dpi)

    • figsize 设置图形的大小,a 为图形的宽, b 为图形的高,
    • dpi 单位为英寸 - dpi 为设置图形每英寸的点数,即每英寸多少个像素
    import pandas as pd
    from matplotlib import pyplot as plt
    df = pd.read_excel('/data/course_data/data_analysis/600001SH.xlsx')
    df.head()
    x = df['日期'].values.tolist()
    y = df['开盘价(元)'].values.tolist()
    
    plt.figure(figsize=(20, 10),dpi=80)
    
    plt.plot(x,y) 
    plt.xlabel('Time')
    plt.ylabel("¥")
    plt.title('open/Time')
    plt.show()
    

    方法2:设置x轴刻度的疏密程度和刻度值(plt.xticks)

    plt.xticks(locs, [labels], **kwargs)

    • locs参数为数组参数,表示x-axis的刻度线显示标注的地方,即ticks放置的地方,
    • 第二个参数也为数组参数,表示在locs数组表示的位置添加的标签。
    import pandas as pd
    from matplotlib import pyplot as plt
    df = pd.read_excel('/data/course_data/data_analysis/600001SH.xlsx')
    df.head()
    x = df['日期'].values.tolist()
    y = df['开盘价(元)'].values.tolist()
    plt.figure(figsize=(20, 10),dpi=80)#更改画布
    plt.plot(x,y) 
    plt.xlabel('Time')
    plt.ylabel("¥")
    plt.title('open/Time')
    # 自定义x轴刻度显示
    plt.xticks(range(0,len(x),3),x[::3],rotation=45)
    plt.show()
    
    • range(0,len(x),3)为xticks()的第一个参数,根据x值的个数调整x轴的刻度疏密程度。

    • x[::3]为xticks()的第二个参数,还是使用x的值作为刻度的标签值,但是这里获取了其中的一部分,确保第一个参数和第二个参数的个数相同。

    • rotation=45默认刻度的值是横向书写的,这样会有一定的重叠,所以我们将文字进行旋转操作,45位旋转的度数。

    F.一图多线

    一个坐标系中绘制两条折线,只需要使用两次plt.plot()方法就可以了。

    在这里插入图片描述

    1.增加图例(plt.legend() plt.grid

    • plt.legend(prop=my_font)是添加图例的方法,
    • prop=my_font参数是设置图例上中文显示的属性,图例上显示的文字我们需要添加在plt.plot(x,y,label=‘开盘价’)方法的label属性中。
    import pandas as pd
    from matplotlib import pyplot as plt
    from matplotlib import font_manager
    my_font = font_manager.FontProperties(fname='/data/course_data/data_analysis/STSONG.TTF')
    
    df = pd.read_excel('/data/course_data/data_analysis/600001SH.xlsx')
    
    x = df['日期'].values.tolist()
    y = df['开盘价(元)'].values.tolist()
    z = df['收盘价(元)'].values.tolist()
    
    plt.figure(figsize=(20, 10),dpi=80)
    plt.plot(x,y,label='开盘价') 
    plt.plot(x,z,label='收盘价') 
    plt.xlabel('Time')
    plt.ylabel("¥")
    plt.title('open/Time')
    # 添加图例
    plt.legend(prop=my_font)
    
    plt.xticks(range(0,len(x),3),x[::3],rotation=45)
    #alpha=0.4 设置透明度
    plt.grid(alpha=0.4)
    
    plt.show()
    

    2.设置网格透明度(plt.grid(alpha=0.4

    alpha=0.4是设置网格线的透明度,范围是(0~1)。

    G.一图多个坐标系子图(== plt.subplot() ==)

    plt.subplot(nrows, ncols, index)

    • nrows 参数指定将数据图区域分成多少行.
    • ncols 参数指定将数据图区域分成多少列.
    • index 参数指定获取第几个区域.

    创建一个包含2行2列,共4个子图。第一个子图的创建方法是plt.subplot(2, 2,1),第二个子图就使用:plt.subplot(2, 2, 2),以此类推。

    from matplotlib import pyplot as plt
    import numpy as np
    x = [1,10,14,15,16,17]
    y = np.array([3,4,6,2,1,5])
    
    plt.figure(figsize = (10,8))
    # 第一个子图
    # 折线图
    plt.subplot(2, 2, 1)
    plt.plot(y)
    plt.title('Axes1')
    #第二个子图
    # 折线图,y轴每个数据的立方
    plt.subplot(2, 2, 2)
    plt.plot(y**3)
    plt.title('Axes2')
    #第三个子图
    # 折线图,x轴和y轴均指定数据
    plt.subplot(2, 2, 3)
    plt.plot(x,y)
    plt.title('Axes3')
    plt.show()
    

    课后题
    1.假设大家在30岁的时候,根据自己的实际情况,统计出来你和你同事各自从11岁到30岁每年交的男/女朋友的数量如列表y1和y2,请在一个图中绘制出该数据的折线图,从而分析每年交朋友的数量走势。

    %matplotlib inline
    import pandas as pd
    from matplotlib import pyplot as plt
    from matplotlib import font_manager
    my_font =font_manager.FontProperties(fname='/data/course_data/data_analysis/STSONG.TTF')
    y1 = [1,0,1,1,2,4,3,4,4,5,6,5,4,3,3,1,1,1,1,1]
    y2 = [1,0,3,1,2,2,3,4,3,2,1,2,1,1,1,1,1,1,1,1]
    
    x = range(11,31)
    # 设置图形
    plt.figure(figsize=(20,8),dpi=80)
    
    plt.plot(x,y1,color='red',label='自己')
    
    plt.plot(x,y2,color='blue',label='同事')
    
    # 设置x轴刻度
    xtick_labels = ['{}岁'.format(i) for i in x]
    
    plt.xticks(x,xtick_labels,fontproperties=my_font,rotation=45)
    
    plt.grid(alpha=0.4)
    
    plt.legend(prop=my_font)
    
    plt.show()
    

    2.数据可视化的时候,常常需要将多个子图放在同一个画板上进行比较,那我们就来练习一下,在同一个画板上画出你还记得的数学函数图形。

    %matplotlib inline
    import pandas as pd
    from matplotlib import pyplot as plt
    import math
    
    x = range(0,10)
    y1 = [i**2 for i in range(0,10)]
    y2 = [i**3 for i in range(0,10)]
    y3 = [i**0.5 for i in range(0,10)]
    
    plt.figure(figsize = (10,8))
    # 第一个子图
    # 平方图
    plt.subplot(2, 2, 1)
    plt.plot(x,y1)
    #第二个子图
    # 立方图
    plt.subplot(2, 2, 2)
    plt.plot(x,y2)
    #第三个子图
    # 平方根图
    plt.subplot(2, 2, 3)
    plt.plot(x,y3)
    
    plt.show()
    
    展开全文
  • 两周前,我们发布了《数据竞赛白皮书·上篇·1000场竞赛的深度分析》,通过28000字的研究分析、54个高品质图表,讲透了数据竞赛行业发展,带领大家看懂了竞赛高热度背后的逻辑。上篇发布后...
  • 两周前,我们发布了《数据竞赛白皮书·上篇·1000场竞赛的深度分析》,通过28000字的研究分析、54个高品质图表,讲透了数据竞赛行业发展,带领大家看懂了竞赛高热度背后的逻辑。 上篇发布后,引发了广泛的讨论,涌进...
  • Java数据编程指南

    2008-07-24 16:17:34
    软件、对象、数据设计与建模 第1章 软件开发的方法与过程 为什么我们需要方法与过程 什么是软件方法与过程 方法的内容 过程模型 源代码管理的要素 软件缺陷与修改的跟踪和解决方案 软件品质...
  • #前言 实时SPC也就是SPC的运行控制图,是实时收集生产过程中的生产数据,如来料检验的数据,生产过程中的...实时图表采用了Bokeh开源图表开发包,Bokeh可以说是数据分析图表的生气,而且本身是python开发的,可以...
  • R语言的入门与提高,由法国德弗里斯、比利时梅斯所著,用R语言进行数据分析和处理,有可复用的分析编写函数和脚本,绘制高品质的表格和图表,构建数据模型,进行数据分析
  • SigmaPlot是一款科学的数据分析和绘图软件,可以进行精密绘图、数据分析、自动化管理数据和创建网络图表,具备制作和发行品质图表的水平,该软件被广泛地运用在多个领域。现今SigmaPlot软件日益受到国人的喜爱,各大...
  • 长期以来,很多职场人士都希望能在自己的数据分析和商务演示中使用数据地图这一形式,来提升专业品质和沟通效率。但由于地图素材和制作工具难以获得,普通办公族很难制作自己的地图,只能对国外媒体和报告上的精美...
  • 所包含的控件有:数据录入,图表数据分析,导航,布局,网格,日程管理,样式,打印和工作流等,让您快速开发出完美、强大的VCL应用程序! DevExpress VCL产品系列允许您创建以Windows 10为核心,模拟高品质触屏...
  • 智能农业控制系统

    2016-01-18 13:48:18
    计算机进行数据分析和处理,以图表呈现给用户,用户可以根据生产需要,控制喷灌、通风、遮阳等物联网设备,或者设置这些设备的自动调控条件,从而保证农作物有一个良好的适宜的生长环境,达到增产增收、提高品质的...
  • Matplotlib简介

    2021-04-05 22:13:59
    Matplotlib试图让简单的事情变得更简单,让无法实现的事情变得可能实现,是Python中最常用的可视化工具之一,它的功能非常强大,可以调用函数轻松的绘制出数据分析中的各种图形,比如折线图、条形图、柱状图、散点图...
  • 统计图介绍

    2013-01-07 13:56:45
    润乾统计图是一款包含了柱、线、饼、区、条、点、雷达、甘特、仪表盘等20多种类型的高品质统计图产品,其功能完善、样式美观丰富,常应用在企业各种数据分析、预警监控的图表展示中,是数据图形化展现一道利器。...
  • 经过我们对2016年上半年手机QQ浏览器用户反馈分析,我们发现“线上问题”解决的主要困难来自于“对解决问题的关键信息获取困难”,统计数据如下:图表——日志获取率和时间大家可以看到:日志的获取率平均只有10%,...
  • IEOEE 的实时协作功能,不仅设计用于提供最佳的 TPEM/TPM 管理制度与和Web网络结合的用户体验,而且向用户提供了10种不同类型的专业OEE分析图表,供决策者和使用者参考。 IEOEE作为精益生产推行的基础工具和强有力...
  • 这些都是一些常用的,已被广泛在过程控制HMI、 科学建模与分析、工程仿真、数据获取、金融股票分析、WEB 设计、和其它一些领域。 客户可以使用这些控件去开发他们的新应用, 或扩展升级已有的系统。 这个控件包的...
  • 谷歌内核的输入法引擎,品质保证,字库文件1MB,不依赖数据库,资源占用低效率极高。支持模糊拼音,比如nh=你好。 可选windows专有版本,支持外部程序输入,比如输入到记事本、QQ聊天窗口等。 整个输入法代码行数...
  • FastReports.4.14.1.D7-XE5

    2013-10-01 20:30:12
    FASTCUBE是一款适用于有效的数据分析的工具。FastCube是一套适用于Delphi/C++Builder/Lazarus的快速桌面OLAP控件。它能不用担心数据库的大小而创建多种报告与图表。[3] 3使用问题 开发WEB应用系统通常都会遇到报表...
  • 数据处理充分利用SQL DBMS的索引技术,保证了在业务繁忙时段和数据量较大时仍然具有快速的响应和良好的性能。客、房、帐、表的穿透查询技术更是独一无二的创新。系统经过公司内部的严格测试和实际用户的实战检验,...
  • SeqAn:专注于生物数据序列分析的算法和数据结构。 Vcflib :用于解析和处理VCF文件的C++库。 Wham:直接把联想测试应用到BAM文件的基因结构变异。 比特流 jech/dht:C实现的比特流分布式哈希表库。 ...
  • 这个区包含了已经处理完的行数、指向被分析语句的指针,整个区是查询语句返回的数据行集。游标就是指向上下文区句柄或指针。  1 显示游标 显示游标被用于处理返回多行数据的SELECT 语句,游标名通过CURSOR….IS ...
  • hostMonitor8.58破解版(注册机)

    热门讨论 2011-09-17 05:09:39
    日志分析仪可以收集统计信息,显示特定时间内所有服务器或者单个服务器的所 有反应时间图表。使用这些统计信息,管理员可以花费些时间分析具体服务器的请求时间。 HostMonito可以直接检查远程主机或使用安 装于另一...
  • PLSQLDeveloper下载

    2012-05-04 11:30:27
    这个区包含了已经处理完的行数、指向被分析语句的指针,整个区是查询语句返回的数据行集。游标就是指向上下文区句柄或指针。 显示游标  显示游标被用于处理返回多行数据的SELECT 语句,游标名通过CURSOR….IS 语句...
  • 千里马酒店前台管理系统V7使用手册

    热门讨论 2011-06-16 14:09:38
    继承了千里马10多年来的优秀品质和丰富经验,同时也借鉴了国内外先进软件的功能特性,吸取了几百家酒店客户的反馈意见,在保持千里马传统的“以财务为核心、前后台一体化”的基础上,进一步吸收了收益管理、客户关系...

空空如也

空空如也

1 2
收藏数 29
精华内容 11
关键字:

品质数据分析图表