精华内容
下载资源
问答
  • python 数据可视化

    2018-07-24 16:44:59
    基础教学: Python数据分析之数据可视化 各种图表类型简介: 『数据可视化』基于Python的数据可视化工具
    展开全文
  • python数据可视化

    千次阅读 2017-04-10 21:59:49
    在实际应用中,往往一些图表的出现可以比文字有更加强大的说服力,这是毋庸置疑的,python是一款极为出色的脚本语言,在数据可视化方面同样做的非常的出色,今天简单的使用matplotlib这个模块来简单的测试一下: ...

         在实际应用中,往往一些图表的出现可以比文字有更加强大的说服力,这是毋庸置疑的,python是一款极为出色的脚本语言,在数据可视化方面同样做的非常的出色,今天简单的使用matplotlib这个模块来简单的测试一下:

    #!/usr/bin/env python
    #coding:utf-8
    
    '''
    功能:使用matplotlib实践数据可视化
    介绍:
    matplotlib是基于numpy的一套Python工具包。这个包提供了丰富的数据绘图工具,主要用于绘制一些统计图形。通过数据绘图,
    我们可以将枯燥的数字转换成容易被人们接受的图表,从而让人留下更加深刻的印象。
    这也就是“字不如图,图不如表”
    data.txt内容如下:
    Apple       494025
    SUN         299967
    HUAWEI      457784
    Flower      440376
    Basketball  399080
    Football    383402
    Banana      293954
    '''
    from matplotlib import pyplot as plt
    labels   = []
    quants   = []
    for line in file('data.txt'):
        info = line.split()
        labels.append(info[0])
        quants.append(float(info[1]))
    plt.figure(1, figsize=(6,6))
    def explode(label, target='China'):
        if label == target: return 0.1
        else: return 0
    expl = map(explode,labels)
    colors  = ["yellow","orange","pink","coral"]
    plt.pie(quants, explode=expl, colors=colors, labels=labels, autopct='%1.1f%%',pctdistance=0.8, shadow=True)
    plt.title('My favorite things', bbox={'facecolor':'0.6', 'pad':4})
    
    plt.show()
    

    结果如下:


    还是很漂亮的感觉,好好的掌握好matplotlib这个强有力的工具可以在今后的工作中达到事半功倍的效果。

    展开全文
  • Python数据可视化

    千次阅读 2020-02-07 10:07:31
    可视化的视图可以说是分门别类,多种多样,今天我主要介绍常用的10种视图,包括了散点图、折线图、直方图、条形图、箱线图、饼图、热力图、蜘蛛图、二元变量分布、成对关系。 散点图 散点图的英文叫做scatter plot...

    可视化的视图可以说是分门别类,多种多样,今天我主要介绍常用的10种视图,包括了散点图、折线图、直方图、条形图、箱线图、饼图、热力图、蜘蛛图、二元变量分布、成对关系。

    散点图

    散点图的英文叫做scatter plot,它将两个变量的值显示在二维坐标中,非常适合展示两个变量之间的关系。当然,除了二维的散点图,我们还有三维的散点图。

    import matplotlib.pyplot as plt

    在工具包引用后,画散点图,需要使用plt.scatter(x, y, marker=None)函数。x、y 是坐标,marker代表了标记的符号。比如“x”、“>”或者“o”。选择不同的marker,呈现出来的符号样式也会不同,

    除了Matplotlib外,你也可以使用Seaborn进行散点图的绘制。在使用Seaborn前,也需要进行包引用:

    import seaborn as sns

    在引用seaborn工具包之后,就可以使用seaborn工具包的函数了。如果想要做散点图,可以直接使用sns.jointplot(x, y, data=None, kind='scatter')函数。其中x、y是data中的下标。data就是我们要传入的数据,一般是DataFrame类型。kind这类我们取scatter,代表散点的意思。当然kind还可以取其他值,这个我在后面的视图中会讲到,不同的kind代表不同的视图绘制方式。

    折线图

    折线图可以用来表示数据随着时间变化的趋势。

    在Matplotlib中,我们可以直接使用plt.plot()函数,当然需要提前把数据按照X轴的大小进行排序,要不画出来的折线图就无法按照X轴递增的顺序展示。

    在Seaborn中,我们使用sns.lineplot (x, y, data=None)函数。其中x、y是data中的下标。data就是我们要传入的数据,一般是DataFrame类型。

    直方图

    直方图是比较常见的视图,它是把横坐标等分成了一定数量的小区间,这个小区间也叫作“箱子”,然后在每个“箱子”内用矩形条(bars)展示该箱子的箱子数(也就是y值),这样就完成了对数据集的直方图分布的可视化。

    在Matplotlib中,我们使用plt.hist(x, bins=10)函数,其中参数x是一维数组,bins代表直方图中的箱子数量,默认是10。

    在Seaborn中,我们使用sns.distplot(x, bins=10, kde=True)函数。其中参数x是一维数组,bins代表直方图中的箱子数量,kde代表显示核密度估计,默认是True,我们也可以把kde设置为False,不进行显示。核密度估计是通过核函数帮我们来估计概率密度的方法。

    热力图

    热力图,英文叫heat map,是一种矩阵表示方法,其中矩阵中的元素值用颜色来代表,不同的颜色代表不同大小的值。通过颜色就能直观地知道某个位置上数值的大小。另外你也可以将这个位置上的颜色,与数据集中的其他位置颜色进行比较。

    热力图是一种非常直观的多元变量分析方法。

    我们一般使用Seaborn中的sns.heatmap(data)函数,其中data代表需要绘制的热力图数据。

     

     

     

     

    展开全文
  • Python数据可视化

    Author:AXYZdong
    自动化专业 工科男
    有一点思考,有一点想法,有一点理性!
    CSDN@AXYZdong,CSDN首发,更多精彩内容请前往 AXYZdong的博客

    环境:Python 3.7
    用到的库:matplotlib 和 csv

    一、前期准备

    安装 matplotlib 库,命令提示符栏输入

    pip install matplotlib
    

    安装的时候可能有点慢,耐心等待。

    关于matplotlib 库的使用方法,可以参考:Matplotlib.pyplot 常用方法

    二、获取数据

    脚本网站:https://greasyfork.org/zh-CN/scripts

    到超星助手统计数据下载 .csv文件,并保存在与python文件相同的目录下。

    提醒:拿到数据后,把第一行的英文删掉,不然 datetime.strptime() 函数转换数据时会出现错误

    三、可视化处理

    # =============================================
    # --*-- coding: utf-8 --*--
    # @Time    : 2020-04-28
    # @Author  : AXYZdong
    # @CSDN    : https://blog.csdn.net/qq_43328313
    # @FileName: demo_1.py
    # @Software: Python3.7
    # =============================================
    
    import matplotlib.pyplot as plt     #导入库
    from datetime import datetime       #导入模块datetime中的datetime类
    import csv
    
    
    date=[]                             #创建列表
    installs=[]
    update_checks=[]
    
    with open('stats.csv', 'r') as f:   #提取stats.csv中的数据并保存在对应列表中
        reader = csv.reader(f)
         
        dates,installs = [],[]
        for row in reader:
            current_date = datetime.strptime(row[0],"%Y-%m-%d")  #包含日期信息的数据row[0]转为datetime对象
            dates.append(current_date)
    
            install = int(row[1])
            installs.append(install)
            
            update_checks.append(row[2])
    
    plt.plot(dates,installs,color= 'red')  #采用条形图,颜色设置为红色
    
    plt.title('the picture about xuexitong help installs', fontsize = 16)   #设置图片名称
    
    plt.xticks(rotation=300)  #x轴标号旋转
    plt.ylabel("", fontsize = 16)
    plt.ylabel("Number", fontsize = 16)
    
    plt.show()  
    

    四、运行结果

    一、折线图

    在这里插入图片描述

    二、条形图

    仅修改一处代码即可

    plt.bar(date,installs,color= 'red')      
    

    在这里插入图片描述

    五、数据说明

    统计的数据为 2018-06-19 ~ 2020-04-13 的安装数。

    可见:2020-03~2020-04 这段时间数据爆棚,具体什么原因嘛,你懂得(手动滑稽)

    六、某助手停止维护后

    又一大佬开始接手,另一个脚本
    在这里插入图片描述

    1、可视化处理

    # =============================================
    # --*-- coding: utf-8 --*--
    # @Time    : 2020-04-28
    # @Author  : AXYZdong
    # @CSDN    : https://blog.csdn.net/qq_43328313
    # @FileName: demo_2.py
    # @Software: Python3.7
    # =============================================
    
    import matplotlib.pyplot as plt     #导入库
    from datetime import datetime       #导入模块datetime中的datetime类
    import csv
    
    
    date=[]                             #创建列表
    installs=[]
    update_checks=[]
    
    with open('stats1.csv', 'r') as f:   #提取stats1.csv中的数据并保存在对应列表中
        reader = csv.reader(f)
         
        dates,installs = [],[]
        for row in reader:
            current_date = datetime.strptime(row[0],"%Y-%m-%d")  #包含日期信息的数据row[0]转为datetime对象
            dates.append(current_date)
    
            install = int(row[1])
            installs.append(install)
            
            update_checks.append(row[2])
    
    plt.plot(dates,installs,color= 'blue')  #采用条形图,颜色设置为蓝色
    
    plt.title('the picture about xuexitong help installs', fontsize = 16)   #设置图片名称
    
    plt.xticks(rotation=300)  #x轴标号旋转
    plt.ylabel("", fontsize = 16)
    plt.ylabel("Number", fontsize = 16)
    
    plt.show()  
    

    2、效果

    在这里插入图片描述
    在这里插入图片描述

    总结

    为了达到自己满意的效果,搞了好长时间
    刚开始是 x 轴标号的问题,图片出来总是黑乎乎的一片,我以为是数据太多的问题,就没有考虑了
    上传到博客后,发现坐标数值不对劲啊,和我预想的结果不一样。就开始查找各种资料,最后还是在《Python 编程 从入门到实践》中找到了解决办法。
    小白的我学习 Python,遇到了各种问题,慢慢地一个个解决,到达自己满意的效果。

    欢迎大佬批评指正 🤝 🤝 🤝

    看完就赞,养成习惯!!!^ _ ^ ❤️ ❤️ ❤️
    码字不易,大家的支持就是我坚持下去的动力。点赞后不要忘了关注我哦!

    「你可能还想看」系列文章:
    小白如何入门Python?记我的Python初体验
    揭开「pip不是内部或外部命令,也不是可运行的程序或批处理文件」的神秘面纱
    【Python制作词云】分析QQ群聊信息,记录词频并制作词云
    【Python制作词云】改变词云字体颜色
    【Python】给PDF添加水印

    520快到了,我用代码画了一幅画「可以送给自己喜欢的人」
    「情人节快到了」“码”出礼物,一片“芯”意

    展开全文
  • Python数据可视化库Seaborn

    千人学习 2019-05-20 15:45:24
    Python数据可视化库Seaborn,通过学习本教程,可以快速掌握Seaborn可视化操作。本案例中结合泰坦尼克号,鸢尾花数据,国际航班飞行数据 Python数据可视化库Seaborn,通过学习本教程,可以快速掌握Seaborn可视化操作...
  • PYTHON数据可视化

    千次阅读 2015-08-20 13:28:18
    介绍由于经常需要用Python进行数据数据分析,但经常碰到这样的情况:想做一个图,看看数据的趋势,但是以前记住的代码,在许久...数据可视化python库的介绍 cheatsheet用于可视化的数据 导入数据 直方图 箱形图 风琴
  • Python 数据可视化

    千次阅读 2017-11-24 20:06:53
    数据可视化在你与客户的交流中也扮演着重要的角色,其形象化的帮助你传达数据本身的数量特征。从这个角度来讲做出引人注意的图表更是一项令人不可或缺的技术。   Matplotlib库本身具有高度订制化的能力。但也正...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 25,421
精华内容 10,168
关键字:

python数据可视化

python 订阅