精华内容
下载资源
问答
  • 数据可视化案例
    万次阅读 多人点赞
    2019-04-29 21:35:42

    Python数据分析:数据可视化案例

    import pandas as pd
    import matplotlib.pyplot as plt
    from matplotlib import style
    
    style.use('ggplot')     # 设置图片显示的主题样式
    
    # 解决matplotlib显示中文问题
    plt.rcParams['font.sans-serif'] = ['SimHei']  # 指定默认字体
    plt.rcParams['axes.unicode_minus'] = False  # 解决保存图像是负号'-'显示为方块的问题
    
    dataset_path = './dataset/Mountains.csv'
    
    
    def preview_data(data):
        """
            数据预览
        """
        # 数据预览
        print(data.head())
    
        # 数据信息
        print(data.info())
    
    
    def proc_success(val):
        """
            处理 'Ascents bef. 2004' 列中的数据
        """
        if '>' in str(val):
            return 200
        elif 'Many' in str(val):
            return 160
        else:
            return val
    
    
    def run_main():
        """
            主函数
        """
        data = pd.read_csv(dataset_path)
    
        preview_data(data)
    
        # 数据重构
        # 重命名列名
        data.rename(columns={'Height (m)': 'Height', 'Ascents bef. 2004': 'Success',
                             'Failed attempts bef. 2004': 'Failed'}, inplace=True)
    
        # 数据清洗
        data['Failed'] = data['Failed'].fillna(0).astype(int)  #空值补零并转换为int
        data['Success'] = data['Success'].apply(proc_success)  #给原始数据中的非数字值设置成指定数字
        data['Success'] = data['Success'].fillna(0).astype(int)  #空值补零并转换为int
        data = data[data['First ascent'] != 'unclimbed']  #过滤未登顶的数据
        data['First ascent'] = data['First ascent'].astype(int)  #转换类型
    
        # 可视化数据
        # 1. 登顶次数 vs 年份
    
        plt.hist(data['First ascent'].astype(int), bins=20)
        plt.ylabel('高峰数量')
        plt.xlabel('年份')
        plt.title('登顶次数')
        plt.savefig('./first_ascent_vs_year.png')
        plt.show()
    
        # 2. 高峰vs海拔
        data['Height'].plot.hist(color='steelblue', bins=20)
        plt.bar(data['Height'],
                (data['Height'] - data['Height'].min()) / (data['Height'].max() - data['Height'].min()) * 23,   # 按比例缩放
                color='red',
                width=30, alpha=0.2)
        plt.ylabel('高峰数量')
        plt.xlabel('海拔')
        plt.text(8750, 20, "海拔", color='red')
        plt.title('高峰vs海拔')
        plt.savefig('./mountain_vs_height.png')
        plt.show()
    
        # 3. 首次登顶
        data['Attempts'] = data['Failed'] + data['Success']  # 攀登尝试次数
        fig = plt.figure(figsize=(13, 7))
        fig.add_subplot(211)
        plt.scatter(data['First ascent'], data['Height'], c=data['Attempts'], alpha=0.8, s=50)
        plt.ylabel('海拔')
        plt.xlabel('登顶')
    
        fig.add_subplot(212)
        plt.scatter(data['First ascent'], data['Rank'].max() - data['Rank'], c=data['Attempts'], alpha=0.8, s=50)
        plt.ylabel('排名')
        plt.xlabel('登顶')
        plt.savefig('./mountain_vs_attempts.png')
        plt.show()
    
    
    if __name__ == '__main__':
        run_main()
    

    运行结果:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    示例数据源:示例数据

    更多相关内容
  • 数据可视化案例—基于影视数据的分析与可视化展示系统。全部资料都在内,新手可自己动手,高手可二次开发。 数据可视化案例—基于影视数据的分析与可视化展示系统。全部资料都在内,新手可自己动手,高手可二次开发...
  • 数据可视化案例

    2018-12-26 15:57:14
    利用Excel进行数据可视化,涵盖了一些基础图形的绘制。
  • 考虑到项目需求,这里所做的可视化案例都是数据演示工具,不是数据探索工具。其中所用截图,并非最终效果图。使用D3js绘制图形D3js是应用在web开发上的开源JS组件库,是一个数据可视化工具。D3的全称是Data-...
  • Echarts数据可视化图表案例:包括柱图,饼图,折线图,地图等数据展示图表;案例下载后直接使用webstrom或idea打开,在编辑器内打开html
  • 来源丨高下制图你眼中的数据可视化的作品是否是各种条形图、柱状图等等堆积在一起进行数据的展示?今天看完为大家整理的17个数据可视化优秀作品,你就知道原来数据可视化作品还可以这样做,欢迎大家分...

    319971b385898f7ba91bd35c7b714a9b.gif

    来源丨高下制图

    你眼中的数据可视化的作品是否是各种条形图、柱状图等等堆积在一起进行数据的展示?

    今天看完为大家整理的17个数据可视化优秀作品,你就知道原来数据可视化作品还可以这样做,欢迎大家分享与收藏。

    1.如何成为国会议员

    https://www.nytimes.com/interactive/2019/01/26/opinion/sunday/paths-to-congress.htmlef772ddbecf1efed4e539f4e1d1236f4.png

    纽约时报

    这篇通过梳理第 116 届美国众议院议员当选前的职业生涯发现,要进入这个权力殿堂的方式很有限,例如超过 1/3 的议员有法律学位,有近 2/5 的议员有商业背景,而这些通过一张可视化图表都直观地展现了出来。

    2.淹没在塑料的海洋里

    https://graphics.reuters.com/ENVIRONMENT-PLASTIC/0100B275155/index.htmffadbbd35875efabe241db570d96947e.png

    路透社

    过去 1 年,全球塑料瓶的销量达到 4800 亿只,这个数字看起来很大,但到底有多大?这个作品就通过可视化呈现了出来。方式很简单——看看一小时、一天、一个月、一年、十年产生的塑料瓶能堆多高——但效果很震撼,看到世界最高的建筑也比不过堆积成山的塑料瓶,就能体会到我们消耗的塑料瓶数量之巨大。

    3.旧图新说

    https://scottreinhardmaps.com/49cb86e529445f5aa4bb80d253a0a8ac.png

    Scott Reinhard

    今年对这个 3D 立体地形地图印象很深。作者将当代地理高度与历史地图相结合,以创建特定区域,城市或州的三维环境。为了制作数字地图,作者从美国地质调查局提取了海拔数据,然后将其与位置信息一起嵌入并与旧地图的原始设计合并。他在网站给出了海报的购买链接,买它!

    4.致命垃圾

    https://www.nationalgeographic.com/magazine/2019/05/microplastics-impact-on-fish-shown-in-pictures/dbfba6fcd459c5aa38e715b2d7aec652.png

    国家地理

    这一篇中最令人印象深刻的地方在于,所有的可视化都是用海洋垃圾制作的。你可以很直观地看到海洋生物在以人类丢弃的垃圾(大部分是塑料)为食,而这是非常有害的。

    5.老友记1994-2019

    http://www.vizualism.nl/friends-1994-2019/c4405cb240a36c51c5bbbcaf7830058e.png

    frédérik ruys

    2019 是《老友记》播出 25 周年,这个可视化帮助了老友记迷们回顾大家的感情线。Ross 和 Rachel 之间的分合分合分……合分合,最古灵精怪的 Phoebe 最后终于找到真爱 Mike !还有性感的 Monica 和小甜甜 Chandler 从第五季开始如麻花般不可分离的甜蜜。

    6.野生物生长的地方

    public.tableau.com/prof 6f25a27dcd58d151185599895ec499c6.png

    有关自然的可视化信息通常会引导出一个美丽的解决方案。关于澳大利亚东南沿海地区生物发光的方式和位置的可视化设计就是一个很好的例子。Jonni Walker 为《国家地理》创建的Tableau 可视化作品 Where the Wild Things Glow (野生物生长的地方)。其中生物发光在该区域的卫星图像上可视为闪亮的形状。各式图例和信息紧密围绕着澳洲东南部地图进行组织,非常易于阅读。

    7.太空垃圾

    behance.net/FedericaFra c8e76a0117bd06c63ac336e3c0fdd67f.png

    BBC 委托数据艺术家 Federica Fragapane 制作有关太空垃圾的数据可视化作品。数据集分为不同的类别:与地球的距离,太空垃圾的类型以及物体的大小和质量。作为一名意大利独立信息可视化艺术家 Federica Fragapane 的作品在细节和色彩上尤为引人关注。她的风格及其演变就是一个很好的例子。我们可以去艺术家的主页上欣赏她的作品。

    8.卫星地图集

    nationalgeographic.com/ 77a9e7d7d358947ec126630e3b2970f6.png

    国家地理杂志在2019年发布的一个精彩的数据可视化设计是 The Atlas of Moons(卫星地图集)。有的同学可能疑惑Moon不是月亮嘛,其实Moon可以翻译成卫星的意思,比如说木星的卫星可翻译成 The moons of Jupiter。

    这是可滚动的数字可视化作品,可带您穿越太空。所有的数据全部与太阳系中的卫星有关,从我们自己的月亮开始。可视化不仅美观而且具有教育意义,有很高的应用价值。每个卫星其轨道和相关信息都是可以导航的。真的是这些年有关太空空间的最佳数据可视化作品之一.

    9.传播关系的最佳展现方法

    a0adc94e731c09555921d22327a1e72c.png

    这幅图是社交网络图,用于理解社交网络关系,经常使用在案件侦查以及金融行业信用分析。对于疫情分析来说这幅图的作用是溯源分析以及理解疾病是怎样传播的。从图中可以很明显的看到1号、6号、35号、127号以及130号病人作为超级传播者,传染了10人以上。

    10.动图—抽象模拟的典范

    41c28ee9bf441ea7222ba0320cc010e6.gif

    上面是国外的某个媒体为了观察不同的防控策略将会造成怎样不同的疾病传播效果,做了一个可视化的动态模型。分别设定了完全不采取任何措施、采取适当的隔离措施、3/4人群定点居家隔离不流动的三种情况下,情况会如何发展。可以看出,采取居家隔离的措施,被感染的人数是最少的。动态图的形式挺新颖,可给人最直观的感受。

    11.漫画—广受欢迎的展示方法

    45805810ae31d94df26d734a39b45115.png

    上述这副漫画相信大家一定不会陌生。在国内疫情爆发的初期,全世界大多数国家都对我们表达了关心和支持;现在欧洲及全球疫情迅速爆发,中国在自身疫情得到了有效的控制情况下,给予了很多友国医疗资源上的帮助。漫画以形象、夸张的手法,批评或歌颂人或事,简单、明了,哪怕只是3岁的小朋友,也能一眼就看懂。

    12.关于2050年对地球的一撇

    2050.earth/0c6ac0d8341f3e41bbf5bc97e237df75.png

    卡巴斯基

    卡巴斯基提供了一个对2050年未来地球幻想的开放平台,用户都可以在那里分享自己对未来的想象,写下自己对未来的预测和想象,目前在卡巴斯基的 “地球2050″这块画布上已经被涂抹了很多线条-在网站上几乎有来自80多个作者的将近400多个对未来的预测。

    13.即将来临的日食

    washingtonpost.com/grap

    3b52028d8ea99685a79886f48de9e646.gif

    在2017年8月日食之后,这是近一个世纪以来美国在整个海岸之间发生的第一次日食之后,《华盛顿邮报》创建了一个交互式地球可视化图,显示了日食的路径以及所有直到2080年的日食路径。旋转的地球仪会显示日食的整体路径(日食完全被月球覆盖的日食的路径),它们将在世界上发生的时间以及何时(时间以明暗阴影表示,以及悬停文字工具提示) 。如果在页面上输入出生年份,它还会告诉您一生中还剩下多少次日食。

    14.为宇航服着装

    washingtonpost.com/grap

    258eb97d1dea72f3a1b8b7de9b8b1e25.gif

    在50年的太空探索和太空飞行中,宇航员在旅行中使用了不同的服装。《华盛顿邮报》利用不同的服装数据,可视化显示了五种太空服的详细3D图片,从第一批水银覆盖的套装到一件式SpaceX套装,这项研究是航天工业记者和时尚评论家之间的深刻对话。

    15.欧洲体育电视台球员可视化网站

    http://dataworldcup.eurosport.com

    083dac5d1cc60527a5cc6a0ada2e1c70.pngc9cb87ee2b204b1b771fd1743a256eac.png7da9f8610dc9bb874045d7520e0a4395.png

    欧洲体育电视台(Eurosport)制作的可视化网站,通过交互式可视化,对世界杯球员组成、球队比较以及金球奖与球员的关系进行了可视化。

    16.住宿交互地图

    https://pt.airbnb.com/map?cdn_cn=1

    366e3ca6a4ae11032bf493f7afdceca5.png 393bea4ed1a0c7aa13007c43a2d076d7.png

    Airbnb制作的住宿交互地图,地图的视觉设计处理在所有常见地图中比较特别,让用户在旅行前感到乐趣。用户可以在地图中选择要去的地方,查看房源信息,以及当地游客的年数量。

    17.科比-布莱恩特职业生涯投篮数据可视化图

    Every shot Kobe Bryant ever took. All 30,699 of them aa5b200a798cdbcc68875260dbd20be1.png

    科比-布莱恩特职业生涯投篮数据可视化。对科比20年职业生涯每一次投篮实现了投篮准确位置、种类、对手、时间的可视化。最接近神的男人,真正的进攻无死角。纯粹的优美和一意孤行,广袤的中距离。

    万水千山总是情,点个 👍 行不行

    推荐阅读

    NO.1

    往期推荐

    Historical articles

    【原创干货】6000字、22个案例详解Pandas数据分析/预处理时的实用技巧,超简单

    【硬核干货】4500字、10个案例分享几个Python可视化小技巧,助你绘制高质量图表

    【硬核干货】| 3000字推荐一个可视化神器,50行Python代码制作数据大屏

    【硬核干货】2500字全方面解读Python的格式化输出

    ···  END  ···

    分享、收藏、点赞、在看安排一下?

    24a38a0eba286b78cc0b4d59027b0bbc.gif

    c9b5a852f8fb556d433cc346a3613cf1.gif

    6f536fd7c6a2bf026bff838c0aa8d2ba.gif

    571d7be862cf66be2fdc1fd167dac092.gif

    展开全文
  • 基于ECharts数据可视化大屏案例源码
  • 大数据分析师,数据分析,大数据可视化。大容量的数据
  • Echarts的大屏数据可视化集合数据可视化集合案例源码,包含会议展览、业务监控、风险预警、数据分析展示等多种展示需求可视化集合。(75+24套)数据可视化集合,75套数据可视化源码,24套数据可视化源码。Echarts的...
  • 利用MATLAB实现数据可视化,在报告、论文等撰写中提高文章逼格
  • 一、数据可视化与探索图 数据可视化是指用图形或表格的方式来呈现数据。图表能够清楚地呈现数据性质, 以及数据间或属性间的关系,可以轻易地让人看图释义。用户通过探索图(Exploratory Graph)可以了解数据的...

    利用可视化探索图表

    一、数据可视化与探索图

          数据可视化是指用图形或表格的方式来呈现数据。图表能够清楚地呈现数据性质, 以及数据间或属性间的关系,可以轻易地让人看图释义。用户通过探索图(Exploratory Graph)可以了解数据的特性、寻找数据的趋势、降低数据的理解门槛。

    二、常见的图表实例

          本章主要采用 Pandas 的方式来画图,而不是使用 Matplotlib 模块。其实 Pandas 已经把 Matplotlib 的画图方法整合到 DataFrame 中,因此在实际应用中,用户不需要直接引用 Matplotlib 也可以完成画图的工作。

    1.折线图

          折线图(line chart)是最基本的图表,可以用来呈现不同栏位连续数据之间的关系。绘制折线图使用的是 plot.line() 的方法,可以设置颜色、形状等参数。在使用上,拆线图绘制方法完全继承了 Matplotlib 的用法,所以程序最后也必须调用 plt.show() 产生图,如图8.4 所示。

    df_iris[['sepal length (cm)']].plot.line() 
    plt.show()
    ax = df[['sepal length (cm)']].plot.line(color='green',title="Demo",style='--') 
    ax.set(xlabel="index", ylabel="length")
    plt.show()

    2.散布图

         散布图(Scatter Chart)用于检视不同栏位离散数据之间的关系。绘制散布图使用的是 df.plot.scatter(),如图8.5所示。

    df = df_iris
    df.plot.scatter(x='sepal length (cm)', y='sepal width (cm)')
    
    from matplotlib import cm 
    cmap = cm.get_cmap('Spectral')
    df.plot.scatter(x='sepal length (cm)',
              y='sepal width (cm)', 
              s=df[['petal length (cm)']]*20, 
              c=df['target'],
              cmap=cmap,
              title='different circle size by petal length (cm)')

    3.直方图、长条图

         直方图(Histogram Chart)通常用于同一栏位,呈现连续数据的分布状况,与直方图类似的另一种图是长条图(Bar Chart),用于检视同一栏位,如图 8.6 所示。

    df[['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)','petal width (cm)']].plot.hist()
    2 df.target.value_counts().plot.bar()

    4. 圆饼图、箱形图

          圆饼图(Pie Chart)可以用于检视同一栏位各类别所占的比例,而箱形图(Box Chart)则用于检视同一栏位或比较不同栏位数据的分布差异,如图 8.7 所示。

    df.target.value_counts().plot.pie(legend=True)
    df.boxplot(column=['target'],figsize=(10,5))

    数据探索实战分享

         本节利用两个真实的数据集实际展示数据探索的几种手法。

    一、2013年美国社区调查

          在美国社区调查(American Community Survey)中,每年约有 350 万个家庭被问到关于他们是谁及他们如何生活的详细问题。调查的内容涵盖了许多主题,包括祖先、教育、工作、交通、互联网使用和居住。

          数据来源:https://www.kaggle.com/census/2013-american-community-survey。

            数据名称:2013 American Community Survey。

           先观察数据的样子与特性,以及每个栏位代表的意义、种类和范围。

    # 读取数据
    df = pd.read_csv("./ss13husa.csv")
    # 栏位种类数量
    df.shape
    # (756065,231)
    
    # 栏位数值范围
    df.describe()

          先将两个 ss13pusa.csv 串连起来,这份数据总共包含 30 万笔数据,3 个栏位:SCHL ( 学历,School Level)、 PINCP ( 收入,Income) 和 ESR ( 工作状态,Work Status)。

    pusa = pd.read_csv("ss13pusa.csv") pusb = pd.read_csv("ss13pusb.csv")
    # 串接两份数据
    col = ['SCHL','PINCP','ESR']
    df['ac_survey'] = pd.concat([pusa[col],pusb[col],axis=0)

          依据学历对数据进行分群,观察不同学历的数量比例,接着计算他们的平均收入。

    group = df['ac_survey'].groupby(by=['SCHL']) print('学历分布:' + group.size())
    group = ac_survey.groupby(by=['SCHL']) print('平均收入:' +group.mean())

    二、波士顿房屋数据集

          波士顿房屋数据集(Boston House Price Dataset)包含有关波士顿地区的房屋信息, 包 506 个数据样本和 13 个特征维度。

         数据来源:https://archive.ics.uci.edu/ml/machine-learning-databases/housing/。

           数据名称:Boston House Price Dataset。

         先观察数据的样子与特性,以及每个栏位代表的意义、种类和范围。

         可以用直方图的方式画出房价(MEDV)的分布,如图 8.8 所示。

    df = pd.read_csv("./housing.data")
    # 栏位种类数量
    df.shape
    # (506, 14)
    
    #栏位数值范围df.describe()
    import matplotlib.pyplot as plt 
    df[['MEDV']].plot.hist() 
    plt.show()

    注:图中英文对应笔者在代码中或数据中指定的名字,实践中读者可将它们替换成自己需要的文字。

         接下来需要知道的是哪些维度与“房价”关系明显。先用散布图的方式来观察,如图8.9所示。

    # draw scatter chart 
    df.plot.scatter(x='MEDV', y='RM') .
    plt.show()

          最后,计算相关系数并用聚类热图(Heatmap)来进行视觉呈现,如图 8.10 所示。

    # compute pearson correlation 
    corr = df.corr()
    # draw  heatmap 
    import seaborn as sns 
    corr = df.corr() 
    sns.heatmap(corr) 
    plt.show()

    颜色为红色,表示正向关系;颜色为蓝色,表示负向关系;颜色为白色,表示没有关系。RM 与房价关联度偏向红色,为正向关系;LSTAT、PTRATIO 与房价关联度偏向深蓝, 为负向关系;CRIM、RAD、AGE 与房价关联度偏向白色,为没有关系。

    【python学习】
    学Python的伙伴,欢迎加入新的交流【君羊】:1020465983
    一起探讨编程知识,成为大神,群里还有软件安装包,实战案例、学习资料

    展开全文
  • R语言数据可视化案例(世界杯球员信息数据可视化)世界杯球员案例数据预处理 世界杯球员案例 在 faraway 包中包含一个名为 worldcup 的数据集(加载 faraway 包后,可通过代码“head(worldcup)”查看数据的前 5 行,...

    R语言数据可视化案例(世界杯球员信息数据可视化)

    世界杯球员案例

    在 faraway 包中包含一个名为 worldcup 的数据集(加载 faraway 包后,可通过代码“head(worldcup)”查看数据的前 5 行,该数据集是 2010 年世界杯上球员的信息数据,每个变量所表示的信息如下:
    Team: 国家
    Position:位置,包括后卫、前锋、守门员、中场
    Time: 上场总时间
    Shots: 射门的次数
    Passes:传球次数
    Tackles:铲球次数
    Saves: 救球次数

    数据预处理

    数据概况:

    > head(world)
                   Team   Position Time Shots Passes Tackles Saves
    Abdoun      Algeria Midfielder   16     0      6       0     0
    Abe           Japan Midfielder  351     0    101      14     0
    Abidal       France   Defender  180     0     91       6     0
    Abou Diaby   France Midfielder  270     1    111       5     0
    Aboubakar  Cameroon    Forward   46     2     16       0     0
    Abreu       Uruguay    Forward   72     0     15       0     0
    

    该数据集中,数据集包含595个样本,共有7个特征。其中Team,Postition是分类变量,后面的都是数值型变量,其中行名是球员名字。

    1. 导入需要的包和数据集 ,导入需要的包和数据集;
    library(faraway)
    library(ggplot2)
    head(worldcup)
    attach(worldcup)
    ?worldcup
    world=worldcup
    
    1. 上场时间和传球数量的关系
    #给散点图变成以颜色做区分位置队伍
    p <- ggplot(data=world, mapping=aes(x=world$Time, y=world$Passes, shape=world$Position, colour=world$Team))
    p+geom_point()
    

    运行结果

    在这里插入图片描述
    由图形可看出,各球员上场时间多集中于 400 以内,传球次数也对应集中于 200以内,其中 Midfifielder 位置的上场时间和传球次数较为出众。同时一定程度上,上场时间越长,传球数越大。
    3. 不同位置射门次数直方图

    #不同位置射门次数直方图
    ggplot(world)+geom_histogram(aes(x=world$Shots))
    ggplot(world)+geom_histogram(aes(x=world$Shots, fill=world$Position))
    

    运行结果
    在这里插入图片描述
    由图可发现,大部分球员射门次数集中于 5 个以内,其中 Defender 射门次数较少,而 Forward 射门表现较为优异,符合常理。
    4. 不同队伍射门次数直方图

    #不同队伍射门次数直方图
    ggplot(world)+geom_histogram(aes(x=world$Shots, fill=world$Team))
    ggplot(world)+geom_histogram(aes(x=world$Shots, fill=world$Team), position="dodge")
    

    运行结果
    在这里插入图片描述
    5. 不同队伍射门次数直方图

    #箱型图
    ggplot(world)+geom_boxplot(aes(x=world$Team, y=world$Shots,fill=world$Team))+coord_flip()#不同队伍射门次数
    

    运行结果
    在这里插入图片描述
    由图可知 Brazil 队射门次数平均较高,但无极端异常高的值,可推测其与队伍战术风格有关,以进攻为主,但各队员水平相近,表现稳定,而 Ghana 等队虽然整体平均还行,但是有一个极端高值,可推测是有球员表现尤为优异,带动队伍射门进攻。
    6. 绘制球员分布国家地图可视化

    n=rep(1,595)#设定重复的1
    world=cbind(world,n)
    number<-aggregate(x = world$n, by= list(world$Team), FUN = sum)#计算各个国家球员数
    colnames(number)<-c("nation","number")
    library(map)
    library(REmap)
    result <- remapC(number,
                     maptype = 'world',
                     color = 'red',
                     theme = get_theme('Sky'),
                     maxdata = 20, 
                     mindata = 14)
    print(result)
    

    运行结果
    在这里插入图片描述
    可通过地理信息数据发现,球队主要来源于西半球,各队伍成员数量较为相近,无过于显著的差异。
    其中,安装REmap时,常规方式安装会报错,可利用下面方式解决:

    install.packages("devtools")
    library(usethis)
    library(devtools)
    install_github("Lchiffon/REmap")
    library(REmap)
    
    1. 绘制球员人数分布直方图
    #分布直方图
    par(mai=c(0.9, 0.9, 0.6, 0.3)) #图形边缘空白(边距)的宽度
    hist(number$number, col="lightblue", border="red", labels = TRUE,ylim=c(0, 20),main="运动会各队总人数分布")
    

    运行结果
    在这里插入图片描述
    可发现人数分布服从近似正态分布。
    8. 对不同位置人员进行上场时间与射门次数的分析

    #对不同位置人员进行上场时间与射门次数的分析
    ggplot(worldcup,mapping = aes(x=Time,y=Shots,colour = Position))+geom_point()
    

    运行结果
    在这里插入图片描述
    由图可发现,Forward 的射门次数都较高于其他位置,符合常理。
    9. 国家与射门次数之间的关系

    #国家与射门次数之间的关系
    ggplot(world,aes(x=world$Team,y=world$Shots,fill=world$Team))+
      theme_bw(base_family="STKaiti")+
     geom_bar(aes(fill=rownames(worldcup)),stat="identity",show.legend=F)+
      coord_flip()
    

    运行结果
    在这里插入图片描述
    从整体来看,Spain 总的射门次数最多,可看出在比赛中处在上风。Honduras 较少处于劣势。
    10. 每个运动员上场时间及射门次数关系

    library(treemap); 
    library(readr); 
    library(dplyr)
    plays<-as.data.frame(rownames(world))#每个球员上场时间
    plays<-cbind(plays,world$Time,world$Shots)#球员对应上场时间及射门
    colnames(plays)<-c("player","time","shots")
    treemap(plays,index = c("player"),vSize = "time", vColor= "shots",type="value",palette="RdYlGn", 
            title = "每个运动员上场时间及射门次数关系",fontfamily.title = "STKaiti", 
            title.legend= "数量",fontfamily.legend="STKaiti")
    

    运行结果
    在这里插入图片描述
    图形宽度代表上场时间,颜色深浅代表射门次数。可发现 Gyan,Villa 球员上场时间多,射门次数也多,是团队核心成员,而 Jong Tae-Se 上场时间中等,但射门次数较多,是很有潜力的成员。通过这个图寻找核心成员,同时挖掘潜力成员。
    11. 球员上场时间分布图

    #球员上场时间分布图
    ggplot(worldcup,aes(x=reorder(rownames(worldcup),Time),y=Time))+
      theme_bw(base_family="STKaiti")+
     geom_bar(aes(fill=Time),stat="identity",show.legend = F)+
     coord_flip()+scale_fill_gradient(low="#56B1F7",high ="#132B43")+
      labs(x="球员",y="各个球员上场总时间分布",title="上场时间")+
      theme(axis.text.x =element_text(vjust = 0.5),plot.title=element_text(hjust=0.5))
    

    运行结果
    在这里插入图片描述
    12. #位置、射门、救球、传球、铲球之间的关系(散点矩阵图)

    #位置、射门、救球、传球、铲球之间的关系
    library(GGally)
    ggpairs(world[,1:7],columns=c(2,4:7),aes(color=Position),alpha=0.8)+
        theme_bw(base_family="STKaiti",base_size=10)+
          theme(plot.title=element_text(hjust=0.5))+
          ggtitle("散点矩阵图")
    

    运行结果
    在这里插入图片描述
    由这个图可以得到许多信息。可发现后卫数量是最多的,而门卫是数量最少的。同时可看出,四个位置的传球数,射门数等都服从偏态分布。Tackles 后卫表现突出,Shots 前锋表现突出.符合常理。

    展开全文
  • 大数据导论课程Introduction to big data大数据可视化大数据可视化Introduction to big data主讲教师 XXX主讲教师 商俊燕数据可视化案例-103 01 02 案例背景案例实施案例分析[任务背景] 随着国家经济发展越来越多人...
  • HTML/CSS的大屏数据可视化集合案例源码(76+25套)数据可视化集合。 基于HTML/CSS/Echarts的会议展览、业务监控、风险预警、数据分析展示等多种展示需求可视化集合,76套数据可视化源码,25套数据可视化源码。数据都...
  • 需求描述 ...这里以天津为例。   可以看到,这里是有未来15天的天气和气温状况的。我们要做的就是把每天的最高和最低气温爬取下来,并做成折线图的形式。 需求分析   任意选取一天的气温,单击鼠标右键检查元素...
  • 数据可视化的教学代码: 包括折线图+柱状图+饼图+盒图+散点图+直方图+3d图 画布的布局、画图中中文乱码的解决、背景板的选择等 简单的数据分析和可视化案例: titanic数据的简单分析可视化 iris数据的聚类可视化 GDP...
  • 全球顶级的5个数据可视化案例

    万次阅读 2018-09-06 09:45:15
    全球顶级的5个数据可视化案例 摘要: 当数据进行可视化后,就有了参考点,可以用各种合适的方法重新处理数据或进行测试,这能使企业能够更快、更平稳、更有效地发展。这也可以让它们在利益和名声受损之前排除...
  • 大屏数据可视化案例

    万次阅读 多人点赞 2018-06-25 18:07:38
    数据可视化:把相对复杂的、抽象的数据通过可视的、交互的方式进行展示,从而形象直观地表达数据蕴含的信息和规律。 数据可视化是数据空间到图形空间的映射,是抽象数据的具象表达。 数据可视化交互的基本原则:总...
  • 随着数据可视化技术应用需求的增长,用户的不断扩大,使得数据可视化技术的应用的快速发展。关于数据可视化应用领域的讨论也不断增多。而这些应用大多集中的行业及其起到的意义和作用也备受关注,整理了具有10年行业...
  • 通过一个综合案例分析和演示数据处理和可视化的过程,加深对Pandas、Matplotlib库中一些常见方法的理解和使用,非常适合初学者自我测试和老师课堂教学。
  • Vue3/ECharts5数据可视化(大屏展示)项目案例源码,一个基于 Vue3、Typescript、DataV、ECharts5 框架的大数据可视化(大屏展示)项目。此项目使用'.vue' 和 '.tsx' 文件实现界面,采用新版动态屏幕适配方案,全局...
  • HTML数据可视化驾驶舱项目案例源码,大数据可视化模板——echarts有关N个html界面。数据可视号图表案例集合项目源码。HTML数据可视化驾驶舱项目案例源码,大数据可视化模板——echarts有关N个html界面。数据可视号...
  • 一、项目背景 2019年,袋鼠云参与了某工业公司机器运行实况可视化平台的建设,以宏观分析和微观透视相结合,来展示设备的关键数据、运营状态、主要特征特点,实现设备的全景展示、...超好用的数据可视化平台EasyV免费试
  • 作者:蘑菇君数据可视化可以帮你更容易的解释趋势和统计数据。数据是非常强大的。当然,如果你能真正理解它想告诉你的内容,那它的强大之处就更能体现出来了。通过观察数字和统计数据的转换以获得清晰的结论并不是一...
  • 数据可视化案例集合,有详细步骤和数据,可以复现。适用于没有基础的新手。tableau以讲故事的方式改变传统数据的枯燥性。
  • 数据可视化优秀案例

    万次阅读 2020-09-18 19:19:30
    ​信息的质量很大程度上依赖于其表达方式,同样的,对数据进行数据分析后,结果可视化...下面我给大家看看我利用smartbi大数据分析工作做出来得数据可视化案例。当您准备构建自己的数据可视化时,你可以尝试使用Smartbi
  • 前端数据可视化图表案例合集源码案例,本项目是我8年工作和学习中整理出来的前端可视化demo,代码会有详细注释。demo配备图文讲解,前端数据可视化图表案例demo。 项目使用了vue3,由vite构建。 可视化方面的库:...
  • 适用于Python入门者的爬虫和数据可视化案例

    万次阅读 多人点赞 2018-12-24 13:59:35
    直接上代码 上面需要注意的是:利用json获取需要的数据(至少比正则快点) 数据分析,可视化 上面需要注意的是:我们合并数据的时候,可以选择性的删除一些无用数据 下面我们对周杰伦歌曲进行情绪化分析 下面完成数据...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 81,317
精华内容 32,526
关键字:

数据可视化案例