精华内容
下载资源
问答
  • 对于不适合其他图表类型(如折线图)的大型(已排序)数据集来说,箱形图十分有用。箱形图可将系列中数据值的变化归结为五个数值 - 中位数、上下四分位数,以及最小值和最大值。箱形图要求数据进行排序。箱形图可以...
  • boxplot3 绘制均值(红色)、标准误差(蓝色、 分位数0.25和0.75)和标准偏差(黑色) 语法:boxplot3(X,Y) 例子: X=1:2; 是{1}=1:100; Y {2} = 101:200; boxplot3(X,Y)
  • 箱形图系列箱形图(box plot)也称箱须图(box-whisker plot)、箱线图、盒图显示一组数据的最大值、最小值、中位数、及上下四分位数;用来反映一组或多组连续型定量数据分布的中心位置和散步范围;从盒子两端延伸出来的...

    2c66768601d11ed50b15bf3357605485.png

    箱形图系列

    箱形图(box plot)也称箱须图(box-whisker plot)、箱线图、盒图

    • 显示一组数据的最大值、最小值、中位数、及上下四分位数;

    • 用来反映一组或多组连续型定量数据分布的中心位置和散步范围;

    • 从盒子两端延伸出来的线条称为“晶须”(whisker);

    • 用来表示上下四分位数以外的变量;

    异常值(outlier)

    有时会以与晶须处于同一水平的单一数据点表示;

    四分位数(quartile)

    在统计学中把所有数值由小到大排列并分成四等份;处于三个分割点位置的数值;

    分位数

    将总体的全部数据按大小顺序排列后,处于各等分位置的变量值;

    中位数

    如果将全部数据分成相等的两部分;

    四分位数

    如果分成四等分;也称为四分位点;将全部数据分成相等的四部分,其中每部分包括25%的数据,处于各分位点的数值;四分位数有三个

    • 第一个四分位数---下四分位数;

      • 也称为“较小四分位”,等于该样本中所有数值由小到大排列后第25%的数字;

    • 第二个四分位数---中位数

      • 也称为“中位数”,等于该样本中所有数值由小到大排列后第50%的数字;

    • 第三个四分位数---上四分位数;

      • 也称为“较大四分位数”,等于该样本中所有数值由小到大排列后第75%数字;第三个四分位数与第一个四分位数的差距又称为四分位距(InterQuartile Range,IQR);

    箱形图通常用于描述性统计

    • 直观明了地识别批量数据中的异常值;

    • 利用箱型图判断批量数据的偏态和尾重;

    箱型图系列绘制方法

    • plotnine包中的geom_boxplot()函数可以绘制箱型图;

    • 再使用geom_jitter()函数绘制抖动散点图;

    绘制带误差线的箱形图

    import pandas as pd

    import numpy as np

    import seaborn as sns

    import matplotlib.pyplot as plt

    from plotnine import *

    df=pd.read_csv('d:\python\out\DistributionD.csv')

    df['class']=df['class'].astype("category", ["n", "s", "k", "mm"])

    #带误差线的箱型图

    box_plot=(ggplot(df,aes(x='class',y="value",fill="class"))

    +geom_boxplot(show_legend=False)

    +scale_fill_hue(s = 0.90, l = 0.65, h=0.0417,color_space='husl')

    +theme_matplotlib()

    +theme(aspect_ratio =1.05,

    dpi=100,

    figure_size=(4,4)))

    print(box_plot)

    box_plot.save("box_plot.pdf")

    绘制箱型与抖动散点组合图

    import pandas as pd

    import numpy as np

    import seaborn as sns

    import matplotlib.pyplot as plt

    from plotnine import *

    df=pd.read_csv('d:\python\out\DistributionD.csv')

    df['class']=df['class'].astype("category",["n", "s", "k", "mm"])

    #箱型与抖动散点组合图

    box_plot1=(ggplot(df,aes(x='class',y="value",fill="class"))

    +geom_boxplot(show_legend=False)

    +geom_jitter(fill="black",shape=".",width=0.3,size=3,stroke=0.1,show_legend=False)

    +scale_fill_hue(s = 0.90, l = 0.65, h=0.0417,color_space='husl')

    +theme_matplotlib()

    +theme(aspect_ratio =1.05,

    dpi=100,

    figure_size=(4,4)))

    print(box_plot1)

    box_plot.save("box_plot2.pdf")

    展开全文
  • 箱形图又称为盒须图,显示了一组数据的分散情况,可用来快速识别异常值。 (1)中位数:一组数据按顺序排列,居于中间位置的数,即为中位数。 如果这组数据一共有n个,X1,X2……Xn, 如果n为奇数,中位数则为X(n+1...
  • 箱形图 python Python-箱形图 (Python - Box Plots) Advertisements 广告 Previous Page 上一页 Next Page 下一页 Boxplots are a measure of how well distributed the data in a data set is. It ...
    箱形图 python

    箱形图 python

    Python-箱形图 (Python - Box Plots)

    Boxplots are a measure of how well distributed the data in a data set is. It divides the data set into three quartiles. This graph represents the minimum, maximum, median, first quartile and third quartile in the data set. It is also useful in comparing the distribution of data across data sets by drawing boxplots for each of them.

    箱线图是衡量数据在数据集中的分布程度的一种度量。 它将数据集分为三个四分位数。 该图表示数据集中的最小,最大,中位数,第一四分位数和第三四分位数。 通过为每个数据集绘制箱形图来比较数据在数据集之间的分布,这也很有用。

    绘制箱形图 (Drawing a Box Plot)

    Boxplot can be drawn calling Series.box.plot() and DataFrame.box.plot(), or DataFrame.boxplot() to visualize the distribution of values within each column.

    可以通过调用Series.box.plot()和DataFrame.box.plot()或DataFrame.boxplot()来绘制Boxplot,以可视化每个列中值的分布。

    For instance, here is a boxplot representing five trials of 10 observations of a uniform random variable on [0,1).

    例如,这是一个箱线图,代表对[0,1)上的一个随机变量的10个观测值的五个试验。

    
    import pandas as pd
    import numpy as np
    df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
    df.plot.box(grid='True')
     
    

    Its output is as follows −

    输出如下-

    boxplot.png

    翻译自: https://www.tutorialspoint.com/python_data_science/python_box_plots.htm

    箱形图 python

    展开全文
  • Pyecharts直角坐标系图:箱形图 文章目录Pyecharts直角坐标系图:箱形图前言一. Boxplot:箱形图1.1 add 函数1.2 箱形图数据项二. 案例2.1 基本图2.2 多箱形图总结 前言 本文主要是展示了Pyecharts箱形图的基本...

    Pyecharts直角坐标系图:箱形图



    前言

    本文主要是展示了Pyecharts箱形图的基本应用和案例。


    一. Boxplot:箱形图

    1.1 add 函数

    主要是:名称,数据,x轴索引,配置项。

    # func pyecharts.charts.Boxplot.add_yaxis
    def add_yaxis(
        # 系列名称,用于 tooltip 的显示,legend 的图例筛选。
        series_name: str,
    
        # 系列数据
        y_axis: types.Sequence[types.Union[opts.BoxplotItem, dict]],
    
        # 是否选中图例
        is_selected: bool = True,
    
        # 使用的 x 轴的 index,在单个图表实例中存在多个 x 轴的时候有用。
        xaxis_index: Optional[Numeric] = None,
    
        # 使用的 y 轴的 index,在单个图表实例中存在多个 y 轴的时候有用。
        yaxis_index: Optional[Numeric] = None,
    
        # 标签配置项,参考 `series_options.LabelOpts`
        label_opts: Union[opts.LabelOpts, dict] = opts.LabelOpts(),
    
        # 标记点配置项,参考 `series_options.MarkPointOpts`
        markpoint_opts: Union[opts.MarkPointOpts, dict] = opts.MarkPointOpts(),
    
        # 标记线配置项,参考 `series_options.MarkLineOpts`
        markline_opts: Union[opts.MarkLineOpts, dict] = opts.MarkLineOpts(),
    
        # 提示框组件配置项,参考 `series_options.TooltipOpts`
        tooltip_opts: Union[opts.TooltipOpts, dict, None] = None,
    
        # 图元样式配置项,参考 `series_options.ItemStyleOpts`
        itemstyle_opts: Union[opts.ItemStyleOpts, dict, None] = None,
    )
    

    1.2 箱形图数据项

    主要是:名称,数值,文本样式。

    class BoxplotItem(
        # 数据项名称。
        name: Optional[str] = None,
    
        # 单个数据项的数值。
        value: Optional[Numeric] = None,
    
        # 文本的样式设置,参考 `series_options.LabelOpts`。
        label_opts: Union[LabelOpts, dict, None] = None,
    
        # 图元样式配置项,参考 `series_options.ItemStyleOpts`
        itemstyle_opts: Union[ItemStyleOpts, dict, None] = None,
    
        # 提示框组件配置项,参考 `series_options.TooltipOpts`
        tooltip_opts: Union[TooltipOpts, dict, None] = None,
    )
    

    二. 案例

    2.1 基本图

    from pyecharts import options as opts
    from pyecharts.charts import Boxplot
    
    v1 = [
        [850, 740, 900, 1070, 930, 850, 950, 980, 980, 880, 1000, 980],
        [960, 940, 960, 940, 880, 800, 850, 880, 900, 840, 830, 790],
    ]
    v2 = [
        [890, 810, 810, 820, 800, 770, 760, 740, 750, 760, 910, 920],
        [890, 840, 780, 810, 760, 810, 790, 810, 820, 850, 870, 870],
    ]
    c = Boxplot()
    c.add_xaxis(["expr1", "expr2"])
    c.add_yaxis("A", c.prepare_data(v1))
    c.add_yaxis("B", c.prepare_data(v2))
    c.set_global_opts(title_opts=opts.TitleOpts(title="BoxPlot-基本示例"))
    c.render("boxplot_base.html")
    
    

    基本箱形图

    2.2 多箱形图

    这个建议自己运行生成 html 在用,逼格还是可以的。

    import pyecharts.options as opts
    from pyecharts.charts import Boxplot
    from pyecharts.commons.utils import JsCode
    
    axis_data = [
        "0",
        "1",
        "2",
        "3",
        "4",
        "5",
        "6",
        "7",
        "8",
        "9",
        "10",
        "11",
        "12",
        "13",
        "14",
        "15",
        "16",
        "17",
    ]
    
    data = [
        {
            "axisData": axis_data,
            "boxData": [
                [
                    3.8888578346043534,
                    55.82692798765428,
                    98.71608835477272,
                    149.50917642877687,
                    196.31621070646452,
                ],
                [
                    0.5174326704765253,
                    47.52990128406776,
                    103.66600287106233,
                    160.1380046605997,
                    194.8294269298398,
                ],
                [
                    2.843900448603165,
                    51.773788199388605,
                    90.66830693679475,
                    152.19938074181786,
                    196.18172012742428,
                ],
                [
                    2.6752702891334135,
                    42.85051429480143,
                    98.54433643572133,
                    166.81852013033875,
                    199.7400516615198,
                ],
                [
                    1.665511467481906,
                    63.069856326089585,
                    123.20638438572043,
                    164.0932194814393,
                    199.56631692214057,
                ],
                [
                    0.3597414263118992,
                    52.84424125860876,
                    108.14491539985673,
                    154.42390255012828,
                    199.39872381823812,
                ],
                [
                    1.3380322954592128,
                    41.989379994726335,
                    100.39118095266713,
                    160.38742881881478,
                    197.8251968350275,
                ],
                [
                    1.7005873932608662,
                    43.88170786936796,
                    92.29415890464293,
                    140.7858956683471,
                    197.50510824352313,
                ],
                [
                    1.7017445023542965,
                    52.55872982785781,
                    90.26972335102536,
                    155.43082163069883,
                    198.31679368721197,
                ],
                [
                    0.45657888665799895,
                    47.60747957375436,
                    95.53917053451289,
                    162.55256484073354,
                    199.78317232079928,
                ],
                [
                    1.745438082254136,
                    53.450845301261964,
                    95.8847297380051,
                    143.99885640751006,
                    195.1863502057908,
                ],
                [
                    2.5631287114048273,
                    56.04486879215165,
                    110.01592256847306,
                    155.33508398386462,
                    195.90291395560985,
                ],
                [
                    3.4380745785991262,
                    58.07888602010247,
                    105.64925213947652,
                    165.50126442985191,
                    199.75877487248675,
                ],
                [
                    0.03322930419802361,
                    53.363159200883985,
                    95.32936635574816,
                    151.39772626598614,
                    198.20394907387762,
                ],
                [
                    0.7063564158257929,
                    73.89369564248534,
                    116.6947935806626,
                    152.93983211466667,
                    197.1481400480321,
                ],
                [
                    0.9611585600880268,
                    46.64283650085793,
                    102.32004406296502,
                    148.64094149067978,
                    199.59803470854715,
                ],
                [
                    1.4310036755643463,
                    50.15631363530299,
                    102.68128938225942,
                    147.52573154872948,
                    197.6018158750086,
                ],
                [
                    0.492994684970105,
                    43.23619663302313,
                    99.60815322547333,
                    140.00299600143438,
                    198.97693156537883,
                ],
            ],
            "outliers": [],
        },
        {
            "axisData": axis_data,
            "boxData": [
                [
                    1.3866777918670525,
                    52.723984144413805,
                    112.16068484025186,
                    148.07060013196633,
                    196.6493886555634,
                ],
                [
                    0.8675025485252785,
                    41.94008605353009,
                    90.4944101654473,
                    134.34314089904032,
                    199.57411732908722,
                ],
                [
                    2.109917782227244,
                    47.361245156921306,
                    98.03121935506474,
                    152.57304498745683,
                    199.6655667235125,
                ],
                [
                    0.835914742081334,
                    45.90386054869363,
                    110.8008994981315,
                    153.77050147012113,
                    198.17687983907325,
                ],
                [
                    0.09929780808608513,
                    55.313979741487245,
                    80.36049651385588,
                    144.5076321261422,
                    198.71007594348265,
                ],
                [
                    4.3591904343687204,
                    53.098201381124454,
                    88.8716562277704,
                    134.2243571501588,
                    197.86166497124387,
                ],
                [
                    1.4751642002043486,
                    52.87727910767818,
                    98.1167484613283,
                    129.123794134296,
                    199.26128215126036,
                ],
                [
                    1.0208468961246275,
                    59.72883452828452,
                    93.7117188714775,
                    133.6955646934541,
                    199.04002574913483,
                ],
                [
                    5.700580454086168,
                    62.30214699943758,
                    109.4858546359291,
                    144.37435834128183,
                    196.80025087232633,
                ],
                [
                    3.8776389962399627,
                    47.07485197991684,
                    108.77911010272065,
                    143.55929331063112,
                    199.78963194031576,
                ],
                [
                    0.9206486824532956,
                    56.531536633466786,
                    103.22722183226676,
                    153.71850265606832,
                    199.26707930050713,
                ],
                [
                    1.2238397462105866,
                    42.37213742602606,
                    85.0161099008823,
                    144.6618761115177,
                    195.68883739488717,
                ],
                [
                    1.383845313528731,
                    55.58975449585246,
                    101.2502031542653,
                    155.4651069256266,
                    198.51896538541257,
                ],
                [
                    2.460600698918336,
                    45.35279677561122,
                    86.22855211501036,
                    142.2985968944624,
                    196.88095181245973,
                ],
                [
                    1.5771786133238486,
                    47.74919144071982,
                    98.25948642595273,
                    143.6080569193598,
                    199.35657813436302,
                ],
                [
                    1.679597195618454,
                    54.03099324959242,
                    93.24925248108138,
                    156.2197398880975,
                    199.96087190538344,
                ],
                [
                    0.09445769268561222,
                    62.987289799985746,
                    93.5536375308287,
                    146.10299624484736,
                    198.89381360902073,
                ],
                [
                    0.5074418255246016,
                    43.16902467382945,
                    97.5036007943674,
                    150.07249687988744,
                    197.1438186145631,
                ],
            ],
            "outliers": [],
        },
        {
            "axisData": axis_data,
            "boxData": [
                [
                    0.17336583192690824,
                    38.89251480694969,
                    95.24827036951726,
                    144.42455874548153,
                    199.4034309165705,
                ],
                [
                    3.676663641014155,
                    56.915752270243615,
                    116.52533365244228,
                    154.9613826361874,
                    199.45242610474344,
                ],
                [
                    0.2637149176087039,
                    39.10809721270764,
                    83.11646124189903,
                    145.85305644883107,
                    199.4425993969723,
                ],
                [
                    0.9435517891188017,
                    59.34726771939571,
                    116.9100457332774,
                    154.6830501745436,
                    197.360203327316,
                ],
                [
                    3.979089227580568,
                    59.55958857930115,
                    106.50956069508263,
                    154.19233153204274,
                    198.27863048295953,
                ],
                [
                    0.2254389425328185,
                    45.14272916122666,
                    101.99744565544017,
                    158.20585382578935,
                    199.87918467096276,
                ],
                [
                    0.4981747166813655,
                    55.07500323828029,
                    98.06775843874871,
                    142.6740673515219,
                    196.17733451641203,
                ],
                [
                    3.459413844168191,
                    48.45434370508197,
                    90.08287035261958,
                    144.44636703035508,
                    196.7330418635301,
                ],
                [
                    5.491046107788211,
                    51.726853187011294,
                    102.73451029578627,
                    144.81711164442441,
                    198.8867176824325,
                ],
                [
                    0.7550472434538769,
                    52.51096431201062,
                    107.88318214869264,
                    159.26961432919137,
                    199.61830476130777,
                ],
                [
                    0.2752001848587593,
                    48.7398963427885,
                    89.75616732426943,
                    142.05594236584855,
                    198.3147751483816,
                ],
                [
                    1.4946063684317945,
                    47.50894653631401,
                    98.11186814575922,
                    138.51943571666908,
                    193.3052139732351,
                ],
                [
                    0.20882224269564986,
                    51.28631550804623,
                    107.81597798598389,
                    160.02354609263347,
                    199.2878557923929,
                ],
                [
                    0.8976637474841898,
                    43.66029575375894,
                    100.62231619788403,
                    139.9661197041632,
                    192.54845617677,
                ],
                [
                    5.859745717489284,
                    47.03805156535355,
                    108.41470873842098,
                    157.096784096105,
                    199.9179863824041,
                ],
                [
                    3.7257707586363598,
                    42.231249941095996,
                    97.356821000705,
                    142.79191220154834,
                    198.84036692134,
                ],
                [
                    1.8454208635465985,
                    44.91333687646406,
                    98.65350096972611,
                    143.39018022926803,
                    199.87483964263296,
                ],
                [
                    0.5514923538800787,
                    45.85216189462081,
                    99.9806157446917,
                    153.32082407525542,
                    198.2776454910153,
                ],
            ],
            "outliers": [],
        },
        {
            "axisData": axis_data,
            "boxData": [
                [
                    0.7168805200240325,
                    46.53681449735687,
                    97.29254353668016,
                    156.63006806530143,
                    199.3015739378797,
                ],
                [
                    1.7193486665883828,
                    62.95172603462959,
                    112.02740143118092,
                    156.0538383864632,
                    199.26142301676774,
                ],
                [
                    2.1369256823901672,
                    57.21732276358834,
                    103.36834727083514,
                    153.72092303549277,
                    198.79539179393552,
                ],
                [
                    0.032880351113817596,
                    47.562260234793726,
                    96.26764103515997,
                    145.73458375286407,
                    199.06617414977254,
                ],
                [
                    0.4401537603581307,
                    43.865273442582165,
                    94.93675834281308,
                    146.35738146359748,
                    193.64127816517245,
                ],
                [
                    0.3961689590249673,
                    50.96909350725202,
                    104.73604524329194,
                    148.23414082526403,
                    198.8856874527377,
                ],
                [
                    0.21937305368529003,
                    49.59183574690416,
                    102.85949468466653,
                    163.6266324963084,
                    199.69745130954797,
                ],
                [
                    0.6248639849676607,
                    43.65587924550377,
                    98.38900488209111,
                    152.00850019757138,
                    197.66849547068205,
                ],
                [
                    0.8836653304501674,
                    51.715354680095054,
                    106.27634207918453,
                    152.75520182409605,
                    198.7026018674421,
                ],
                [
                    7.037170236614809,
                    60.499053468218285,
                    99.70265208133726,
                    145.547153860169,
                    197.56589704383606,
                ],
                [
                    0.191005947981715,
                    36.77501191389064,
                    78.79138996882105,
                    138.31773623910374,
                    199.5549011391389,
                ],
                [
                    2.085660638228548,
                    50.85562917320624,
                    100.31437027035244,
                    144.07227532917557,
                    199.9671689855977,
                ],
                [
                    2.8329465269889997,
                    46.64735576556238,
                    95.58042897665536,
                    150.95016495791145,
                    199.01002263253537,
                ],
                [
                    2.9140730838620232,
                    55.8981643150491,
                    99.12490122897461,
                    138.35381332244458,
                    197.89764340001602,
                ],
                [
                    0.6900722343886834,
                    61.20627193426343,
                    108.73896996351209,
                    152.38197094149575,
                    199.49695739258172,
                ],
                [
                    0.3519848056308117,
                    51.38799178079926,
                    108.74191700174138,
                    146.60812022274987,
                    198.09008264810322,
                ],
                [
                    0.2761553645218129,
                    56.388967149570455,
                    104.8697135719724,
                    153.5049030271958,
                    199.5731857965878,
                ],
                [
                    3.5557869592812708,
                    46.14828237062535,
                    108.66363220203428,
                    160.07663258712037,
                    199.1028921688903,
                ],
            ],
            "outliers": [],
        },
        {
            "axisData": axis_data,
            "boxData": [
                [
                    2.979477505147443,
                    39.75713406508555,
                    94.53079422141971,
                    156.08283690923398,
                    199.44795240229735,
                ],
                [
                    2.6484190473881064,
                    39.93623770385512,
                    77.27669464380185,
                    128.4315475425753,
                    199.56482718369725,
                ],
                [
                    0.027555734890816197,
                    57.0338837796717,
                    108.81399073964846,
                    148.06814743102228,
                    199.60110925244555,
                ],
                [
                    5.095524117378636,
                    61.306047315630614,
                    110.93776130670011,
                    156.1408460056575,
                    195.24807037634693,
                ],
                [
                    2.728611345602383,
                    44.56605304153001,
                    82.24512299722713,
                    147.52018338217582,
                    197.4401254594119,
                ],
                [
                    3.2844003726598903,
                    31.22917030540313,
                    98.82341804522095,
                    147.37909270120065,
                    195.31234405750303,
                ],
                [
                    0.18212434446978065,
                    59.703454603359305,
                    103.67261216911498,
                    144.78603398715182,
                    197.894221292169,
                ],
                [
                    2.0723859910971587,
                    65.62630968779271,
                    108.08425190082599,
                    153.04828999176155,
                    198.71953877580813,
                ],
                [
                    0.9675695750262392,
                    52.06976077477188,
                    106.44774448853506,
                    153.71491587328123,
                    199.9367145735771,
                ],
                [
                    2.5328359424461766,
                    54.040914797213425,
                    98.74095548976766,
                    156.68297214273787,
                    199.54362057796757,
                ],
                [
                    1.1331529861684952,
                    44.39864814947693,
                    88.34657630798353,
                    137.22778263394855,
                    198.83623456218217,
                ],
                [
                    0.03400372259445561,
                    39.0412178839992,
                    82.44989003395962,
                    142.39781316172628,
                    198.66240858068616,
                ],
                [
                    3.3739669830866514,
                    51.553716623716575,
                    113.01026058884891,
                    165.92964939460416,
                    198.22988431223231,
                ],
                [
                    1.7144280578984095,
                    52.52972703008254,
                    97.47299182400204,
                    134.9644807802092,
                    198.46967348342878,
                ],
                [
                    1.7893968468841948,
                    43.87294943558785,
                    90.42735899685948,
                    143.0586276081752,
                    197.6798595904976,
                ],
                [
                    4.299131337916773,
                    50.29192506963852,
                    104.5869339834448,
                    163.2705302681331,
                    199.10157077449355,
                ],
                [
                    0.6740610620747933,
                    54.02651804107089,
                    86.12616850846155,
                    137.7008290515613,
                    199.78999859299336,
                ],
                [
                    0.5370189113081292,
                    50.44519588101707,
                    98.08928065026996,
                    139.8482090057953,
                    197.20820681141507,
                ],
            ],
            "outliers": [],
        },
    ]
    
    (
        Boxplot(init_opts=opts.InitOpts(width="1600px", height="800px"))
        .add_xaxis(xaxis_data=axis_data)
        .add_yaxis(
            series_name="category0",
            y_axis=data[0]["boxData"],
            tooltip_opts=opts.TooltipOpts(
                formatter=JsCode(
                    """function(param) { return [
                                'Experiment ' + param.name + ': ',
                                'upper: ' + param.data[0],
                                'Q1: ' + param.data[1],
                                'median: ' + param.data[2],
                                'Q3: ' + param.data[3],
                                'lower: ' + param.data[4]
                            ].join('<br/>') }"""
                )
            ),
        )
        .add_yaxis(
            series_name="category1",
            y_axis=data[1]["boxData"],
            tooltip_opts=opts.TooltipOpts(
                formatter=JsCode(
                    """function(param) { return [
                                'Experiment ' + param.name + ': ',
                                'upper: ' + param.data[0],
                                'Q1: ' + param.data[1],
                                'median: ' + param.data[2],
                                'Q3: ' + param.data[3],
                                'lower: ' + param.data[4]
                            ].join('<br/>') }"""
                )
            ),
        )
        .add_yaxis(
            series_name="category2",
            y_axis=data[2]["boxData"],
            tooltip_opts=opts.TooltipOpts(
                formatter=JsCode(
                    """function(param) { return [
                                'Experiment ' + param.name + ': ',
                                'upper: ' + param.data[0],
                                'Q1: ' + param.data[1],
                                'median: ' + param.data[2],
                                'Q3: ' + param.data[3],
                                'lower: ' + param.data[4]
                            ].join('<br/>') }"""
                )
            ),
        )
        .set_global_opts(
            title_opts=opts.TitleOpts(title="Multiple Categories", pos_left="center"),
            legend_opts=opts.LegendOpts(pos_top="3%"),
            tooltip_opts=opts.TooltipOpts(trigger="item", axis_pointer_type="shadow"),
            xaxis_opts=opts.AxisOpts(
                name_gap=30,
                boundary_gap=True,
                splitarea_opts=opts.SplitAreaOpts(
                    areastyle_opts=opts.AreaStyleOpts(opacity=1)
                ),
                axislabel_opts=opts.LabelOpts(formatter="expr {value}"),
                splitline_opts=opts.SplitLineOpts(is_show=False),
            ),
            yaxis_opts=opts.AxisOpts(
                type_="value",
                min_=-400,
                max_=600,
                splitarea_opts=opts.SplitAreaOpts(is_show=False),
            ),
            datazoom_opts=[
                opts.DataZoomOpts(type_="inside", range_start=0, range_end=20),
                opts.DataZoomOpts(type_="slider", xaxis_index=0, is_show=True),
            ],
        )
        .render("multiple_categories.html")
    )
    
    

    总结

    本文主要是展示了箱形图的基本应用和案例。

    展开全文
  • 抖动,透明度,离群值,均值,组链接线) 易于选择的颜色和颜色可以将作为单独的图形打开以进行进一步的自定义在组和/或条件之间进行方差分析和事后检验统计结果显示在表格中,突出显示有效值重要性符号(星号/...
  • 我们的新分析证实了先前对γZ-box的轴向贡献的结果,并将不确定性降低了2倍。此外,我们注意到违反奇偶性的光子-强子相互作用会通过F3γγ引起额外的贡献。 使用对核子偶极矩的实验和理论约束,我们能够估计与此...
  • 箱形图和分辨率I

    2020-03-30 02:10:38
    箱形图简洁地,全面地描述了第二维和第三维中椭圆形纤维的奇异纤维,以及连接它们的翻转转变,这些都是基于表示理论数据。 我们开发了一个框架,该框架提供了一个箱形图和奇异椭圆纤维的新代数分辨率之间的系统映射...
  • 搞懂箱形图分析

    千次阅读 2019-10-29 10:09:51
    箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理,快速识别异常值。 箱形图最大的...

    最近有很多用户说到了年终需要回顾这一年的工作,根据这一年的数据看看有没有异常的情况,那么哪种图能够清晰直观地展现出这一信息呢?

    答案只有一个,那就是...

    箱形图

    箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理,快速识别异常值。

    箱形图最大的优点就是不受异常值的影响,能够准确稳定地描绘出数据的离散分布情况,同时也利于数据的清洗。

    想要搞懂箱形图,那么一定要了解...

    五大因“数”

    我们一组序列数为例:12,15,17,19,20,23,25,28,30,33,34,35,36,37讲解这五大因“数”

     

    1、下四分位数Q1

    (1)确定四分位数的位置。Qi所在位置=i(n+1)/4,其中i=1,2,3。n表示序列中包含的项数。

    (2)根据位置,计算相应的四分位数。

    例中:

    Q1所在的位置=(14+1)/4=3.75,

    Q1=0.25×第三项+0.75×第四项=0.25×17+0.75×19=18.5;

    2、中位数(第二个四分位数)Q2

    中位数,即一组数由小到大排列处于中间位置的数。若序列数为偶数个,该组的中位数为中间两个数的平均数。

    例中:

    Q2所在的位置=2(14+1)/4=7.5,

    Q2=0.5×第七项+0.5×第八项=0.5×25+0.5×28=26.5

    3、上四分位数Q3

    计算方法同下四分位数。

    例中:

    Q3所在的位置=3(14+1)/4=11.25,

    Q3=0.75×第十一项+0.25×第十二项=0.75×34+0.25×35=34.25。

    4、上限

    上限是非异常范围内的最大值。

    首先要知道什么是四分位距如何计算的?

    四分位距IQR=Q3-Q1,那么上限=Q3+1.5IQR

    5、下限

    下限是非异常范围内的最小值。

    下限=Q1-1.5IQR

    讲了这么多的“数学知识”,那么箱形图到底如何通过BDP应用到实际的工作呢?我们还是用一个实例来帮助大家理解。

    现在有“2017年各季度各地区分公司销售业绩”工作表,我们想要找出各季度哪些分公司业绩属于不正常范围内。

     

    数据示例如下图:

     

    BDP箱形图结果:

     

    从上图可以清晰的找出异常点,例如第二季度北京分公司的销售额为22147元,该值比上限10759元还要大,所以定义为异常值。

    箱形图的价值

    1.直观明了地识别数据批中的异常值

    上文讲了很久的识别异常值,其实箱线图判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的耐抗性,多达25%的数据可以变得任意远而不会很大地扰动四分位数,所以异常值不会影响箱形图的数据形状,箱线图识别异常值的结果比较客观。由此可见,箱线图在识别异常值方面有一定的优越性。

    2.利用箱线图判断数据批的偏态和尾重

    对于标准正态分布的样本,只有极少值为异常值。异常值越多说明尾部越重,自由度越小(即自由变动的量的个数);

    而偏态表示偏离程度,异常值集中在较小值一侧,则分布呈左偏态;异常值集中在较大值一侧,则分布呈右偏态。

    3.利用箱线图比较几批数据的形状

    同一数轴上,几批数据的箱线图并行排列,几批数据的中位数、尾长、异常值、分布区间等形状信息便昭然若揭。如上图,可直观得看出第三季度各分公司的销售额大体都在下降。

    但箱形图也有他的局限性,比如:不能精确地衡量数据分布的偏态和尾重程度;对于批量比较大的数据,反映的信息更加模糊以及用中位数代表总体评价水平有一定的局限性。

     

     

     

    在互联网数据分析的过程中,我们经常需要分析一组数据的离散分布情况以及分析这组数据的最大值、最小值、平均数、四分位数。

    有时我们会有如下应用场景:假设一款内容型产品,想要对比分析用户一周内对不同类型内容的打开情况。想要查看某个类型的内容一周内打开最多的用户是打开了几个,打开最少的用户是打开了几个,用户平均打开了几个,大多数的用户是看了几个内容。

    那么箱型图是一个能够很好反映这些数据离散的图表,在学习绘制箱形图前先介绍一下四分位数。

    一、分位数

    分位数,统计学的定义是指将一个随机变量的概率分布范围分为几个等份的数值点,通俗点说就是将一组数据按数量均分的点。比如二分位数就是指将一组数据均分为两等分的点,也被称作中位数。

    那么顾名思义四分位数就是将一组数据均分为四等分的点,一组数据被分为四等分需要有三个点,分别被称为:第一四分位数(下四分位数)、第二四分位数(中位数)、第三四分位数(上四分位数)。

    下四分位数等于这组数据中从小到大第25%的数字,上四分位数等于这组数据中从小到大第75%的数字。下四分位数与上四分位数之间的差距被称为四分位距,箱形图中的异常值就需要通过四分位距计算出来。

    二、箱形图

    箱形图因为形状类似一个箱子所以被称为箱形图,通过箱形图可以很直观的读出一组数据的最大值、最小值、中位数、上四分位数、下四分位数、异常值,甚至有的箱形图还能读出平均值。

    绘制箱形图:

    1. 首先需要得到这组数据的:最大值、最小值、平均值、四分位数。

    2. 其次分别在坐标轴上根据最大值、上四分位数、中位数、下四分位数、最小值的数值画出5条线段。连接上四分位数与下四分位数两端形成一个矩形,而后分别由矩形的上下端作垂线连接到上边缘(最大值)与下边缘(最小值)。

    3. 接下来通过上面提到的四分位距计算温和异常值和极端异常值的范围(将上四分位数用Q3表示、下四分位数用Q1表示、四分位距用IQR表示)。温和异常值的范围:上限为Q3+1.5*IQR,下限为Q1-1.5*IQR,处在这个范围内的值为温和异常值,一般用圆圈表示;极端异常值的范围:上限为Q3+3*IQR,下限为Q1-3*IQR,处在这个范围内的值为极端异常值,一般用星号表示。(之所以要画出异常值的范围是因为对于非正太分布的数据来说,方差、标准差很容易被异常值所影响,比如对于100个人的年收入这组数据来说,如果里面加入了马云这个异常值,这个数据就不具有代表性了。)

     

    具体箱形图如下图:

     

     

     

    三、用python绘制一幅简单的箱形图

    python中可以使用matplotlib库来绘制基础的箱形图,绘制出来的箱形图在异常值相关的表示上会有所简化。代码和效果如下:

     

    总而言之,箱形图可以很直观的分析数据的离散分布情况,上四分位数与下四分位数的距离越小说明越集中,否则说明越分散,对于上下边缘来说是一样的。然后通过中位数偏向于上四分位数还是下四分位数可以来分析数据分布的偏向。箱形图还有一个优点是相对受异常值的影响比较小,能够准确稳定地描绘出数据的离散分布情况,会比较有利于数据的清洗。

     

    展开全文
  • 箱形图的知识点箱型图优点箱型图缺点箱形图的五要素 箱型图优点 箱型图常用于检测并展现出数据中的异常值,利用箱型图可以判断数据的偏态和尾重。(即观测数据的整体集中分布情况,当数据分布较为集中的时候,箱型...
  • 箱形图分析

    千次阅读 2020-04-16 22:01:23
    箱形图的绘制依靠实际数据,不需要事先假定服从特定的分布形式,没有对数据作出任何限制性要求,只是真实直观地表现出数据形状的本来面貌。 箱型图判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的...
  • Python绘制箱形图全解

    千次阅读 2020-09-21 09:30:00
    作者:小dull鸟来源:Python数据分析之禅Python绘制箱形图全解数据挖掘工作中的第一步就是异常值检测,异常值的存在会影响实验结果。箱形图主要是为了检测异常值,箱形图最大的优点就...
  • Python实现箱形图的绘制

    万次阅读 多人点赞 2018-11-07 18:49:02
    因为箱形图是基于五数概括法的图形汇总,在介绍箱形图前,先简单介绍一下五数概括法。 五数概括法使用下面五个数来汇总数据: (1)最小值(Q1-1.5IQR) (2)第一四分位数(Q1) (3)中位数(Q2) (4)第三四分...
  • 箱形图

    千次阅读 2018-03-15 04:08:38
    转自:http://blog.csdn.net/fwj_ntu/article/details/78651672箱形图,也叫盒须图,盒式图,boxplot。有95%的把握猜中你现在已经不太确定,这图中有几条线?...接下来,带你从概念开始,一步步剖析箱形图以及背后的...
  • 目录九、箱形图 九、箱形图 箱形图又称为盒须图、盒式图或箱线图,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。 中位数:按顺序排列的一组数据中居于中间位置的数 上四分位数Q3:一组...
  • 一、箱形图的介绍 箱形图又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理,快速识别异常值。箱形图最大的优点...
  • 硬件升级 Excel2016中添加了几种新图表,树状图、旭日图、直方图、箱形图、瀑布图,都是之前需要处理数据才能制作的图表(知识点 | 树状图、旭日图、直方图、箱形图、瀑布图一步到位)。 未·来 人家都说,不念过往,...
  • matlab箱形图Data visualization is an important and sometimes undervalued tool in a data scientist’s toolkit. It allows us to gain an understanding and intuition about the data, through exploratory ...
  • java实现箱形图

    2021-04-15 18:41:10
    箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组...
  • py使用boxplot绘箱形图

    2021-09-15 17:29:22
    本博文源于《python数据可视化》(黑马程序员编著),旨在讲解python如何使用boxplot绘制箱形图。先讲解boxplor如何使用,然后给出一个示例.
  • 在Matlab中创建三维箱形图 内容 boxPlot3D 函数boxPlot3D允许您显示三维盒图并以多种方式控制可视化。 使用单个输入参数调用boxplot boxPlot3D(x)创建x中数据的三维箱形图。 如果x是3D矩阵,boxPlot3D为每一列...
  • 箱形图的适用场景箱形图适用于展示顺序数据,通过它我们可以观察出顺序数据的集中趋势和离散程度。箱形图是由5个统计量组合而成的图形,它们分别是:“最大值”、“最小值”、中位数、上四分位数和下四分位数。下面...
  • 作者 | zsx_yiyiyi来源 | python大本营原文 | Top 50 matplotlib Visualizations – The Master Plots (with full python code)25个Matplotlib的汇编,在数据分析和可视化中最有用。此列表允许您使用Python的...
  • data = [np.random.normal(0, std, size=100) for std in range(1, 4)] labels = ['A', 'B', 'C'] # 1行 2列 ,长9英寸 宽4英寸 fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(9, 4)) # 箱形图 bplot1 = ...
  • 箱形图定义 箱形图(Box-plot)是统计学中一种常见的统计数图,由于其图形与箱子类似而得名,所以又有"箱线图"、"盒须图"、"盒式图"等名称。箱形图可以统计出单变量数据的离散程度,将数据的离散程度以及分布区间清晰...
  • 箱形图含义

    万次阅读 多人点赞 2018-05-06 16:59:48
    箱形图,也叫盒须图,盒式图,boxplot。 1.什么是箱形图? 箱图的发明者John Tukey。Tukey先生1915年出生于美国麻省的新贝德福德。他22岁的时候在布朗大学获得了硕士学位,之后又在普林斯顿大学拿到了化学博士。...
  • 可视化神器Plotly玩转箱形图 在之前的文章中介绍过如何使用Plotly绘制柱状图、饼图、散点图等,都是比较常用的可视化图表呈现方式。本文介绍的是利用Plotly绘制统计图形中的一种:箱型图。 扩展阅读 Plotly的文章...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,975
精华内容 1,590
关键字:

箱型图