精华内容
下载资源
问答
  • excel常用统计函数

    2019-04-25 11:06:04
    统计函数是一些预定义公式,它们使用一些称为参数特定数值按特定顺序或结构进行统计分析计算。统计函数参数可以是数字,或者是涉及数字名称、数组或引用。
  • 常用统计函数 mysql

    2016-05-12 11:08:12
    表 8-14 常用统计函数 名 称说 明 AVG(字段名) 获取指定列平均值 COUNT(字段名) 如果指定一个字段,则会统计该字段中非空记录数量。如果在前面增加 DISTINCT,则会统 计不同值记录数,相同值当作一...

    常用的统计函数如表 8-14 所示。
    表 8-14 常用统计函数
    名 称说 明
    AVG(字段名) 获取指定列的平均值
    COUNT(字段名) 如果指定一个字段,则会统计该字段中非空记录的数量。如果在前面增加 DISTINCT,则会统
    计不同值的记录数,相同值的当作一条记录。如果使用COUNT(*)则会统计包含空值的所有记
    录数。
    MIN(字段名) 获取指定字段的最小值
    MAX(字段名) 获取指定字段的最大值
    STD(字段名) 指定字段的标准背离值
    STDDEV(字段名) 与 STD 相同
    SUM(字段名) 指定字段所有记录的总和


    展开全文
  • 今天学习了numpy切片的使用,分享给大家,代码很简单,主要帮大家了解切片的使用 import numpy as np file_path = "C:/Users/lenovo/Desktop/en.csv" t1=np.loadtxt(file_path,delimiter=",",dtype=int) # t2=np....

    今天学习了numpy切片的使用,分享给大家,代码很简单,主要帮大家了解切片的使用(csv文件大家随便创建一个即可)

    import numpy as np
    
    file_path = "C:/Users/lenovo/Desktop/en.csv"
    t1=np.loadtxt(file_path,delimiter=",",dtype=int)
    # t2=np.loadtxt(file_path,delimiter=",",dtype=int,unpack=True)
    print(t1)
    
    # print(t2)
    print("*"*100)
    #取某一行(计数从0开始)
    #print(t1[4])
    
    
    #取连续的某几行
    #print(t1[0:4])
    #取不连续的某几行
    #print(t1[[2,3]])或者
    #print(t1[[2,3],:])
    
    
    #取某列
    #print(t1[:,3])
    #print(t1[3,2])
    #取连续的几列
    #print(t1[:,1:3])
    
    #取某个位置
    #print(t1[2,1])
    #取多行和多列(第2到4行 第3,4 列)
    #print(t1[1:4,2:4])
    
    #取多个分散的点  注意:取得是(2,3)(2,1)两个点
    print(t1[[2,2],[3,1]])
    #赋值
    # t1[3,3]=1111
    # print(t1)
    
    #批量赋值
    # t1[:,1:3]=33333
    # print(t1)
    
    #让t1中大于50的变为12,小于50的变为1
    # t1[[t1<50]]=12
    # print(t1)
    
    
    #让t1中大于50的变为0,小于50的变为1
    # t2=np.where(t1>50,0,1)
    # print(t2)
    
    #让t1中大于50的变为0,小于40的变为1
    # t2=t1.clip(40,50)
    # print(t2)
    
    #常见的统计函数
    #1. 求和
    # print(t1.sum())#求所有数字的和
    # print(t1.sum(axis=0))#axis为0表示行,为1 表示列
    
    #2.求最值
    # print(t1.max())
    # print(t1.min())
    # print(t1.min(axis=0))#以行为单位,求每列的最小值
    
    #3.求均值
    # print(t1.mean())
    # print(t1.mean(axis=1,dtype=int))
    
    #4.求中值
    #print(np.median(t1))
    
    #5.求极值
    #print(np.ptp(t1))
    
    #6.求标准差
    print(t1.std())
    
    展开全文
  • 常用方法 1.1、数据类型操作 In [9]: t3 = np.array([[[1,2,3],[4,5,6]],[[7,8,9],[10,11,12]]]) In [10]: t3 Out[10]: array([[[ 1, 2, 3], [ 4, 5, 6]], [[ 7, 8, 9], [10, 11, 12]]]) 1.1...

    1、数据类型

    在这里插入图片描述

    nan和inf是什么

    • nan not a number

    • np.nan != np.nan

    • 任何值和nan进行计算都是nan

    • inf 无穷

    1.1、数据类型的操作

    在这里插入图片描述

    In [9]: t3 = np.array([[[1,2,3],[4,5,6]],[[7,8,9],[10,11,12]]])
    
    In [10]: t3
    Out[10]:
    array([[[ 1,  2,  3],
            [ 4,  5,  6]],
    
           [[ 7,  8,  9],
            [10, 11, 12]]])
    

    1.1、查看数组类名:type()

    In [13]: type(t3)
    Out[13]: numpy.ndarray
    

    1.2、查看数据类型:

    In [15]: t3.dtype
    Out[15]: dtype('int32')
    

    1.3、查看数组形状

    In [16]: t3.shape
    Out[16]: (2, 2, 3)
    

    1.2、修改数组形状reshape()

    In [17]: t4 = np.arange(12)
    
    In [18]: t4
    Out[18]: array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])
    
    In [19]: t4.reshape((3,4))	# 三行四列
    Out[19]:
    array([[ 0,  1,  2,  3],
           [ 4,  5,  6,  7],
           [ 8,  9, 10, 11]])
    

    1.2.1、三维数组

    In [23]: t5 = np.arange(24).reshape((2,3,4))
    
    In [24]: t5
    Out[24]:
    array([[[ 0,  1,  2,  3],
            [ 4,  5,  6,  7],
            [ 8,  9, 10, 11]],
    
           [[12, 13, 14, 15],
            [16, 17, 18, 19],
            [20, 21, 22, 23]]])
    

    1.2.2、reshape第一个参数为数据的块数,第二个为每块中数据行数

    三维数组变二维数组

    In [25]: t5.reshape((4,6))
    Out[25]:
    array([[ 0,  1,  2,  3,  4,  5],
           [ 6,  7,  8,  9, 10, 11],
           [12, 13, 14, 15, 16, 17],
           [18, 19, 20, 21, 22, 23]])
    

    1.2.3、变为一维数组

    (1,24)与(24,1)都是二维数组,相当于在一维数组上加一个中括号

    In [26]: t5.reshape(24,)
    Out[26]:
    array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
           17, 18, 19, 20, 21, 22, 23])
    

    1.2.4、将未知三维数组转换为一维的方法(得到数组的总元素个数,二维同理)

    方法一

    In [35]: t6 = t5.reshape((t5.shape[0]*t5.shape[1]*t5.shape[2],))
    
    In [36]: t6
    Out[36]:
    array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
           17, 18, 19, 20, 21, 22, 23])
    

    方法二flatten()函数直接展开数组

    In [38]: t5.flatten()
    Out[38]:
    array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
           17, 18, 19, 20, 21, 22, 23])
    

    注意

    • reshape函数是有返回值的不会对源数组造成改变
    • 直接对源改变的函数一般不会有返回值
    • reshape第一个参数为数据的块数,第二个为每块中数据行数

    2、 数组和数的计算

    2.1 加减乘除

    In [10]: t2 + 2
    Out[10]:
    array([[ 2,  3,  4,  5,  6,  7],
           [ 8,  9, 10, 11, 12, 13],
           [14, 15, 16, 17, 18, 19],
           [20, 21, 22, 23, 24, 25]])
    
    In [11]: t2 *2
    Out[11]:
    array([[ 0,  2,  4,  6,  8, 10],
           [12, 14, 16, 18, 20, 22],
           [24, 26, 28, 30, 32, 34],
           [36, 38, 40, 42, 44, 46]])
    
    In [12]: t2/2
    Out[12]:
    array([[ 0. ,  0.5,  1. ,  1.5,  2. ,  2.5],
           [ 3. ,  3.5,  4. ,  4.5,  5. ,  5.5],
           [ 6. ,  6.5,  7. ,  7.5,  8. ,  8.5],
           [ 9. ,  9.5, 10. , 10.5, 11. , 11.5]])
    
    In [13]: t2/0
    A:\program\anaconda\Scripts\ipython:1: RuntimeWarning: divide by zero encountered in true_divide
    A:\program\anaconda\Scripts\ipython:1: RuntimeWarning: invalid value encountered in true_divide
    Out[13]:
    array([[nan, inf, inf, inf, inf, inf],
           [inf, inf, inf, inf, inf, inf],
           [inf, inf, inf, inf, inf, inf],
           [inf, inf, inf, inf, inf, inf]])
    

    除以0得到的结果:

    • nan:not a number
    • inf:infinity 无限,无穷
    In [16]: t3
    Out[16]:
    array([[100, 101, 102, 103, 104, 105],
           [106, 107, 108, 109, 110, 111],
           [112, 113, 114, 115, 116, 117],
           [118, 119, 120, 121, 122, 123]])
    
    In [17]: t2 + t3
    Out[17]:
    array([[100, 102, 104, 106, 108, 110],
           [112, 114, 116, 118, 120, 122],
           [124, 126, 128, 130, 132, 134],
           [136, 138, 140, 142, 144, 146]])
    
    In [18]: t2*t3
    Out[18]:
    array([[   0,  101,  204,  309,  416,  525],
           [ 636,  749,  864,  981, 1100, 1221],
           [1344, 1469, 1596, 1725, 1856, 1989],
           [2124, 2261, 2400, 2541, 2684, 2829]])
    
    In [21]: t4
    Out[21]:
    array([[0],
           [1],
           [2],
           [3]])
    
    In [22]: t3
    Out[22]:
    array([[100, 101, 102, 103, 104, 105],
           [106, 107, 108, 109, 110, 111],
           [112, 113, 114, 115, 116, 117],
           [118, 119, 120, 121, 122, 123]])
    
    In [23]: t3 -t4
    Out[23]:
    array([[100, 101, 102, 103, 104, 105],
           [105, 106, 107, 108, 109, 110],
           [110, 111, 112, 113, 114, 115],
           [115, 116, 117, 118, 119, 120]])
    

    计算规则:

    • 维度相同的进行对应位置的计算
    • 遵循广播原则
      若两个数组的后缘维度(training dimension,从末尾开始计算的元素)轴长度相等或其中一方为1,则他们广播兼容。广播会在缺失或长度为1的维度上进行。
      例如:
      三维数组shape(3,3,3)与(3,2)不能计算,shape(3,3,2)与(3,2)能计算
      二维数组必须遵循行列完全相同或者与此二维数组轴长相同的一位数组
      上述t3 - t4计算中 t4对比t3为一列缺失维度,所以计算会在t4每一列上进行

    3、常用统计函数

    • 求和:t.sum(axis=None)
    • 均值:t.mean(a,axis=None) 受离群点的影响较大
    • 中值:np.median(t,axis=None)
    • 最大值:t.max(axis=None)
    • 最小值:t.min(axis=None
    • 极值:np.ptp(t,axis=None) 即最大值和最小值只差
    • 标准差:t.std(axis=None)
      在这里插入图片描述标准差是一组数据平均值分散程度的一种度量。一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值
      反映出数据的波动稳定情况,越大表示波动越大,约不稳定
    展开全文
  • 当我们整理好数据,需要对数据统计,比如,我们要看平均销量,每月销量多少 每年销售多少,每款产品销量多少,这就用到我们的函数操作
  • python pandas中聚合函数的应用小结 1、常用统计值相对应的python函数 平均数:np.mean() 总和:np.sum() 最大值:np.max() 最小值:np.min() 方差:np.var() 标准差:np.std() 频次(计数): np.count() 中位数...

    1. 背景描述

    数据分析中经常需要对数据特征的多种不同方式进行分组或归类,然后与统计函数结合使用,寻找信息的规律、数据间的差异或相关性等,从而更好地从数据中挖掘有价值的信息,服务于企业的运营和特定的问题解决。

    本文主要在这两方面进行总结:

    1. 数据分析中常用的统计函数(共15个聚合函数-python)的用法
    2. 与4种不同的分组、归类方法结合使用的效果比较

    2. 数据分析常用统计函数总结

    2.1 常用的统计值对应的python函数

    1. 平均数:np.mean()
    2. 总和:np.sum()
    3. 中位数:np.median()
    4. 最大值:np.max()
    5. 最小值:np.min()
    6. 频次(计数): np.size()
    7. 方差:np.var()
    8. 标准差:np.std()
    9. 乘积:np.prod()
    10. 协方差: np.cov(x, y)
    11. 偏度系数(Skewness): skew(x)
    12. 峰度系数(Kurtosis): kurt(x)
    13. 正态性检验结果: normaltest(np.array(x))
    14. 四分位数:np.quantile(q=[0.25, 0.5, 0.75], interpolation=“linear”)
    15. 四分位数:describe() – 显示25%, 50%, 75%位置上的数据
    16. 相关系数矩阵(Spearman/ Person/ Kendall)相关系数: x.corr(method=“person”))

    2.2 示例代码

    **基本使用方法 **

    import numpy as np
    import pandas as pd
    import scipy.stats as ss
    
    # 1. 常见统计函数的使用
    x = [5, 7, 6, 5, 8, 4, 7, 6, 4, 5]
    print("x的平均值:", np.mean(x))
    print("x总和是:", np.sum(x))
    print("x的中位数:", np.median(x))
    print("x的最大值:", np.max(x))
    print("x的最小值:", np.min(x))
    print("x的数据个数:", np.size(x))
    print("x的方差:", np.var(x))
    print("x的标准差:", np.std(x).round(2))
    print("x的乘积:", np.prod(x))
    print("x的偏度(Skewness):", skew(x))
    print("x的四分位数:", np.quantile(x, [0.25, 0.5, 0.75]))
    print("x的正态检验结果:", ss.normaltest(np.array(x)))
    

    在这里插入图片描述

    # 2. 计算数据样本的相关系数矩阵:
    x = pd.DataFrame([range(1, 5), range(2, 6)])
    print("Pearson相关系数:\n", x.corr(method="pearson"))
    print("Spearman相关系数\n:", x.corr(method="spearman"))
    print("Kendall相关系数\n:", x.corr(method="kendall"))
    x1 = x.loc[0]
    x2 = x.loc[1]
    print("x1与x2间的pearsom相关系数:", x1.corr(x2, method="pearson"))
    

    在这里插入图片描述

    3. 聚合函数与分组归类方法的联合使用(Python代码)

    3.1 DataFrame数据表中分组进行统计 – 与groupby()联合使用

    # 3.1.1 建立数据表
    import numpy as np
    import pandas as pd 
    df = pd.DataFrame({"名称": ["A", "B", "A", "A", "B", "A"],
                       "颜色": ["红色", "蓝色", "红色", "蓝色", "蓝色", "红色"],
                       "尺寸": ["大", "大", "小", "小", "大", "大"],
                       "厚度": [2, 5, 1, 2, 4, 5],
                       "数量": [10, 20, 15, 30, 10, 20]})
    df
    

    在这里插入图片描述

    # 3.1.2 使用groupby()根据“名称”对“数量”进行分组统计
    df.groupby(["名称"])["数量"].sum()
    

    在这里插入图片描述

    # 3.1.3 groupby()函数传入分组列表,对数据进行多层分组统计
    df.groupby(["名称", "颜色"])["数量"].sum()
    

    在这里插入图片描述

    # 3.1.4 在之前的基础上,对被统计的数据传入列表,达到多层分组分类统计的效果 
    df.groupby(["名称", "颜色"])[["数量", "厚度"]].sum()
    

    在这里插入图片描述
    3.2 数据表中多层筛选的应用 – 透视表pivot_table的应用

    # 3.2.1 简单的分组分类统计汇总
    pd.pivot_table(df, values=["数量"], index=["名称"], columns=["颜色"], aggfunc=np.sum,fill_value=0, margins=True)
    

    在这里插入图片描述

    # 3.2.2 多层级的分组和分类统计汇总
    pd.pivot_table(df, values=["数量"], index=["名称", "尺寸"], columns=["颜色"], aggfunc=np.sum, fill_value=0, margins=True)
    

    在这里插入图片描述

    # 3.2.3 多层分组统计不同指标的不同统计量
    pd.pivot_table(df, values=["数量", "厚度"], index=["名称"], columns=["颜色"], aggfunc={"数量": np.sum, "厚度": np.var}, fill_value=0, margins=True)
    

    在这里插入图片描述
    蓝色框 – 分组计算厚度的方差
    红色框 – 分组同步计算数量的总和
    这种方法不但快速便捷,还能在同一个平面内展示不同指标使用不同的统计量计算的结果。

    3.3 四分位数 – describe()的应用方法

    # describe()函数 -- 对数据表中的所有的数值型进行快速的统计
    df.describe()
    

    在这里插入图片描述
    3.4. 交叉表crossTab()函数

    # 交叉表crossTab()函数 -- 交叉表是用于统计分组频率的特殊透视表
    tab_ = pd.crosstab(df["名称"], df["颜色"], margins=True)
    tab_
    

    在这里插入图片描述

    3、结束语

    综述以上4种方法,基本上都会认为pivot_table()相对而言是最便捷、灵活且功能强大的统计分析函数,也是在日常工作中常用的方法之一。其实,每种方法都有特色和针对的方向,根据实际情况灵活运用即可。

    展开全文
  • 在日常管理中,经常需要分析变量与变量之间的关系,作为决策的基础。回归分析能够确定两个...本文将详细介绍这些函数的用法和使用技巧,一起来学习一下吧!↓↓↓★FORECAST函数:预测未来值FORECAST函数的功能是...
  • ClickHouse常用函数统计

    万次阅读 2018-10-16 11:10:51
    1、统计函数 1.1 分位数 90%分位数: quantile(0.9)() 在求(平均)响应时间时用到,quantile(0.9)(url_rt) 1.2 中位数 median() 还未使用到,median(url_rt) 1.3 相关系数 计算x与y相关系数,计算公式:∑(x...
  • 1.函数:COUNTIFS定义:计算多个区域中满足给定条件单元格个数用法:=countifs(条件A[跨表格名称!x列:x列,寻找满足当前表格某个值Y],条件B[…],…)如我想统计“登录注册”中“未完成”bug个数,可以写成...
  • 函数1.统计数量2.计算平均值3. 统计计算求和4.最大值5....先建立一个名为grade1表 ...AVG(字段名)使用方式:该种方式可以实现对指定字段平均值进行计算,在具体统计时将忽略NULL值。 函数:AVG(字段名);
  • Go 语言 常用字符串函数的使用 1.统计字符串的长度,按字节len(str): func main() { // 统计字符串的长度, 按字节统计len(str) // golang 的编码统一为 utf-8, 一个英文占1个字节、一个汉字占3个字节 var myStr ...
  • 前面已经提过:python中主要用于数据探索库是pandas(数据分析)和matplotlib(数据可视化)。 了解详情可见:Python中数据可视...pandas常用统计特征函数 1、sum() 计算数据样本总和(按列计算) 语法:sum(ite
  • 本文重点关注这些典型函数的应用场合及注意点,至于函数详细使用说明请参见LoadRunner帮助文档。1.1.1.事务相关1.1.1.1. lr_start_transaction/lr_end_transaction功能:事务开始/结束标记。应用场合:需要统计某一...
  • DAY函数2.DATE函数3.WEEKDAY函数二、数学与三角函数1.SUM函数2.SUMIF3.ROUND4.ABS函数5.INT函数6.SIGN函数7.POWER函数三、统计函数1.AVERAGE函数2.MAX函数3.MIN函数4.COUNT5.COUNTA6.COUNTIF函数7.RANK 一、日期与...
  • 描述统计是数据分析中常用的方法,它是指通过数学方法,对数据资料进行整理、分析,并对数据分布状态、数字特征和随机变量之间关系进行估计和描述方法。描述统计通常包括集中趋势分析、离散趋势分析和相关分析...
  • bitset创造一个内含位或布尔值且大小固定的数组...接下来介绍基本函数的用法:count() //统计1的个数any() //判断位段中是否至少包含1个1none() //判断位段中是否全部为0test() //判断该位是1还是0set() //设...
  • 0、前言 python基础语法中有讲解有关存储数据列表对象,但是其无法直接参与数值运算(虽然可以使用加法和乘法,但分别代表列表元素增加和重复)。...常用数学和统计函数; 线性代数求解; 伪随
  • 前文:Tao:小白从零开始数据分析02—Excel常用数据聚类及统计方法汇总​zhuanlan.zhihu.com函数使用基本函数1.1 平均值、中位数、众数平均值函数使用方法:=AVERAGE(数据范围)中位数函数使用方法:=MEDIAN(数据范围...
  • SQL统计函数使用实例

    千次阅读 2007-08-29 12:58:00
    统计函数是在数据库操作中时常使用的函数,又称为基本函数或集函数,常用统计函数如表4-6 所示.这些函数通常用在SELECT 子句中,作为结果数据集的字段返回的结果。在SELECT语句的SELECT 子句中使用函数的语法如下: ...
  • 难道 Excel 只能做这些简单工作吗 其实不然 函数作为 Excel 处理数据一个最重要手段 功能是十分强大 在生活和工作实践中可以有多种应用 您甚至可以用 Excel 来设计复杂的统计管理表格或者小型数据库系统请...
  • 我们在利用excel表格统计数据时,常常需要使用各种excel自带公式( 使用方法: =函数名(参数…)),下面将简单介绍下我们常使用几种方法。 MIN函数:找到某区域中最小值 MAX函数:找到某区域中最大值 ...
  • 在实际工作中经常需要统计数据,那你知道有哪些常用统计函数呢?今天与大家分享几个常见的统计函数用法。1、COUNT函数“三兄弟”主要是指COUNT、COUNTA以及COUNTBLANK函数,先来看看这三个函数的含义。COUNT函数...
  • LoadRunner-常用的函数

    2019-09-25 16:52:23
    本文重点关注这些典型函数的应用场合及注意点,至于函数详细使用说明请参见LoadRunner帮助文档。 1.1.1.事务相关 1.1.1.1. lr_start_transaction/lr_end_transaction 功能:事务开始/结束标记。 应用场合:需要...
  • Excel曾经一度出现了严重Bug,主要有两种比较悲催的情况,首先是这种:更加悲催的是这种:言归正传,今天和大家分享一组常用函数公式的使用方法:职场人士必须掌握的12个Excel函数,用心掌握这些函数,工作效率就会...
  • 直接排序常用sort函数,间接排序用argsort函数和lexsort函数。sort函数五返回值,如果目标函数是个视图,则原始数据会被修改,sort可以指定轴进行排序。 import numpy as np np.random.seed(42...
  • 我们今天接下来和你说的是我们常用的几个函数的使用方法,其实如果你真的想要去学习EXCEL函数,这条路上没有捷径可走,只有你把单个函数原理和使用方法弄明白以后,这样您才可以使用嵌套组合,发挥函数的无穷威力。...
  • 简单来说,Hive就是在Hadoop上架了一层SQL接口,可以将SQL翻译成MapReduce去Hadoop上执行,这样就使得数据开发和分析人员很方便地使用SQL来完成海量数据的统计和分析,而不必使用编程语言开发MapReduce那么麻烦。...
  • 统计指定月份平均销售金额: 在AVERAGEIF函数使用通配符: 求指定班级平均分且忽略0值: 通过10位评委打分计算出选手最后得分: TRIMMEAN函数说明: 返回数据集内部平均值。...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,732
精华内容 692
关键字:

常用统计函数的使用