精华内容
下载资源
问答
  • python统计数据指标的常见方法

    千次阅读 2019-04-15 20:34:39
    文章目录实验环境读取csv文件删除数据中我们不需要的列(假设我不需要...在对数据进行挖掘之前,我们得到的数据往往是不太理想的,数据缺失值太严重导致统计数据指标不太容易,这篇文章记录下如何在含有缺失值的情况...

    在对数据进行挖掘之前,我们得到的数据往往是不太理想的,数据缺失值太严重导致统计数据指标不太容易,这篇文章记录下如何在含有缺失值的情况下统计出我想要的一些数据

    实验环境

    • ubuntu 18.04
    • python 3.6
    • numpy scipy pandas
    • 随意一个csv文件(当然是要有数据的,我的csv部分数据如下)
    • 每个py文件都导入了以下三个依赖
    import numpy as np
    import pandas as pd
    from scipy import stats
    

    读取csv文件

    读取csv文件,并在函数中打印出读取的结果,最后返回一个DataFrame对象

    def readcsv(filepath):
        """
        读取csv文件
        :param filpath: 文件路径
        """
        df = pd.read_csv(filepath)
    
        print(df)
        return df
    
    filepath = 'santander-customer-satisfaction/test.csv'
    readcsv(filepath)
    

    我的运行结果结果如下:

    删除数据中我们不需要的列(假设我不需要ID的属性)

    def dropProperty(df, drop_properties):
        """
        传入一个数据表
        :param df: dataFrame对象
        :param drop_properties: 想要删除的属性集
        :return 返回一个删掉了一个或多个属性的df对象,不影响传入的对象
        """
      #axis=0代表删除相应的行,axis=1代表删除相应的列
        df = df.drop(drop_properties, axis=1)
        return df
    

    简单测试

    filepath = 'santander-customer-satisfaction/test.csv'
    df = readcsv(filepath)
    print('原始数据的前三行:')
    print(df.head(3))
    df = dropProperty(df, ['ID'])
    print('--'*20)
    print('删掉了ID属性列的结果:')
    print(df.head(3))
    

    测试的结果:

    统计某一列或多列数据有多少种不同的值

    def uniqueCount(df, start, end):
        """
        统计一列或者多列有多少种不同的值
        :param df: dataframe对象
        :param start 开始统计的第(start+1)列
        :param end 最后统计的一列(第end列)
        :return:
        """
        if end <= start:
            return None
    # 冒号是一个切片的意思
        diffCount = df.iloc[:, start:end].apply(lambda x: len(x.unique()))
        return diffCount
    

    简单测试

    filepath = 'santander-customer-satisfaction/test.csv'
    df = readcsv(filepath)
    result = uniqueCount(df, 0, 3)
    print('第一列到第三列不同的数值各有:')
    print(list(result))
    print('即:')
    print(result)
    

    测试结果:

    统计某一列有多少个等于某个值(测试我这里统计第二列[var3]等于32的值的个数)

    def countValue(df, col_start, col_end, value):
        """
        统计第col+1列中等于value的数量
        :param df: dataframe对象
        :param col_start: 开始列数(从零开始)
        :param col_end: 结束列数
        :param value: 等于的某个值
        :return: 个数(如果是多个列,那么返回一个序列)
        """
        if col_start >= col_end:
            return None
        else:
            count = df.iloc[:, col_start:col_end].apply(lambda x: np.sum(x == 0))
            return count
    

    简单测试

    filepath = 'santander-customer-satisfaction/test.csv'
    df = readcsv(filepath)
    count = countValue(df, 1, 2, 32)
    print(count)
    

    测试结果

    求取去除缺失值的均值

    def meanValue(df, col_start, col_end, miss_set):
        """
        求取各列去除了缺失值的均值
        :param df:dataframe对象
        :param col_start: 开始列
        :param col_end: 结束列
        :param miss_set: 缺失值的集合
        :return: 返回各个列的均值
        """
        if col_start >= col_end:
            return None
        else:
            # ~ 代表取反操作,不属于miss_set里面的值的就属于正常的情况
            # 对正常的值进行mean()操作就是去除了缺失值的均值
            mean = df.iloc[:, col_start:col_end].apply(lambda x: np.mean(x[~np.isin(x, miss_set)]))
            return mean
    

    简单测试

    filepath = 'santander-customer-satisfaction/test.csv'
    df = readcsv(filepath)
    # 假设32, np.nan和111是属于不正常的值
    mean = meanValue(df, 0, 3, [32, np.nan, 111])
    print('去除了不正常值的均值:')
    print(mean)
    

    测试结果

    关于众数&最大值&最小值&出现频率在前几的数据

    • 统计众数需要借助 scipy的stats中的mode函数即 stats.mode(list)
    • 统计最大值&最小值借助numpy中的max&min
    • 统计出现频率最高的几位使用形如 df.iloc[:, :].value_counts().iloc[0:5]的函数

    如有问题,请指教

    展开全文
  • 网站统计指标定义

    千次阅读 2017-11-09 14:51:16
    万瑞数据系统通过对用户所使用的浏览器赋予唯一标识来识别用户的身份。同一浏览器在当前计算周期内多次访问同一统计对象时,该浏览器被计算为一个独立用户。 2. 页面浏览量:在当前计算周期内,统计对象的页面被访...

    (一)流量统计

     

    1. 独立用户数:在当前计算周期内,访问统计对象的不重复用户数。万瑞数据系统通过对用户所使用的浏览器赋予唯一标识来识别用户的身份。同一浏览器在当前计算周期内多次访问同一统计对象时,该浏览器被计算为一个独立用户。

     

    2. 页面浏览量:在当前计算周期内,统计对象的页面被访总和。当带有万瑞数据代码的页面每次在浏览器里完全显示的时候,会被记为一次页面浏览。

     

    3. 独立IP数:在当前计算周期内,访问统计对象的所有用户使用的不重复IP地址数。

     

    4. 访问次数:在当前计算周期内,同一用户间隔不超过30分钟的一系列页面浏览视为一个访次。连续2个页面浏览间隔超过30分钟,则前一次视为上一个访次的结束,后一次视为下一个访次的开始。用户访问统计对象的时间间隔超过30分钟计为两次访问。

     

    5. 平均访问页数:在当前计算周期内,每个独立用户给统计对象所带来的页面浏览量的均值(页面浏览量/独立用户数)。

     

    (二)访问内容分析

     

    在设定的计算周期内,统计对象的页面被访信息。

     

    1. 被访页浏览量排行:在当前计算周期内,统计对象被访页的页面浏览量排行。

     

    2. 被访内容页浏览量排行:在当前计算周期内,统计对象被访内容页的页面浏览量排行。

     

    3. 被访首页浏览量排行:在当前计算周期内,统计对象被访首页的页面浏览量排行。

     

    4. 入口页排行:每个访次的第一个页面视为入口页。在当前计算周期内,按统计对象的页面作为入口页的次数排行。

     

    5. 出口页排行:每个访次的最后一个页面视为出口页。在当前计算周期内,按统计对象的页面作为出口页的次数排行。

     

    (三)访问来源分析

     

    在设定的计算周期内,统计对象所有浏览量的来源构成。

     

    1. 访问来源:访问来源包括链接来源和直接来源。直接来源指(1)在浏览器地址栏直接输入网址;(2)从浏览器收藏夹点击进入;(3)将统计对象设为浏览器默认首页;(4)用户通过电子邮件或IM传送网站某条链接,直接点击进入。链接来源指通过链接点击到达统计对象(页面)的方式,包括站内来源和站外来源,站内来源的链接来自被统计对象所属网站,站内来源分为内部来源和外部来源,内部来源的链接来自被统计对象内部,外部来源的链接来自统计对象外部。站外来源的链接来自其他网站。

     

    2. 关键词排行:用户通过特定关键词搜索点击访问统计对象的页面所产生的直接浏览量排行。

     

    3. 搜索引擎排行:用户通过搜索引擎搜索并访问统计对象的页面而产生的直接浏览量排行。

     

    (四)用户行为分析(只呈现前一天的数据)

     

    在设定的计算周期内,统计对象的访问者访问行为特征信息。

     

    1. 回访天数分布:按用户访问统计对象的回访间隔天数来划分计算周期内回访的独立用户数。分为间隔0天的、间隔1天的、间隔2天的、间隔3天的、间隔4天以上的等5个级别,分别统计属于该五个级别的计算周期内回访的独立用户数。

     

    2. 访问次数分布:按用户访问统计对象的访问次数来划分计算周期内的独立用户数。分为访问1次的、访问2次的、访问3次的、访问4次的和访问5次以上的,分别统计属于该五个级别的当日独立用户数。

     

    3. 访问停留时长分布:按用户访问统计对象的访次停留时长来划分计算周期内的独立用户数。分为停留少于1分钟的、停留1-2分钟的、停留2-3分钟的、停留3-4分钟的、停留4-5分钟的、停留5-10分钟的和停留多于10分钟的,分别统计属于该七个级别的当日独立用户数。

     

    4. 浏览页数分布:按用户浏览统计对象的页数来划分计算周期内的独立用户数。分为浏览1页的、浏览2页的、浏览3页的、浏览4页的、浏览5页以上的等多个级别,分别统计属于不同浏览页数级别的当日独立用户数。

     

    5. 访问深度:按小时划分的浏览页数分布。

     

    6.访问路径:在当前计算周期内,统计对象被访页面的访问来源与流向。

     

    7.新访者数:在计算周期内新访者的合计数,万瑞数据将30日内第一次访问统计对象的独立用户视为新访者。

     

    8.  回访者数:在计算周期内回访者的合计数,万瑞数据将30日内超过两次(含两次)访问统计对象的独立用户计为回访者。

     

    (五)客户端特征分析

     

    在设定的计算周期内,访问统计对象的用户其电脑特征信息。

     

    1. 访问者语言:在当前计算周期内,按用户终端设定的语言划分页面浏览量。

     

    2. 屏幕分辨率:在当前计算周期内,按用户终端设置的屏幕分辨率划分页面浏览量。

     

    3. 浏览器版本:在当前计算周期内,按用户终端使用的浏览器版本划分页面浏览量。

     

    4. 操作系统:在当前计算周期内,按用户终端使用的操作系统版本划分页面浏览量。

     

    5. Flash版本:在当前计算周期内,按用户终端使用的Flash版本划分页面浏览量。

     

    (六)访问者地区分布

     

    在设定的计算周期内,被统计网站的用户数及用户基本特征信息。

     

    1. 浏览量全球地区分布:按国别和地区划分统计对象在统计周期内浏览量的构成。

     

    2. 访问者全球地区分布:按国别和地区划分统计对象在统计周期内独立IP地址数的构成。

     

    3. 浏览量中国地区分布:按中国各省、直辖市和自治区划分统计对象在统计周期内浏览量的构成。

     

    4. 访问者中国地区分布:按中国各省、直辖市和自治区划分统计对象在统计周期内独立IP地址数的构成。


    其他请参考: App统计指标定义


    展开全文
  • 网站数据分析指标体系

    千次阅读 2017-08-27 12:26:17
    【编者注】网站流量统计,是指对网站访问的相关指标进行统计。本文整理自网友分享的一份 Word 文档,主要介绍了网站分析的 KPI 指标数据分析方法、网站分析工具介绍和对比等。 一、总论 1. 概念  网站...
    标签: 郑来轶 数据分析 分析报告 数据报表 网站分析 分类: 03.数据分析

    【编者注】网站流量统计,是指对网站访问的相关指标进行统计。本文整理自网友分享的一份 Word 文档,主要介绍了网站分析的 KPI 指标、数据分析方法、网站分析工具介绍和对比等。


    一、总论


    1. 概念

       网站流量统计,是指对网站访问的相关指标进行统计。网站访问分析(有时也使用“网站流量分析”、“网站流量统计分析”、“网站访问统计分析”等相近的概念),是指在获得网站流量统计基本数据的前提下,对有关数据进行统计、分析,从中发现 用户访问网站的规律,并将这些 规律与网络营销策略等相结合,从而发现目前网络营销活动中可能存在的问题,并为进一步修正或重新制定网络营销策略提供依据。

    2. 意义

       • 了解网站的目标人群特征,为产品设计提供重要依据
       • 了解网站关注行业用户量的潜在规模
       • 对比行业平均指标,作为评估自身网站发展的指标
       • 分析网站与竞争对手之间的用户重合度
       • 分析自身网站内部各栏目间的用户重合度

    3. 分析报告

       网站统计分析通常按 日 、 周 、 月 、 季度 、 年或围绕营销活动的周期为采集数据的周期。当然单纯的网站访问统计分析是不够的,我们在分析报告中需根据网站流量的基本统计和可采集的第三方数据的基础上,对网站运营状况、网络营销策略的有效性及其存在的问题等进行相关分析并提出有效可行的改善建议才是网站访问统计分析报告的核心内容。应该包括以下几方面的内容:

       • 网站访问量信息统计的基本分析 

       • 网站访问量趋势分析

       • 在可以获得数据的情况下,与竞争者进行对比分析
       • 用户访问行为分析
       • 网站流量与网络营销策略关联分析
       • 网站访问信息反映出的网站和网站营销策略的问题诊断

       • 对网络营销策略的相关建议


    二、关键绩效指标(KPI)


    1.常用指标

       红色标记的指标是最为必要的 KPI, 对网站的统计分析有很大的意义和作用。

    1.1.  网站流量 KPI

       网站流量统计 KPI 常用来对网站效果进行评价,主要的统计指标包括:

       访问量(Page View):即页面浏览量或者点击量,用户每次对网站的访问均被记录 1 次。用户对同一页面的多次访问,访问量值累计。

       衍生出的指标:
       日均访问量:指对应时间范围内,网站每日的平均访问量。
       最高日访问量:指对应时间范围内,网站在某天获得最高访问量。

       PV%:指选择时间范围内,某个类别的 PV 占总 PV 的比例。


       独立 IP :指在一天之内(00:00-24:00),访问网站的独立 IP 数。相同 IP 地址只被计算 1 次。


       独立访客(Unique Visitor):将每台独立上网电脑(以 cookie 为依据)视为一位访客,指一天之内(00:00-24:00)访问您网站的访客数量。一天之内相同 cookie 的访问只被计算 1次。

       衍生出的指标:

       UV%:指选择时间范围内,某个类别的 UV 占总 UV 的比例。


       重复访客(Repeat Visitor):某个 cookie 的再次访问计为一个重复访客,它的数目即为重复访客数量。
       衍生出的指标:
       重复访客百分比:重复访客占全部访客的比例。
       重复访问数量:是指某个 cookie 除第一次访问之后,又访问您网站的次数。
       人均访问页面数:指对应时间范围内,每个访客访问网站的平均页面数。

    1.2. 用户行为 KPI

       用户行为 KPI 主要反映用户是如 何访问网站的、在网站上停留了多长时间、访问了哪些页面等,主要的统计指标包括:
       访问深度(Depth of Visit):在一次完整的站点访问过程中,访客所浏览的页面数。访问页面越多,深度越高,访问深度可以理解为是平均页面访问数的另一种形式,也是衡量网站粘度的指标。
       新访客:某个 cookie 的首次访问计为一个新访客。
    最近访客:最新访客统计,最近一段时间内(5 分钟内)访问您网站的 100 个独立访客,按“进入时间”倒序排列。
       同时在线人数:15 分钟(时间范围可自己定)内在线访问的 UV 数。
       最高小时在线人数:指对应时间范围内,网站在某一小时内最高同时在线的唯一访客数。注:
       “天”以 24 小时(00:00-24:00)为单位。
       访问入口:每次访问过程中,访客进入的第一个页面,此页面可以显示网站对外或搜索引擎的一些链接入口。
       访问出口:每次访问过程中,访客结束访问,离开前点击的最后一个页面,此页面可以显示网站对外或搜索引擎的一些链接入口。
       访问最多的页面:访客访问最多的页面。
       进入最多的页面:作为访客访问站点的访问入口中最多的页面。
       退出最多的页面:作为访客访问站点的访问出口中最多的页面。
       到达最多的目标:通过点击链接到达的最多的目标页面。
       首页访问数:首页的游览量。
       站点覆盖(点击密度分析):通过覆盖在 Web 页面上方的点击,可以直接显示访客在 Web页面上点击了哪里。
       访客所用搜索引擎:分析网站访客访问网站所使用的搜索引擎。
       访客所用关键字:分析网站是通过哪些关键字搜索带来的流量,并分析每个关键字是由哪些搜索引擎带来的。
       衍生出的指标:
       最频繁的关键字:使用最多的关键字的比例。
       访客停留时间(访问时长):访客访问网站的持续时间。
       衍生出的指标:
       访客平均停留时间:所有访客的访问过程,访问持续时间的平均值。
       来源分析:分析网站访客的来源类型,来源页面统计。来源类型分为:
       搜索引擎:由搜索引擎的链接访问网站。
       其他网站:由非搜索引擎的其他网站链接访问网站。
       直接输入网址和标签:访客通过在地址栏、收藏夹、书签等方式直接访问网站。
       站内跳转:访客在网站内部的页面之间进行跳转,产生的流量。
       总数据:网站自开通盘点系统之日起至今的各数据量总和。
       访问量变化率:指对应数据项在当前时间段,与上一个时间段相比较,访问量的同比变化率。
       例如,上周(7 天)的访问量变化率为 ↓21.1% ,表示上周的访问量比上上周的访问量下降了 21.1%。又如,今日 10:00-11:00 的访问量变化率为 ↑1.3% ,表示今日 10:00-11:00 比昨日 10:00-11:00 的访问量上升了 1.3%。
       被访页面:分析网站中各个页面的流量分布,以及其随时间的变化趋势。
    当前访客活跃度:是指您网站上当前访客的多少,它在一定程度反应了您网站在当前时间的受欢迎程度。
       访问路径:每个访问者从进入您的网站开始访问,一直到最后离开您的网站,整个过程中先后浏览的页面称为访问路径。
       访问频度:指您网站上访问者每日访问的频度,用于揭示您网站内容对访问者的吸引程度。
       点击次数:是指用户点击页面上链接的次数。

    1.3.  用户访问方式 KPI

       用户访问方式 KPI 主要反映用户访问网站的地域、设备、浏览器名称和版本、操作系统等,主要的统计指标包括:
       地理位置:网站的访客来源于哪个省、市、自治区或国外。
       网络服务提供商:网站的访客所处的网域,是电信用户还是网通用户。
       IP 段:网站的访客所在的 IP 段。
       浏览器:网站的访客所使用的浏览器类型。
       屏幕分辨率:网站的访客所使用的各种屏幕分辨率。
       操作系统:网站的访客所使用的操作系统类型。
       语言环境:网站的访客使用的哪国语言的操作系统。
       插件类型:网站的访客安装的各种插件情况。
       Cookie 支持:网站的访客所使用的浏览器是否支持 cookie。
       终端类型:网站的访客所使用什么类型的终端上网。

    2.  重要指标

       关键指标是网站访问统计中最为重要的参考指标,分为如下两类:

    2.1. 用户和流量增长 KPI

       用户增长百分比:即 UV 的增长百分比(一般是同上个月或上一周来比较)。
       流量增长百分比:即 PV 的增长百分比(同上)。
       从搜索引擎而来的流量百分比:从搜索引擎而来的 PV 占总 PV 的比例。
       新访客比例:新访客占全部访客的比例。

    2.2. 内容效率 KPI

       每次访问的平均页面数:总访问量/访问人次。平均页面访问数代表了网站的粘度,粘度越高,用户看的页面越多,平均页面访问数也就越高。
       每个独立访客的平均访问次数
       回访率:回访访客占所有访客的比例,用于揭示网站访问者对网站的 忠诚度。
       新访客同回访客的比例
       网站访问者在不同逗留时间(0—30 秒,30 秒—2 分钟等)的数量
       不同访问深度的访客数量
       跳出率(Page Bounce Rate):指仅浏览了该页面(一个页面)就离开网站的用户比例。

    3.  特殊指标

       如果网站有全站搜索,才用得到这部分,不过很多统计工具不提供这种统计。

    3.1.  内部搜索效率 KPI

       使用搜索的用户百分比
       每次访问的平均搜索次数
       得到"0 结果"的搜索百分比
       从搜索结果中得到"0 点击"的百分比

    4.  营销类指标

    4.1. 营销效率的 KPI

       每个访客的平均成本
       每个访客的平均收益
       新访客和回头客的收益比较
       新客户同旧客户的收益百分比
       每个购物车的平均商品数量
       每次转换的订单平均价值和平均成本

    4.2.  购物车的 KPI

       购物车放弃率:指在购物过程中途放弃的比例。
       开始购物率:指添加第一个商品到购物车的访客数量除以总的访客数量。
       开始结帐率:指点击了结帐按钮的访客数除以总的访客数。
       完成结帐率:总的完成付款购物的用户数目/点击了结帐按钮的用户总数。

    4.3. 转换 KPI

       转换率(Conversions Rates):进行了相应的动作的访问量/总访问量。
       新访客的转换率

       回访客的转换率


    三、数据的分析方法


    1、聚类分析(相应的算法分析 K-means 算法,统计学上的原理等)

    2、用户细分

       大部分访问者从哪里来—分析网站流量来源
       访问者最关注哪些栏目—分析访问者的浏览路径
       访问者从哪里流失得最多—分析网站流量流失的原因

       分析访问来源的差异性—分析不同访问渠道对流量的贡献程度


    四、访问统计分析工具


    1. 分类

    1.1. 服务器端软件

       通过直接读取网站访问 Log 文件,来做统计分析。
       优点:
       • 可以从任何地方都可以访问;
       • 速度快,因为通常这些统计分析都是通过 Cron 任务来定时执行的;
       • 可靠度高,因为是直接读取 Log 文件,当然所有访问服务都有记录;
       • 隐私问题,因为是使用自己的分析工具,当然没有被第三方获得的机会;
       • 网站访问错误统计,同样是因为基于 Log 日志的统计,所有的访问记录都有,也包括 404错误等各类错误统计;
       • 搜索引擎的蜘蛛访问统计

    1.2. 桌面软件

       这种软件通常都是商业软件,极少免费的,比如 Web Trends,Sawmill 等。一般这种软件是安装在用户的桌面电脑上,然后定期下载网站的 Log 文件,在本地进行分析统计,无需上网都可以使用。

    1.3. 在线统计服务

       这种服务现在很流行,目前使用最多的就是 Google Analytics。要使用在线统计服务的话,需要在你的网站的所有页面中,都加入一段统计代码。而统计的过程中,是不会统计到那些404 错误的。

    2. 统计服务商对比

    2.1. CNZZ 站长统计

    优点:后台栏目设置分类比较清晰,统计的数据比较详细。
    缺点:没有统计访客的停留时间和跳出率;没有深入的分析报告。

    2.2. 51 啦统计

    优点:后台界面比较清晰,顶部栏目设置很不错。
    缺点:没有统计访客的停留时间和跳出率;没有深入的分析报告。

    2.3. 51yes 统计

    优点:客户地理位置统计用地图显示。
    缺点:后台功能的归类比较零散,不方便统计,没有深入的分析报告。

    2.4. 量子恒道统计

    优点:界面比较清晰,比较简洁。
    缺点:数据不是很详细,没有深入的分析报告。

    2.5. Google Analytics

    优点:对访客停留时间和跳出率都有统计,功能是其中最为复杂强大的。
    缺点:没有什么明显缺点。

    2.6. 百度统计

    优点:基于搜索引擎关键字分析。
    缺点:很难申请到。

    3. 免费工具

    3.1. Woopar

       站在业界尖端的统计系统。Woopra 的客户端可以运行在目前 99%的平台,包括 Windows、Mac 和 Linux,界面非常华丽。除了可以实时查看访问流量、搜索关键字、访问来源等常规信息外,还可以进行搜索、查看实时分析数据及图表、创建事件提醒等功能。
       非常有特色的一个地方就是,你可以通过客户端自带的 IM 系统同正在访问你的网站的用户实时沟通。这个功能是目前的统计系统都没有的功能。可以对特别的用户用 tag 来表示,并且可以查看历史上他所访问的记录。还有很多很多的特别的功能。丰富的界面实时通讯实时统计。
       Tips:需下载客户端,是基于 JAVA 开发的平台,注册是免费的。
       地址:http://www.woopra.com/

    3.2. 维度统计

       是一个类似 Woopra 的统计系统,也有客户端,还有 IM,但不是基于 Java。它的客户端界面不够漂亮,效率也不够高,数据同步较慢。
       地址:http://www.vdoing.com/

    3.3. Analog

       需要下载的一个站点统计工具,非常的专业。
       地址:http://analog.cx/

    3.4. Awstats

       Awstats 除了可以分析 Web,还可以分析 FTP,Email Log 文件。
       地址:http://www.awstats.org/

    3.5. OneStatFree

       提供免费的点击统计和网站分析。同时提供高级的付费服务。
       地址:http://www.onestatfree.com/

    3.6. CrazyEgg

       具有追踪、评估功能,可以根据访客点击的位置对网站进行优化。
       CrazyEgg 有一个非常有特色的地方,就是 heat map,就像一张红外线照片,用红色橙色蓝色的不同区域在你的网页上表示出哪些部分是热区。最基本的服务是免费的,每月可以统计5000 个 Visits,同时可以统计 4 个页面。作为一种尝试,也是不错的。
       地址:http://crazyegg.com/

    3.7. Piwik

       Piwik 是一个开放源代码的网站分析应用,它使用 PHP 和 MySql 开发。Piwik 有一个允许你任意延伸和自定义的“插件”系统。你可以选择仅仅安装你需要的插 件,或者全部安装。
       Piwik 插件系统,和你想象的一样,它也给你一个创建你自己的定制扩展应用的可能,并且Piwik 是个轻量级的应用,下载包只有 1.9MB。
       地址:http://piwik.org/
    http://piwik.org/demo/index.php?module=CoreHome&action=index&idSite=1&period=day&dat
    e=yesterday#module=Dashboard&action=embeddedIndex&idSite=1&period=day&date=yesterday(在线演示地址)

    3.8. FireStats

       FireStats 是一个简单和直接的网站分析应用,使用 PHP 和 MySql 开发。它支持多种平台,包括 C#站点,Django 站点等,以及 Wordpress 和其他的一些平台。FireStats 还有一个优秀的 API[应用程序接口,它可以协助你创建你自己的基于你的 FireStats 数据的特制应用程序或发布平台组件。
       地址:http://firestats.cc/

    3.9. Snoop

       轻量级的站点统计服务商 reinvigorate 推出的一个桌面工具,能够让你实时查看自己站点发生的各种事件,比如用户注册,留言,访问等,常规的站点统计服务,便于在一定时间后对各种累积数据的统计分析,而 Snoop 的功能则在于事件的动态展现,能够让 Blogger 即时了解自己的 Blog 状况,提供实时访客追踪,具有姓名标签合并等高级功能。
       Snoop 是一个基于桌面,运行在 Mac OS X 和 Windows XP/Vista 平台的 web 分析工具。它运行后,会驻留在你的系统状态栏或系统托盘中,当一些事件发生的时候,会有声音来提醒你。另外一个显著的 Snoop 特色就是 Name Tags 选项,允许你使用“标记”来更容易的识别访客。
       地址:http://report.reinvigorate.net/snoop

    3.10. Clicky

       这是一款功能全面的分析套装软件,服务主要针对于小网站和博客,易于使用,包括实时访客追踪、深度内容分析等高级服务。
       地址:http://getclicky.com/

    3.11. Enquisite

       尤其擅长搜索引擎访问和 PPC 访问。提供地域数据、页面位置等深度统计。
       地址:http://www.enquisite.com/

    3.12. 103bees

       是一款实时搜索引擎分析和统计工具,高度关注搜索引擎访问量,擅长为网站 SEO 分析关键词。
       地址:http://103bees.com/

    3.13. Measure Map

       为博客提供容易理解的统计数据,目前该网站不接受新帐号,但是可以输入电子邮件获取未来通知,该网站归 Google 所有。

    3.14. whos.amung.us

       实时访客计数器,能显示任何一个时刻网站的总访问人数,不需要注册,很容易安装。
       地址:http://whos.amung.us/

    3.15. FeedBurner

       全球最大的 RSS 托管服务网站。针对博客,界面简洁、直观,提供深度统计数据,目前归Google 所有。
       地址:http://feedburner.google.com

    3.16. ClickTale

       记录访客活动,网站 SEO 分析后便可理解用户行为并提高网站的可用性。
       地址:http://www.clicktale.com/
    展开全文
  • 机场生产运行数据统计指标-第四篇-机场运行保障类

    机场运行保障类

    1  民航航班正常统计

    1.1 统计说明

    (1)统计范围的相关说明:

    1.民航航班正常统计范围:国内外运输航空公司执行的客货运航班,包括正班、加班、包机。港澳台地区及国际航班的国内段,按地区航班或国际航班统计。

    2.机场放行正常统计范围为国内外运输航空公司在国内机场离港的客货运航班,包括正班、加班、包机。

    3.航班正常和机场放行正常月度统计以自然月为周期,即每月1日零时(北京时,下同)起至当月最后一日24时止。每日统计从当日零时起至当日24时止。跨日航班按计划离港时间所在日期统计。

    4.航空公司提前一日取消的次日航班或次日补班计划,不列入航班正常和机场放行正常统计范围。当日取消的航班按不正常航班统计。

    正班、加班、包机对应的航班任务请参照“4.1.3运输航班起降架次”。

    (2)相关定义:

    1.航段班次:航班每一次起降为一个航段班次。航班正常统计以航段班次为统计单位。

    2.计划离港时间:指航班时刻管理部门批准的离港时间。

    3.实际离港时间:机组得到空管部门推出或开车许可后,地面机务人员实施撤去航空器最后一个轮挡这一动作的时间。

    4.计划到港时间:指航班时刻管理部门批准的到港时间。

    5.实际到港时间:飞机在机位停稳后,地面机务人员实施挡上航空器第一个轮挡这一动作的时间。

    6.航班起飞/落地时间:空管部门拍发起飞、落地电报中所标注的时间。

    7.机场放行班次:每一个航班离港起飞为一个放行班次。机场放行统计以放行班次为统计单位。

    8.计划过站时间:前段航班到达本站计划到港时间至本段航班计划离港时间之间的时间。

    9.实际过站时间:前段航班到达本站实际到港时间至本段航班实际离港时间之间的时间。

    10.机型最少过站时间:机型计划过站需要的最少时间。

    11.始发航班:同一注册号飞机,计划离港时间在当日06:00(含)以后,实际执行的第一段离港航班。

    1.2 正常航班起降架次

    定义:指统计期内正常航班的起降架次。符合以下条件之一的航班为正常航班。

    (1)在计划离港时间前后5分钟之内撤轮挡,且按航班运行正向进程起飞,不发生滑回、中断起飞、返航、备降等特殊情况;

    (2)不晚于计划到港时间挡轮挡。

    备注:当航班备降时,如备降机场与计划目的地机场属同一城市,且实际离港(或到港)时间较计划离港(或到港)时间在规定范围内,为正常航班。

    1.3 不正常航班起降架次

    定义:指统计期内不正常航班的起降架次。凡有下列情况之一的为不正常航班;

    (1)不符合正常航班全部条件的航班;

    (2)当日取消的航班;

    (3)未经批准,航空公司自行变更航班计划的航班;

    1.4 航班正常率

    定义:反映航班运行效率的指标,即正常航段班次与计划航段班次之比,用百分比表示。

        计算公式:航班正常率 = 正常航段班次/计划航段班次。

    航班延误原因分类如下:

    (一) 天气原因
    1.天气条件低于机长最低飞行标准;
    2.天气条件低于飞机最低运行标准;
    3.天气条件低于机场最低运行标准;
    4.因天气临时增减燃油或装卸货物;
    5.因天气造成机场或航路通信导航设施损坏;
    6.因天气导致跑道积水、积雪、积冰;
    7.为避开天气而改变航路;
    8.因高空逆风造成实际运行时间超过标准航段运行时间;
    9.航空器进行除冰、除雪检查或等待除冰、除雪;
    10.天气原因造成航班合并、取消、返航、备降;
    11.天气原因(发展、生成、消散等各阶段)造成空管或机场保障能力下降;
    12.其它天气原因。

    (二) 航空公司原因
    1.公司计划;
    2.运行保障;
    3.空勤组;

    4.工程机务 
    5.公司销售;
    6.地面服务;
    7.食品供应;
    8.货物运输;
    9.后勤保障;

    10.代理机构;
    11.其它航空公司原因。

    (三) 流量控制原因
    1.实际飞行超过区域管制扇区保障能力;
    2.实际飞行超过终端管制扇区保障能力;
    3.实际飞行超过机场跑道、滑行道或停机坪保障能力;
    4.航路通信、导航或监视设备校验造成保障能力下降。

    (四) 航班时刻安排的原因
    航班时刻安排超过空管或机场保障能力。

    (五) 军事活动
    1.军航训练、转场、演习、科研项目等限制或禁止航班飞行,造成保障能力下降;
    2.军方专机禁航;

    3.其它军事活动原因。

    (六) 空管原因
    1.空管人为原因;

    2.空管系统所属设备故障;
    3.气象服务未及时提供;
    4.航行情报服务未及时提供或有误;
    5.其它空管原因。

    (七) 机场原因
    1.机场跑道、滑行道等道面损坏或灯光故障;
    2.机场活动区有异物;
    3.人、畜、车辆进入跑道或滑行道;
    4.机场责任范围内发生的鸟害;
    5.机场所属设施、设备(含通信、导航设备)故障;
    6.等待停机位或登机口分配; 
    7.机场原因导致飞机、保障车辆等待;
    8.候机区秩序;
    9.机场运行信息发布不及时;
    10.安检原因;
    11.机场通信、导航或监视设备校验造成保障能力下降;
    12.机场施工造成保障能力下降

    13.机场净空条件不良或跑道、滑行遭、停机坪构型不合理造成保障能力下降;
             14.机场或跑道宵禁造成保障能力下降;
             15.其它机场原因。

    (八) 联检原因

    1.因联检单位(边防、海关、检验检疫)原因未及时为旅客办理手续,造成旅客晚登机;
             2.其它联检原因。

    (九) 油料原因
    1.未按计划供油;
    2.油品质量不符合规定要求;
    3.加油设施设备故障;
    4.加油时损坏飞机;
    5.其它油料原因。

    (十) 离港系统原因
    1.离港系统故障,延误或不能办理旅客登机手续;
    2.其它离港系统原因。

    (十一)    旅客原因
    1.等待旅客;
    2.登机手续不符合规定;
    3.旅客突发疾病;
    4.旅客丢失登机牌,重新办理乘机手续;

    5.旅客登机后要求下机,重新进行客舱及行李舱安全检查;
    6.旅客拒绝登机、霸占飞机;
    7.其它旅客原因。

    (十二)    公共安全原因
    1.因举办大型活动或发生突发事件,造成保障能力下降或安检时间延长;
    2.航班遭到劫持、爆炸威胁;
    3.发生可能影响飞行安全的事件(如机场周边燃放烟花导致能见度下降,发现不明飞行物、气球、风筝,地震、海啸等自然灾害);
    4.公共卫生事件;
    5.其它公共安全原因。

     

    1.5 航班延误时间

    定义:反映航班延误程度的指标,航班延误时间等于实际离港时间晚于计划离港时间N(5)分钟之后的时间长度。航班延误时间以分钟为单位。

        计算公式:航班延误时间 = 实际离港时间 - (计划离港时间 + N(5)分钟)。

        当发生返航、备降等不正常情况,航班延误时间不作统计。

    航班平均延误时间:反映航班总体延误程度的指标,即计划航段班次总延误时间与计划航段班次之比。航班平均延误时间以分钟为单位。

        计算公式:航班平均延误时间=计划航段班次延误总时间/计划航段班次。

        备注:

    (1)航班延误总时间等于所有延误航班对应的延误时间之和,发生备降、返航的航班延误情况用“无延误时间”表示。

         (2)当日航班计划总数包括当日已执行航班和当日取消航班两部分。

    2  始发航班离港正常统计

       始发航班:同一注册号飞机,计划离港时间在当日06 : 00(含)以后,实际执行的第一段离港航班。

    2.1 始发航班离港正常架次

    定义:指统计期内离岗正常始发航班的架次。如始发航班在计划离港时间前后N(5)分钟之内撤轮挡,且按航班运行正向进程起飞,起飞前不发生滑回、中断起飞等特殊情况,则该始发航班离港正常。

    2.2 始发航班离港不正常架次

    定义:指统计期内离港不正常始发航班的架次。如有下列情况之一,则该始发航班判定为离港不正常。

        (1)不符合始发航班离港正常条件的航班;

        (2)未经批准,航空公司自行变更航班计划的航班。

    备注:始发航班离港正常仅考虑航班是否在规定的时间内离港,以及是否按航班运行正向进程起飞,如果在起飞后发生返航、备降等特殊情况,该航班仍判定为始发航班离港正常。

    2.3 始发航班离港正常率

    反映始发航班在离港机场运行效率的指标,即:始发航班离港正常架次与始发航班架次之比,用百分比表示。

    计算公式:始发航班离港正常率= 始发航班离港正常架次 / 始发航班架次。

    3  机场放行正常统计

    3.1 放行正常航班架次

    定义:指统计期内放行正常的航班架次。符合下列条件之一的航班即判定为放行正常航班。

        (1)航班在计划离港时间前后N(5)分钟之内撤轮挡,并且按航班运行正向进程起飞,起飞前不发生滑回、中断起飞等特殊情况,则该航班为放行正常航班。

        (2)当前段航班实际到港时间晚于计划到港时间,如在计划过站时间内完成服务保障工作并撤轮档,并且按航班运行正向进程起飞,不发生滑回、中断起飞等特殊情况,则该航班为放行正常航班。

    3.2 机场放行正常率

    反映机场保障能力的指标,即机场放行正常班次与机场放行总班次之比,用百分比表示。

    计算公式:机场放行正常率 = 放行正常班次/放行总班次。

    4  机场平均滑行时间统计

    4.1 航班滑行时间

    反映单个航段班次地面运行效率的指标,分为滑出时间和滑入时间。滑出时间指:从实际离港时间至实际起飞时间之间的时间长度;滑入时间指:从实际落地时间至实际到港时间之间的时间长度。航班滑行时间以分钟为单位。

        计算公式:

        滑出时间 = 实际起飞时间 -实际离港时间;

        滑入时间 = 实际到港时间 -实际落地时间。

    4.2 机场平均滑行时间

    反映机场航空器地面运行效率的指标,分为机场平均滑出时间和机场平均滑入时间。机场平均滑出时间是离港航班滑出总时间与离港航段班次之比;机场平均滑入时间是到港航班滑入总时间与到港航段班次之比。

        计算公式:

        机场平均滑出时间 = 离港航班滑出总时间/离港航段班次;

        机场平均滑入时间 = 到港航班滑入总时间/到港航段班次。

        备注:

        (1)离港航班滑出总时间等于所有离港航班滑出时间之和;到港航班滑入总时间等于所有到港航班滑入时间之和。

        (2)对发生滑回、中断起飞、备降、返航的航班在发生上述事件的机场不进行滑行时间统计。

     

    5  地面保障服务

    定义:指为使航班正常执行而进行的保障服务。服务的对象包括旅客和航空器。服务以时间、次数或工时为统计单位。下列为地面保障服务的具体项目:

    编号

    保障服务名称

    统计单位

    1

    客梯车服务

    时间

    2

    摆渡车服务(旅客&机组)

    次数

    3

    升降平台车服务

    时间

    4

    残疾人专用车服务

    次数

    5

    客舱清洁服务

    时间

    6

    飞机非例行检查服务

    工时

    7

    引导车服务

    次数

    8

    汽源车服务

    时间

    9

    电源车服务

    时间

    10

    牵引车服务

    次数

    11

    空调车服务

    时间

    12

    除冰车服务

    时间

    保障服务的时间:由服务的开始时间和结束时间计算的时间。

    保障服务的次数:指对服务对象进行服务的次数。

    保障服务的工时:指机务进行飞机勤务保障的工时。

    保障服务时间 = 服务结束时间 – 服务开始时间

    6  机型平均过站时间

    定义:按机型统计各机型的平均过站时间。

    过站时间定义:从航空器滑至停机位开启机门至航空器准备就绪关机门之间的时间。停场航班和过夜航班不作为统计对象。

    过站时间 = 关闭机门时间 –开启机门时间

    平均过站时间 = ∑各个航班过站时间/ 过站架次

    其中架次指航空器架次。一架飞机一进一出算一个架次。

    7  过夜飞机数量

    定义:按日期和代理统计过夜飞机数量。过夜飞机是指当天执行完航班任务不立即执行离港任务的、停留在某机场过夜的飞机。

    举例子:在白云机场,对过夜飞机的判断定义如下:

    1:晚上12点之前到,第二天早上走,算过夜飞机;

    2:第二天早上很早就到(五六点到)的国际航班,必须给它预留机位,算过夜飞机;

    3:早上两三点到,四五点走的经停航班,算过夜飞机;

    4:长期停场的飞机,算过夜飞机;

    展开全文
  • 2001-使用Hive+MR统计分析网站指标

    千次阅读 2015-11-25 11:02:54
    使用Hive+MR统计分析网站指标
  • 数据分析】数据指标

    千次阅读 2018-10-30 18:12:36
    目录 什么是好的数据指标? 找出正确的数据指标的五点方法 1、定性指标与量化指标 2、虚荣指标与可付诸行动的指标 ...数据科学家的思维方式(模式),10条创业者需要避免的数据圈套: 数据分析框...
  • 数据指标 | 网站数据分析体系

    千次阅读 2017-03-15 18:23:30
    网站访问分析(有时也使用“网站流量分析”、“网站流量统计分析”、“网站访问统计分析”等相近的概念),是指在获得网站流量统计基本数据的前提下,对有关数据进行统计、分析,从中发现用户访问网站的规律,并将...
  • K线图控件操作函数说明注册指标计算完成监听事件...对于一些简单指标统计计算是可以由客户端计算的,毕竟现在的手机性能已经和强大了。这章我们介绍如果从K线图中获取指标数据并进行统计 注册指标计算完成监听事件...
  • 数据分析】指标体系

    千次阅读 2019-08-12 01:54:46
    指标体系: 由一系列相互联系的指标组成的整体。 统计指标体系从其功能和作用可分为: 1. 描述统计指标体系:通常由对系统描述的基本指标组成。...2. 评价统计指标体系:对...定目标、分指标、找数据、搭体系。 ...
  • 移动App统计指标汇总

    千次阅读 2016-06-14 17:25:05
    这篇文章详细汇总介绍了移动App的统计指标
  • 数据质量指标

    千次阅读 2012-08-09 16:35:26
    数据本身的质量指标数据的质量特征并不依赖于这些数据是如何被使用的。这些质量特征是用来衡量数据本身的,和这些数据如何被使用,以及数据流下游的应用无关。 实际的质量指标-这些指标衡量数据是如何展现和使用...
  • 数据建模—指标体系

    万次阅读 2020-12-09 21:57:09
    指标 指标,实际上就是一种度量。大到用于监控和评估商业进程的状态,小到衡量某个功能模块的情况,或者是自己的活动效果。...全方位地提供了一套完整的电商行业数据指标体系,作为精细化运营的指导体系,
  • 小进阶:数据指标体系和数据治理的管理关于作者:小姬,某知名互联网公司产品专家,对数据采集、生产、加工有所了解,期望多和大家交流数据知识,以数据作为提出好问题的基础,发掘商...
  • python数据统计分析

    万次阅读 多人点赞 2019-02-17 09:08:25
      scipy包中的stats模块和statsmodels包是python常用的数据分析工具,scipy.stats以前有一个models子模块,后来被移除了。这个模块被重写并成为了现在独立的statsmodels包。  scipy的stats包含一些比较基本的工具...
  • 手把手教你建立数据指标体系

    千次阅读 2020-09-30 16:17:40
    数据分析工作中,咱们对于数据指标一定不陌生,而几乎所有数据分析工作都会提“建立数据指标体系”。但是同学们或许有一些现实的困惑:你说报表我就见过,我天天都在更新。... 01为啥需要数据指标 ...
  • 流式数据中的数学统计量计算

    千次阅读 2017-07-03 22:38:04
    为了充分利用这些数据,我们需要数据进行分析。在数据分析领域,很重要的一块内容是流式数据分析。流式数据,也即数据是实时到达的,无法一次性获得所有数据。通常情况下我们需要对其进行分批处理或者以滑动窗口的...
  • 数据分析-如何搭建业务指标体系

    千次阅读 2019-04-14 21:23:24
    没有指标对业务进行系统衡量,我们就无法把控业务发展,无法对业务质量进行衡量,尤其现在很多企业多项业务并行,单一数据指标衡量很可能片面化。因此,搭建系统的指标体系,才能全面衡量业务发展情况,促进业务有序...
  • 滴滴数据仓库指标体系建设实践

    千次阅读 2020-08-27 21:34:39
    桔妹导读:指标体系是什么?如何使用OSM模型和AARRR模型搭建指标体系?如何统一流程、规范化、工具化管理指标体系?本文会对建设的方法论结合滴滴数据指标体系建设实践进行解答分析。1.什...
  • 当然,原子指标还会基于维度、修饰词、统计口径而构建出派生指标指标的核心意义是它使得业务目标可描述、可度量、可拆解。 2)什么是好指标 好的数据指标是比较性的,可以是一个比率。因为比率的可操作性强、...
  • 数据指标体系搭建实践

    千次阅读 2020-03-25 11:55:00
    为什么要构建数据指标体系?因为我们希望时间能花在解决问题而不是寻找问题上。前言我们所需要的并不是数据,而是数据背后映射的洞察。在业务发展过程中,会产生大...
  • 阿里数据银行中的常见指标定义

    千次阅读 2019-11-01 11:31:46
    数据银行使用的比较多,其中很多的指标概念不是很了解,这里记录下,备忘 AIPL定义 A 认知 Aware 认知: 消费者相对被动与品牌接触。包括:曝光&点击: 15天内,被阿里妈妈广告曝光过或点击过阿里妈妈广告;或被...
  • 本文介绍企业里统计数据及其披露的业务现状,并梳理里部分过程,分享共同探讨规范化管理思路。
  • 游戏常用数据分析指标汇总

    千次阅读 多人点赞 2019-10-22 21:31:25
    乐元素移动游戏运营数据分析指标汇总 一、用户获取 1、mobile用户获取流程 点击-下载-安装-激活-注册-DNU 点击:点击广告页或者点击广告链接数 下载:点击后成功下载用户数 安装:下载程序并成功安装用户数 ...
  • 基于指标汇总层、集市层、可以提供面向业务人员的即席数据查询、以及面向应用开发者的数据接口、应用访问接口,满足不同类型应用的需要。 1、汇总指标层模型设计原则及步骤 1.1建设目标: 汇总指标层也叫中间层...
  • Prometheus 所有采集的监控数据均以指标(metric)的形式保存在内置的时间序列数据库当中(TSDB):属于同一指标名称,同一标签集合的、有时间戳标记的数据流。除了存储的时间序列,Prometheus 还可以根据查询请求...
  • 统计分析之为什么需要统计

    千次阅读 2018-07-22 08:44:01
    那么,为什么需要统计统计 看过三国演义应该知道,诸葛亮排兵布阵时经常这样说:关羽听令!给你三千精兵,从左路包抄曹军;张飞听令,给你五千精兵,从右路包抄曹军……由此可知,诸葛亮打仗,必...
  • 数据仓库之指标体系建设分享

    千次阅读 2020-08-28 00:10:35
    1 指标体系 2 为什么要搭建指标体系 3 如何搭建指标体系 4怎么管理指标体系 5 如何产品化指标体系 6 结束 7 参考文献
  • 一款项目的发布和使用,开发者均希望...小程序数据分析,是面向小程序开发者、运营者的数据分析工具,提供关键指标统计、实时访问监控、自定义分析等,帮助小程序产品迭代优化和运营。数据分析主要包括: (1)概...
  • 对于数据的分析维度也有太多选择,由于人力和系统的支持度问题,对于这些可能性的维度都进行数据分析显然并不现实,那么一个销售行业如何针对行业特点、选定维度分析数据呢就成了一个需要思考的问题。本文将

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 66,815
精华内容 26,726
关键字:

当前使用的指标需要统计数据