精华内容
下载资源
问答
  • 一文带你了解常见的数据指标都有哪些【数据分析
    万次阅读 多人点赞
    2021-10-04 23:01:32

    大家早上好,本人姓吴,如果觉得文章写得还行的话也可以叫我吴老师。欢迎大家跟我一起走进数据分析的世界,一起学习!

    感兴趣的朋友可以关注我或者我的数据分析专栏,里面有许多优质的文章跟大家分享哦。


    为了进一步提升自己分析业务的能力,首先得先了解好在日常业务分析当中往往会用到那些数据指标。

    接下来我给大家整理了常见的一些数据指标,建议收藏后慢慢阅读。

    用户获取

    渠道到达量

    这个俗称曝光量,如果在CSDN有发过博客的朋友应该知道“展现量”这个词,同理。

    这个指标其实是一个比较虚的数据,因为实际上我们每个人每天都会接收到许多的信息,但实际上真的吸引到我们的信息又有多少呢?但是这个值又往往跟我们的推广费(广告费)挂钩。因为推广的时候你很难量化广告对用户的影响程度,所以系统往往只能将用户的行为归因到最近一次的推广

    渠道转化率

    不同业务下指代有所不同,以CSDN为例子可以是点击量/展现量。

    渠道ROI

    ROI,即为投资回报比——利润/投资。
    当ROI大于1时,说明是赚钱的,反之则亏钱。

    除了收入外,ROI也可以用于其他指标,不一定非得是收入,也可以是注册用户量,即具体业务具体指代可以有所不同,但最终目标都是用于衡量是否盈利(亏还是不亏)

    日应用下载量

    想要使用产品之前需要我们下载好该产品,如果不注重该环节也极有可能会流失用户(如下载时间过长很多没耐心的用户会选择放弃、应用商店对产品的介绍很差或者不到位也有可能劝退用户)。

    日新增用户数

    新增用户数是用户获取的核心指标(对于新兴产品尤为重要)。

    这一指标也可以进一步细分,自然增长数和推广增长数。前者往往变化幅度不大,后者则是运营人员强控制下增长的,起伏明显。

    当然啦,具体业务分析时我们往往可以再进一步细分指标,如自然增长可以分为用户邀请、用户搜索,推广增长可以按渠道、活动进一步细分。

    用户获取成本

    这一指标对于新兴产品同样十分重要。

    这里想举个例子:拼多多作为近年来的新兴网购平台,有一个100元提现的活动,这个活动利用好友间分享(新用户砍的力度更大)来获取新客户,看似白给了100快钱,实际上却得到了无数新用户,比以前京东白条新用户还有无门槛的50元券免费送的活动还要简单粗暴。

    一次会话用户数

    指新用户下载完App,仅打开过产品一次,且该次使用时长在2分钟(通常是2分钟)以内。这类用户,很大可能是黑产或者机器人,

    这是产品推广的灰色地带,通过各种技术刷量,获取虚假的点击量谋取收益。该指标属于风控指标,用于监管。

    举例:B站邀好友赚红包,新用户需看几分钟的视频红包才更大。

    用户活跃

    活跃用户

    一般情况下,活跃标准为用户用过产品(浏览网页内容、下单购买等)。

    活跃指标是用户运营的基础,活跃率即为某段时间内活跃用户占总用户量的比例。这里的某段时间通常有按天、周或者月来定义。活跃用户数衡量的是该产品的市场体量,而活跃率则是看产品的健康程度。

    不过为了进一步查看产品的健康程度,应该在活跃指标的基础上在对用户进行细分,分成新用户、活跃用户、忠诚用户、不活跃用户、流失用户和回流用户等。这里的忠诚用户指的是长期活跃的用户,回流用户指的是某段时间不活跃或者流失但后面又重新使用该产品的用户。

    其中,健康的产品流失用户占比不应该过多,同时新增用户数应大于流失用户数。

    PV和UV

    PV和UV是相对比较老的概念了。

    PV,即为PageView,页面浏览量的意思。
    UV,即为Unique Visitor,名为独立访客数,是一定时间内访问网页的人数。在同一时间内,不管用户访问网页为多少,只算做一个独立访客(通过IP或者cookie判断)。

    这里需要注意到同一用户在一定时间内的cookie和IP也有可能发生变化,所以这一指标统计时可能出现误差,需要额外的方法来辅助判断。

    用户会话次数

    学过开发的朋友应该听过session,记录着用户在该时间窗口内的所有行为集合。如用户打开应用,接受消息,发送消息,最后退出,这样算作一次会话。

    至于时间窗口的长度则没有统一标准,网页端通常是30分钟,移动端通常是5分钟,但具体业务可能也有所不同。

    这里的指标往往回合活跃用户数结合来判断用户的粘性,假设日活跃用户数为120,日用户会话数为100,则说明大多数用户只访问了一次,产品粘性较低。

    用户会话依赖数据埋点采集,是用户行为分析的基础。

    用户访问时长

    一次会话持续的时间,不同业务下的访问时长也不一样,社交产品往往较长,当发现社交产品的用户访问时间只有几十秒时,就要分析一下原因了。

    功能使用率

    除了关注上述指标,我们进行分析时还应该关注产品上的各种功能的使用情况,如CSDN上的关注、点赞、评论收藏等,这些功能的使用也会反映出用户使用深度。比如说通过观察浏览用户中有多少用户点赞、有多少评论了等等,对博客内容的评估,对运营人员推流是否有所帮助。

    用户留存

    用户留存往往用于衡量产品的后续发展前景。

    留存率

    在之前的时间段使用过该产品后仍在使用的用户,称为留存用户。留存率即为留存用户/当初的总用户量。

    当该产品用户趋于饱和,新用户增长较少时,留存率是比新增用户数和活跃数更常用到的指标,因为此时运营的重点是要留住用户。

    这里的留存率其实还可以分为新增留存率和活跃留存率,前者重在新用户的引导,后者更注重产品本身的质量和运营的水平。

    用户流失率

    同留存率恰好相反,两者相加即为1。

    产品的流失率高往往代表着产品不健康,但具体的业务下对于流失率的高低衡量也不同,比如日常用品的流失率为50%和婚庆类产品的50%截然不同。

    退出率和跳出率

    退出率:某个时间段内,离开网页的次数占该网页总浏览次数的比例。
    退出率=退出次数/总访问量*100%。

    跳出率指用户通过搜索关键词来到你的网站,仅浏览了一个页面就离开的访问次数与所有访问次数的百分比。

    退出率从某方面反映了网站对于访客的吸引力,如果退出百分比很高,说明访客仅浏览少量的页面便离开了,因此当你的网站退出百分比很高的时候就要想办法改善你网站的内容来吸引访客了。
    跳出率常用于推广和运营活动的分析,两者容易混淆。

    跳出率高,说明很多新用户来了,看了一页就离开。(好像有种被骗的感觉)
    退出率低,说明新老用户来了都点击很多页才离开。(说明网站内容深受欢迎)

    市场营销

    用户生命周期

    指用户从开始接触产品,到最后彻底流失的过程。

    这里可以从两个方面来讲,一是针对用户的生存窗口,二是用户关系管理层面来讲。
    前者如十月怀胎,十月即为营销窗口,孕期前后都需要运营人员制定不同的营销重点,后者像上文讲到的活跃用户一样,将用户分为潜在用户、兴趣用户、新用户、老用户,流失用户。

    再拿十月怀胎举例,我们需要知道用户怀胎几月了,也要知道用户是否使用过我们的产品(是潜在用户还是流失用户)。

    用户生命周期价值

    CLV,即Customer Lifetime Value,CLV是对客户未来利润的有效预测,用来衡量一个用户在一段时期内对企业有多大价值。

    CLV模型在中小企业的具体运营中应用到的不多,更多是在做年度规划,年度财务核算,或者企业战略中会较为常见的使用,以站在企业的战略层面去考虑顾客价值与投入之间的关系。

    需要特别说明的是,CLV考虑了完整的客户生命周期,包含客户获取和客户流失,也就是它计算的不只是眼前顾客已经产生的价值,还预测了未来价值。

    CLV的计算公式有非常多,有的会非常复杂,主要在流失率这个环节和影响因素就相当多,也有会加上投入成本,价值变化率和利率变化等等。

    假如一个客户两年内在某商店内消费2000元,这2000元就是CLV,具有预测性。

    作用:

    • 根据客户价值对客户分类,尽量获取优质客户;
    • 根据客户价值,执行推广计划,评估市场效果;
    • 制定留存策略,留住优质客户;
    • 差异化定价,针对性促销;
    • 对客户细分,提供更加针对性的服务。

    用户忠诚指数

    客户忠诚度,又可称为客户粘度,是指客户对某一特定产品或服务产生了好感,形成了“依附性”偏好,进而重复购买的一种趋向。本质上是对活跃用户的进一步细分。

    计算方法有很多,计算时最好对数据进行收敛,且往往要考虑时间权重,越近的消费肯定权重越大。

    用户流失指数

    本质是对流失用户的进一步细分,在早期分析时,忠诚指数+流失指数 = 1。

    具体的定义需要按照实际的业务调整,有时候是按是否有点击(打开)产品,有时候是按是否有购买产品。

    当数据量足够时,可以利用回归模型会预估流失率。

    用户价值指数

    衡量从以前到当前用户贡献的价值(用户生命周期价值还包括未来)。

    用户价值指数的主流计算方式有两种,一种是RMF模型,利用R最近一次消费时间,M总消费金额,F消费频次,将用户划分成多个群体。不同群体即代表了不同的价值指数。

    第二种是主成分分析PCA,把多个指标转化为少数几个综合指标(即主成分),其中每个主成分都能够反映原始变量的大部分信息,且所含信息互不重复。

    比方说现在要评估CSDN博主的质量,是不是得考量他的粉丝数、点赞数、评论数、更新频率、博客总数等,利用PCA将其交工为两三个指标,再加工成价值指数就容易多了。

    运营时我们往往会同时参考多个指标,比方同时 考量用户流失指数和用户价值指数,对于高流失高价值的用户我们应该及时制定策略唤回,对于高流失低价值的用户,可以权衡后选择放弃。

    结束语

    博主能力有限,上述数据指标的定义我大多参考了百度百科,再结合自己的理解,希望大家看完后也能结合自己的理解,且如上文有所出错,恳请指正,一起进步!


    推荐关注的专栏

    👨‍👩‍👦‍👦 机器学习:分享机器学习实战项目和常用模型讲解
    👨‍👩‍👦‍👦 数据分析:分享数据分析实战项目和常用技能整理


    关注我,了解更多相关知识!


    CSDN@报告,今天也有好好学习

    更多相关内容
  • :博主是正在学习数据分析的一员,博客记录的是在学习过程中一些总结,也希望和大家一起进步,在记录之时,未免存在很多疏漏和全,如有问题,还请私聊博主指正。 博客地址:天阑之蓝的博客,学习过程中不免有困难...

    阅读之前看这里👉:博主是正在学习数据分析的一员,博客记录的是在学习过程中一些总结,也希望和大家一起进步,在记录之时,未免存在很多疏漏和不全,如有问题,还请私聊博主指正。
    博客地址:天阑之蓝的博客,学习过程中不免有困难和迷茫,希望大家都能在这学习的过程中肯定自己,超越自己,最终创造自己。

    博主之前关于产品和数据的的文章:

    数据分析师之所需要了解的产品系列知识(一)——产品的演化周期
    数据分析师之所需要了解的产品系列知识(二)——如何测试产品健康
    数据分析师之所需要了解的产品系列知识(三)——定义产品成功:指标和目标
    数据分析师之所需要了解的产品系列知识(四)——如何提高用户留存率

    我们在数据分析师之所需要了解的产品系列知识(三)——定义产品成功:指标和目标一文中,讲了如何去定义成功的指标。
    接下来我们将真正的进行去实践分析,学以致用,去了解和学习互联网数据指标体系的搭建,并应用在一些具体案例分析上面。

    一、为什么要搭建指标体系

    对于互联网产品数据分析师来说,搭建指标体系可以很好的梳理业务关系,提高问题分析效率。
    我认为指标体系的主要目的有:

    • 确立关键指标(北极星指标),统一各团队的努力方向;
    • 搭建产品数据监控指标看板,方便综合分析各项指标,及时发现业务问题;
    • 成熟的指标体系可以高效地为各部门各团队提供数据支持。

    只有明确好指标和目标后,我们才能够对产品规划可执行的策略和路线图。也就是搭建好指标体系是在团队工作和产品开展的一个前提,当然一开始可能指标并不多,需要随着产品的迭代不断去改变指标。

    二、如何搭建指标体系

    1.选择关键指标(OMTM)

    关键指标是衡量商业价值,哪一个或者几个指标最能反映产品创造的价值。
    在这里插入图片描述

    《精益数据分析》对第一关键指标这样阐述:

    在任何指定的时间里,都有那么一个指标,值得你惯性它胜过一切。
    在数据分析的世界里,专注意味着挑选一个唯一的指标,该指标对你当前所处的创业阶段无比重要,称之为OMTM(One Metric That Matters,第一关键指标)。

    第一关键指标,就是一个在当前阶段高于一切,需要你集中全部注意力的数字。在问题验证阶段关心客户终生价值并没有什么意义,但当你接近产品与市场契合的时候,它可能就是你的专注点。

    一个“重要的指标”是统一的,并将使你能够为整个组织设置优先级。尽管跟踪所有内容并选择多个指标可能很诱人,但这并不明智。许多指标相互关联。它们可能有助于提高收入指标,但如果单独衡量,可能会变得无关紧要和分散注意力。你拥有的指标越多,权衡所有目标并权衡这些目标就越复杂。把事情简单化。

    使用第一关键指标的四大理由:

    1. 它回答了现阶段最重要的问题。
    2. 它促使你得出初始基线并建立清晰的目标。
    3. 它关注的是整个产品(公司)层面的健康。
    4. 它鼓励一种实验文化

    对于社交类产品来说,DAU很关键,因为产品核心是人们通过这款产品沟通交流;
    但对于求职类产品,关键指标应该是活跃有效简历数和发布职位公司数,只有求职者和机会数量可观的情况下,才更加有可能在平台解决大家的职业发展问题;
    对于电商类产品GMV很重要,意味着在平台成交的金额大小;
    对于视频类产品,目的是为了帮助用户杀时间,那么关键指标是观看时长

    2.从AARRR模型出发搭建产品基本指标体系

    AARRR是Acquisition、Activation、Retention、Revenue、Refer这个五个单词的缩写,分别对应用户生命周期中的5个重要环节。

    A拉新:通过各种推广渠道,以各种方式获取目标用户,并对各种营销渠道的效果评估,不断优化投入策略,降低获客成本。利用这个模块可以很好帮助市场推广部门比较各个渠道的拉新效果,评估新用户的用户质量。
    A活跃:活跃用户指真正开始使用了产品提供的价值,我们需要掌握用户的行为数据,监控产品健康程度。这个模块主要反映用户进入产品的行为表现,是产品体验的核心所在。
    R留存:衡量用户粘性和质量的指标。
    R转化(营收):主要用来衡量产品商业价值。
    R传播:衡量用户自传播程度和口碑情况。

    这五个指标并不一定遵循严格的先后顺序,不过这五个指标确实是一个不错的框架。

    要素功用相关指标
    获取用户通过各种各样的手段博取眼球,无论是免费还是付费的方式流量、提及量、每次点击费用(CPC) 、搜索结果、用户获取成本、点开率
    提高活跃度将获取的“过客”转化为产品的真正参与者注册人数、注册量、新手教程完成量、至少用过一次产品的人数、订阅量
    提高留存率说服用户再次光临、反复使用、表现出黏性行为用户参与度、距上次登录的时间、日/月活跃使用量、流失率
    获取营收商业活动的产出(不同的商业模式看重不同的产出,如购买量、广告点击量、内容产生量、订阅量)客户终生价值、(免费到付费)转化率、平均购物车大小、广告点击收入
    自传播已有用户对潜在用户的病毒式传播及口碑传播邀请发送量、病毒式传播、病毒传播周期

    在这里插入图片描述
    以上图片基于AARRR模型梳理了相关重要指标,当然,对于不同产品,还会有更多基于个性化功能的指标,这里就不做延展。

    整合各模块指标可以得出用户每个步骤的健康程度,再通过时间维度(环比同比)、空间维度(各个渠道对比、各个地域)交叉对比,可以初步发现数据异常点所在,然后就需要分析师针对异常指标深入分析原因,找出解决办法。

    3.基于业务流方法的指标体系搭建(可结合AARRR模型)

    我们不仅要会从AARRR这个经典模型去搭建指标体系,我们更需要会基于业务流方法的指标体系搭建,俗话说,不懂业务的数据分析师不是一个好的分析师。
    业务流指标体系主要包括两个方面:维度和指标
    在这里插入图片描述

    在分析的时候,进行多个维度的拆解,在不同的维度对应不同的指标。
    如下图,我们可以从整体、内容、渠道、产品、用户等多个业务流维度对进行不同指标的搭建。
    在这里插入图片描述

    4.产品的功能模块指标监控体系

    对于一个产品,首先需要梳理出各功能模块有哪些,可以建立产品功能矩阵,对各功能的定位和表现有个大概认知。
    在这里插入图片描述
    上图即产品功能矩阵,横轴是功能留存率,表示当前功能的用户粘性;纵轴是活跃用户占比,表示某周期使用当前功能的用户量/该周期的产品活跃用户量。做出这个矩阵后,我们就可以看到不同的功能在矩阵中的位置分布(注:原点可以选择:各产品留存率、活跃用户占比均值)。

    • 大众功能(曝光量大,使用率高)需要了解用户的使用流程,对可优化的点进行优化,不断简化升级。
    • 核心功能(用户使用率低,功能留存率比大众功能要高)我们在核心功能中应该寻找是否存在高价值需求,我们可以推广这个需求的使用率来提升用户留存,探索增长突破口,不断完善扩充。
    • 小众功能(功能留存适中但用户使用率低)可以寻找可能有潜力的模块优化,不断筛选优化。
    • 其他功能(使用率低,留存率也低)对于不常用的功能模块适当摒弃,对于有必要保留的功能模块分析问题所在,或者简化操作流程,不断迭代更新。

    建立完功能矩阵后,针对核心功能和大众小众功能,都需要分别搭建监控体系,步骤如下:

    1. 确认产品功能核心目标,可以和产品经理确认功能目的。
    2. 梳理功能使用路径,可以通过看产品的RPD文档,或者自己体验得到。
    3. 监测指标确认,根据使用路径,整理出每一步骤的表现指标,目的是希望用户可以完成我们设想的任务,如果产品功能有做出调整,也可以用来评估前后效果。

    三、实例—抖音的数据指标体系搭建

    1.关键指标

    抖音作为头部短视频APP之一,产品核心在于:

    • 对于内容互动者,满足了日常打发零碎时间,寻求新鲜潮流事物的需求;
    • 对于内容生成者,满足了较强的表现和模仿欲,记录美好生活的需求,给明星/KOL提供了一个塑造个人品牌、积累粉丝的平台;
    • 对于公司,则依靠流量变现,包括信息流广告、贴片广告、用户付费(购买、打赏)。

    基于抖音产品核心,我选取了以下几个指标作为关键指标:新增用户数、DAU、日均时长、留存率、收入(较为敏感,需要额外考虑)

    • 新增用户数:因为老用户必然会随时间不同程度地流失,想要产品流量维持在一定水平甚至有上升,那么新用户流入是必然需要的;
    • DAU我认为是首要指标,是最能体现当下抖音产品商业价值-流量的指标
    • 日均时长:时长较长意味着用户更加依赖产品,粘性也会越来越强,是一个很好的过程监控指标。下降的话,就要思考是内容数量不足导致?内容质量吸引不了用户?产品交互体验较差?抑或是KOL平台转移;
    • 留存率:用户存留的时间越长,产生的价值也就越大。提高用户的存留时间,也是提高公司收入,为公司创造更多价值的重要一环;
    • 收入:对于抖音这样一个相对成熟,有稳定盈利收入的产品,收入可以衡量产品后链路的健康程度,若某一收入来源下降了,则需要找出问题所在,从产品或者策略上做出调整(注:因此项数据较为敏感,需要考虑是否展示)。

    依照以上关键指标,我利用tableau制作了一个简单的仪表盘(注:以下数据均为虚构)。
    在这里插入图片描述

    2. 基于AARRR模型的抖音基本指标体系

    抖音APP实质上还是属于一个免费的移动短视频应用,针对抖音获取新用户这方面,我们需要关注的指标主要还是从下载量(分渠道),客户获取成本,新用户注册等
    在这里插入图片描述

    如果监控用户活跃,我们需要监控DAU等常用指标,也需要关注用户观看视频时长,app使用时长和频率。
    在这里插入图片描述
    在用户留存方面,我们最需要关注的是留存率和流失率。

    关于用户留存指标的详细内容可以参考我的另一篇博文:
    数据分析师之所需要了解的产品系列知识(二)——如何测试产品健康“健康的产品需要满足哪些指标”
    在这里插入图片描述
    关于用户自传播,作为视频软件,用户分享是非常关键的,能够提高用户数和广告价值。
    在这里插入图片描述
    用户营收是很重要的,最终一个产品的成功不仅仅是看用户使用,要把这些转化为营收才是目的。
    在这里插入图片描述

    3.基于业务流的抖音基本指标体系

    由于主要的指标我们已经确定:新增用户数、DAU、日均时长、留存率、收入
    所以结合各个业务流对这些指标进行细分和拆解组合等。

    由于新增用户、DAU、使用时长等,我们均可把它们划分到用户维度。

    • 下面是基于用户维度的指标搭建

    在这里插入图片描述
    渠道维度的数据,我们在进行运营和推广的时候,渠道是其关键,掌握好各个渠道的数据,方便我们更好的决策。

    • 下面是基于渠道维度的指标搭建

    在这里插入图片描述

    • 产品维度:分析产品核心功能,以便做出调整。

    在这里插入图片描述

    当然我们还可以从其它业务的维度去思考构建各个指标,每种指标体系都有其优点和局限,有时候并不能一一考虑到,我们最重要的是关注几个核心指标,无论是从哪个模式去分析,核心指标的监控必不可少。

    4.抖音功能指标监控体系

    梳理了抖音功能结构图如下:
    在这里插入图片描述
    抖音的功能很多,在这里拿“搜索”功能举例,搭建功能指标体系。

    首先,确认搜索功能的核心目标:用户能够通过搜索找到感兴趣的短视频,并成功观看。

    然后,梳理功能使用路径:
    在这里插入图片描述
    最后,梳理指标:
    在这里插入图片描述

    四、总结

    综上,产品的指标体系搭建主要包括三个步骤:

    • 关键指标的选取;
    • 基于AARRR模型搭建产品基本指标体系;
    • 基于业务流的指标体系搭建,可与AARRR模型相互结合;
    • 完善产品各功能的指标体系。

    随着产品业务的发展和各功能板块的调整更新,衡量指标会发生变化,所以需要针对产品变化及时对指标做出调整。

    另外,不同的业务部门的关注方向不同,同样产品同样功能的指标体系侧重点,也需要根据数据看板的使用方的角色不同而不同。

    参考:
    [1] 人人都是产品经理:以「抖音」为例,分析互联网数据指标体系的搭建
    [2] 《精益数据分析》

    博主码字不易,请大家关注点个赞再走呗 ^ - ^
    在这里插入图片描述

    展开全文
  • 让我们通过MindMater思维导图来进行一个详细的解读吧,来具体看一下电商数据分析基本指标体系到底有哪些,它们之间又有何关系吧。 电商数据分析基本指标体系一共有八个。分别为总体运营指标、网站流量指标、销售转化...

    随着时代的发展,越来越多的人参与到电商之中。电商即电子商务,是依托现代信息网络技术,以商品交换为中心的新型商务贸易活动。电商可并不简单,做好电商又有哪些关键呢?别急,再此之前,需要先了解电商数据分析基本指标体系。让我们通过MindMater思维导图来进行一个详细的解读吧,来具体看一下电商数据分析基本指标体系到底有哪些,它们之间又有何关系吧。
    电商数据分析基本指标体系一共有八个。分别为总体运营指标、网站流量指标、销售转化指标、客户价值指标、商品类指标、市场营销活动指标、风控指标以及市场竞争指标。

    总体运营指标

    总体运营指标包括流量类指标、订单生产效率指标、总体销售业绩指标以及整体指标。流量类指标:独立访问客数(UV),浏览量(PV),人均浏览量。人均浏览量即浏览量/独立访问客数,这个指标反映了访问粘性。订单产生效率指标包括总订单数量,访问到下单转化率。访问到下单转化率是电商网站下单的订单总数。总体销售业绩指标有下单金额(GMV)、支付金额、客单价。整体指标为销售毛利及毛利率。毛利率是销售毛利/销售收入,可用来衡量电商盈利能力。

    网站流量指标

    网站流量指标包括流量规模类指标、流量成本类指标、流量质量类指标、会员类指标。流量规模类指标:访客数(UA)、浏览量(PV)。流量成本类指标为访客获取成本,即付费金额/付费带来的流量。流量质量类指标包括跳失率、平均停留时长、人均浏览量。会员类指标有有七个,分别为注册会员数、活跃会员数、活跃会员率、会员复购率、会员平均购买次数、会员回购率、会员留存率。

    销售转化指标

    此指标包括购物车类指标、下单类指标、支付类指标、交易类指标。购物车类指标与加购人数、加购件数、访客-加购转化率、加购-支付转化率有关。下单类指标包括下单件数、下单金额、下单买家数、下单转化率。支付类指标有六个,前三个为基础类统计,后三个为转化类统计:支付金额、支付买家数、支付件数、浏览-支付转化率、下单-支付金额转化率及下单-支付时长。支付子单数、支付金额、支付买家数、支付件数、交易失败订单数、建议失败订单金额、交易失败订单买家数、交易失败商品数、退款总订单量、退款金额及退款率则会影响交易类指标。

    客户价值指标

    客户价值指标有三种:客户指标、新客户指标、老客户指标。客户指标受支付买家数和客单价影响。新客户指标受支付新买家数、新客户获取成本及新客户单价影响。老客户指标受消费频率、最近一次购买时间、消费金额、重复购买次数及复购率影响。复购率越高,消费者对品牌的忠诚度越高。可按在一定时期内下单次数在两次或以上的客户数与总的下单客户数之比或按重复购买交易次数与总交易次数之比来统计重复购买率。

    商品类指标

    产品总数指标、产品优劣性指标、品牌存量、上架、首发这五个指标即为商品类指标。产品总数指标受SKU数、SPU数及在线SPU数影响。产品优劣性指标受独家产品收入比重、动销率及二八原则分布影响。品牌数和在线品牌数影响品牌存量。影响上架的有五个因素:上架商品SKU数、上架商品SPU数、上架在线SPU数、上架商品数及上架在线商品数。影响首发的是首次上架商品数和首次上架在线商品数。

    市场营销活动指标

    此类指标有两种:一是市场营销活动指标,包括新增访问人数、新增注册人数、总访问人数、订单数量、下单转化率及ROI(投资回报率);另一是广告投放指标,包括新增访问,人数、新增注册人数、总访问次数、订单数量、UV订单转化率、广告投资回报率。

    风控指标

    风控指标亦是有两个:一个是买家评价指标,此项受买家评价数、买家评价卖家数、买家评价上传图片数、买家评价率、买家好评率和买家差评率这六个因素影响;另一个是投诉类指标,受发起投诉(申诉)数、投诉数及撤销投诉(申诉)数三个因素影响。

    市场竞争指标

    市场竞争指标与市场份额和网站排名相关。市场占有率、市场扩大率及用户份额可影响市场份额。交易额排名及流量排名可对网站排名造成影响。

    数据分析基本指标是一个业务发展的风向标。正确运用指标体系可以及时准确地监控业务的现状及解决出现的问题,并对未来的发展方向提供引导作用。电商数据分析基本指标还有很多,不同时期,不同要求,不同场景,不同商品,需要用到的指标是不一样的。建议可用亿图图示建图表,方便快捷,简单明了。

    在MindMaster导图社区有更多的优秀导图模板,MindMaster半个月的免费VIP会员、长期会员九折兑换码及使用方法请点这里

    展开全文
  • 数据分析常用的100个指标和术语

    万次阅读 多人点赞 2019-09-05 18:31:47
    3、数据分析名词解释 一、互联网常用名词解释 1、PV(Page View)页面浏览量 指某段时间内访问网站或某一页面的用户的总数量。通常用来衡量一篇文章或一次活动带来的流量效果,也是评价网站日常流量数据的重要...

    本文按照以下三类进行汇总。

    1、互联网常用名词解释

    2、统计学名词解释

    3、数据分析名词解释

    一、互联网常用名词解释

    1、PV(Page View)页面浏览量

    指某段时间内访问网站或某一页面的用户的总数量。通常用来衡量一篇文章或一次活动带来的流量效果,也是评价网站日常流量数据的重要指标。PV可重复累计,以用户访问网站作为统计依据,用户每刷新一次即重新计算一次。

    2、UV(Unique Visitor)独立访客

    指来到网站或页面的用户总数。这个用户是独立的,同一用户不同时段访问网站只算作一个独立访客,不会重复累计,通常以PC端的Cookie数量作为统计依据。

    3、Visit 访问

    指用户通过外部链接来到网站,从用户来到网站到用户在浏览器中关闭页面,这一过程算作一次访问。

    Visit可重复累计,比如我打开一个网站又关闭,再重新打开,这就算作两次访问。

    4、Home Page 主页

    指一个网站起主目录功能的页面,也是网站起点。通常是网站首页。

    5、Landing Page 着陆页

    指用户从外部链接来到网站,直接跳转到的第一个页面。比如朋友给我发了一个介绍爆款T恤的淘宝链接,我点开会直接跳转到淘宝T恤的那个页面,而不是淘宝网众多其他页面之一,这个介绍T恤的页面可以算作是着陆页。

    6、Bounce Rate 跳出率

    指用户通过链接来到网站,在当前页面没有任何交互就离开网站的行为,这就算作此页面增加了一个“跳出”,跳出率一般针对网站的某个页面而言。

    跳出率=在这个页面跳出的用户数/PV

    7、退出率

    一般针对某个页面而言。指用户访问某网站的某个页面之后,从浏览器中将与此网站相关的所有页面全部关闭,就算此页面增加了一个“退出“。

    退出率=在这个页面退出的用户数/PV

    8、Click 点击

    一般针对付费广告而言,指用户点击某个链接、页面、banner的次数,可重复累计。比如我在PC端看到一则新闻链接点进去看了一会就关了,过了一会又点进去看了一遍,这就算我为这篇新闻贡献两次点击。

    9、avr.time 平均停留时长

    指某个页面被用户访问,在页面停留时长的平均值,通常用来衡量一个页面内容的质量。

    avr.time=用户总停留时长 / 访客数量

    10、CTR (Click-Through-Rate)点击率

    指某个广告、Banner、URL被点击的次数和被浏览的总次数的比值。一般用来考核广告投放的引流效果。

    CTR=点击数(click)/被用户看到的次数

    11、Conversion rate 转化率

    指用户完成设定的转化环节的次数和总会话人数的百分比,通常用来评价一个转化环节的好坏,如果转化率较低则急需优化该转化环节。

    转化率=转化会话数/总会话数

    12、漏斗

    通常指产生目标转化前的明确流程,比如在淘宝购物,从点击商品链接到查看详情页,再到查看顾客评价、领取商家优惠券,再到填写地址、付款,每个环节都有可能流失用户,这就要求商家必须做好每一个转化环节,漏斗是评价转化环节优劣的指标。

    13、ROI(Return On Investment )投资回报率

    反映投入和产出的关系,衡量我这个投资值不值得,能给到我多少价值的东西(非单单的利润),这个是站在投资的角度或长远生意上看的。通常用于评估企业对于某项活动的价值,ROI高表示该项目价值高。

    投资回报率(ROI)= 年利润或年均利润/投资总额×100%。

    14、重复购买率

    指消费者在网站中的重复购买次数。

    15、Referrer 引荐流量

    通常指将用户引导至目标页面的URL(超链接)。在百度统计中,引荐流量叫做“外部链接”。

    16、流失分析(Churn Analysis/Attrition Analysis)

    描述哪些顾客可能停止使用公司的产品/业务,以及识别哪些顾客的流失会带来最大损失。流失分析的结果用于为可能要流失的顾客准备新的优惠。

    17、顾客细分&用户画像(Customer Segmentation & Profiling)

    根据现有的顾客数据,将特征、行为相似的顾客归类分组。描述和比较各组。

    18、顾客的生命周期价值 (Lifetime Value, LTV)

    顾客在他/她的一生中为一个公司产生的预期折算利润。

    19、购物篮分析(Market Basket Analysis)

    识别在交易中经常同时出现的商品组合或服务组合,例如经常被一起购买的产品。此类分析的结果被用于推荐附加商品,为陈列商品的决策提供依据等。

    20、实时决策(Real Time Decisioning, RTD)

    帮助企业做出实时(近乎无延迟)的最优销售/营销决策。比如,实时决策系统(打分系统)可以通过多种商业规则或模型,在顾客与公司互动的瞬间,对顾客进行评分和排名。

    21、留存/顾客留存(Retention / Customer Retention)

    指建立后能够长期维持的客户关系的百分比。

    22、社交网络分析(Social Network Analysis, SNA)

    描绘并测量人与人、组与组、机构与机构、电脑与电脑、URL与URL、以及其他种类相连的信息/知识实体之间的关系与流动。这些人或组是网络中的节点,而它们之间的连线表示关系或流动。SNA为分析人际关系提供了一种方法,既是数学的又是视觉的。

    23、生存分析(Survival Analysis)

    估测一名顾客继续使用某业务的时间,或在后续时段流失的可能性。此类信息能让企业判断所要预测时段的顾客留存,并引入合适的忠诚度政策。

     

    二、统计学名词解释

    1、绝对数和相对数

    绝对数:是反应客观现象总体在一定时间、一定地点下的总规模、总水平的综合性指标,也是数据分析中常用的指标。比如年GDP,总人口等等。

    相对数:是指两个有联系的指标计算而得出的数值,它是反应客观现象之间的数量联系紧密程度的综合指标。相对数一般以倍数、百分数等表示。相对数的计算公式:

    相对数=比较值(比数)/基础值(基数)

    2、百分比和百分点

    百分比:是相对数中的一种,他表示一个数是另一个数的百分之几,也成为百分率或百分数。百分比的分母是100,也就是用1%作为度量单位,因此便于比较。

    百分点:是指不同时期以百分数的形式表示的相对指标的变动幅度,1%等于1个百分点。

    3、频数和频率

    频数:一个数据在整体中出现的次数。

    频率:某一事件发生的次数与总的事件数之比。频率通常用比例或百分数表示。

    4、比例与比率

    比例:是指在总体中各数据占总体的比重,通常反映总体的构成和比例,即部分与整体之间的关系。

    比率:是样本(或总体)中各不同类别数据之间的比值,由于比率不是部分与整体之间的对比关系,因而比值可能大于1。

    5、倍数和番数

    倍数:用一个数据除以另一个数据获得,倍数一般用来表示上升、增长幅度,一般不表示减少幅度。

    番数:指原来数量的2的n次方。

    6、同比和环比

    同比:指的是与历史同时期的数据相比较而获得的比值,反应事物发展的相对性。

    环比:指与上一个统计时期的值进行对比获得的值,主要反映事物的逐期发展的情况。

    7、变量

    变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概念。变量可以通过变量名访问。

    8、连续变量

    在统计学中,变量按变量值是否连续可分为连续变量与离散变量两种。在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。如:年龄、体重等变量。

    9、离散变量

    离散变量的各变量值之间都是以整数断开的,如人数、工厂数、机器台数等,都只能按整数计算。离散变量的数值只能用计数的方法取得。

    10、定性变量

    又名分类变量,观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表达其类别,这样的观测数据称为定性变量。可以理解成可以分类别的变量,如学历、性别、婚否等。

    11、均值

    即平均值,平均数是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数。

    12、中位数

    对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。

    13、缺失值

    它指的是现有数据集中某个或某些属性的值是不完全的。

    14、缺失率

    某属性的缺失率=数据集中某属性的缺失值个数/数据集总行数。

    15、异常值

    指一组测定值中与平均值的偏差超过两倍标准差的测定值,与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。

    16、方差

    是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。方差是衡量源数据和期望值相差的度量值。

    17、标准差

    中文环境中又常称均方差,是离均差平方的算术平均数的平方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。

    18、相关系数

    相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母r表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔森相关系数。

    19、皮尔森相关系数

    皮尔森相关系数是用来反映两个变量线性相关程度的统计量。相关系数用r表示,其中n为样本量,分别为两个变量的观测值和均值。r描述的是两个变量间线性相关强弱的程度。r的绝对值越大表明相关性越强。

    20、特征值

    特征值是线性代数中的一个重要概念。在数学、物理学、化学、计算机等领域有着广泛的应用。设A是向量空间的一个线性变换,如果空间中某一非零向量通过A变换后所得到的向量和X仅差一个常数因子,即AX=kX,则称k为A的特征值,X称为A的属于特征值k的特征向量或特征矢量。

     

     

    三、数据分析名词解释

    A

    聚合(Aggregation):搜索、合并、显示数据的过程。

    算法(Algorithms):可以完成某种数据分析的数学公式。

    分析法(Analytics):用于发现数据的内在涵义。

    异常检测(Anomaly detection):在数据集中搜索与预期模式或行为不匹配的数据项。除了“Anomalies”,用来表示异常的词有以下几种:outliers,exceptions,surprises,contaminants.他们通常可提供关键的可执行信息。

    匿名化(Anonymization):使数据匿名,即移除所有与个人隐私相关的数据。

    分析型客户关系管理(Analytical CRM/aCRM):用于支持决策,改善公司跟顾客的互动或提高互动的价值。针对有关顾客的知识,和如何与顾客有效接触的知识,进行收集、分析、应用。

     

    B

    行为分析法(Behavioural Analytics):这种分析法是根据用户的行为如“怎么做”,“为什么这么做”,以及“做了什么”来得出结论,而不是仅仅针对人物和时间的一门分析学科,它着眼于数据中的人性化模式。

    批量处理(Batch processing):尽管从大型计算机时代开始,批量处理就已经出现了。由于处理大型数据集,批量处理对大数据具有额外的意义。批量数据处理是处理一段时间内收集的大量数据的有效方式。

    商业智能(Business Intelligence): 分析数据、展示信息以帮助企业的执行者、管理层、其他人员进行更有根据的商业决策的应用、设施、工具、过程。

     

    C

     

    分类分析(Classification analysis):从数据中获得重要的相关性信息的系统化过程;这类数据也被称为元数据(meta data),是描述数据的数据。

    云计算(Cloud computing):构建在网络上的分布式计算系统,数据是存储于机房外的(即云端)。

    集群计算(Cluster computing):这是一个使用多个服务器集合资源的“集群”的计算术语。要想更技术性的话,就会涉及到节点,集群管理层,负载平衡和并行处理等概念。

    聚类分析(Clustering analysis):它是将相似的对象聚合在一起,每类相似的对象组合成一个聚类(也叫作簇)的过程。这种分析方法的目的在于分析数据间的差异和相似性。

    冷数据存储(Cold data storage):在低功耗服务器上存储那些几乎不被使用的旧数据。但这些数据检索起来将会很耗时。

    对比分析(Comparative analysis):在非常大的数据集中进行模式匹配时,进行一步步的对比和计算过程得到分析结果。

    相关性分析(Correlation analysis):是一种数据分析方法,用于分析变量之间是否存在正相关,或者负相关。

     

    D

     

    仪表板(Dashboard):使用算法分析数据,并将结果用图表方式显示于仪表板中。

    数据聚合工具(Data aggregation tools):将分散于众多数据源的数据转化成一个全新数据源的过程。

    数据分析师(Data analyst):从事数据分析、建模、清理、处理的专业人员。

    数据库(Database):一个以某种特定的技术来存储数据集合的仓库。

    数据湖(Data lake):数据湖是原始格式的企业级数据的大型存储库。与此同时我们可以涉及数据仓库,它在概念上是相似的,也是企业级数据的存储库,但在清理、与其他来源集成之后是以结构化格式。数据仓库通常用于常规数据(但不是专有的)。数据湖使得访问企业级数据更加容易,你需要明确你要寻找什么,以及如何处理它并明智地试用它。

    暗数据(Dark Data):基本上指的是,由企业收集和处理的,但并不用于任何意义性目的的数据,因此它是“暗”的,可能永远不会被分析。它可以是社交网络反馈,呼叫中心日志,会议笔记等等。有很多人估计,所有企业数据中的 60-90% 可能是“暗数据”,但谁又真正知道呢?

    数据挖掘(Data mining):数据挖掘是通过使用复杂的模式识别技术,从而找到有意义的模式,并得出大量数据的见解。

    数据中心(Data centre):一个实体地点,放置了用来存储数据的服务器。

    数据清洗(Data cleansing):对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。

    数据质量(Data Quality):有关确保数据可靠性和实用价值的过程和技术。高质量的数据应该忠实体现其背后的事务进程,并能满足在运营、决策、规划中的预期用途。

    数据订阅(Data feed):一种数据流,例如Twitter订阅和RSS。

    数据集市(Data Mart):进行数据集买卖的在线交易场所。

    数据建模(Data modelling):使用数据建模技术来分析数据对象,以此洞悉数据的内在涵义。

    数据集(Data set):大量数据的集合。

    数据虚拟化(Data virtualization):数据整合的过程,以此获得更多的数据信息,这个过程通常会引入其他技术,例如数据库,应用程序,文件系统,网页技术,大数据技术等等。

    判别分析(Discriminant analysis):将数据分类,按不同的分类方式,可将数据分配到不同的群组,类别或者目录。是一种统计分析法,可以对数据中某些群组或集群的已知信息进行分析,并从中获取分类规则。

    分布式文件系统(Distributed File System):提供简化的,高可用的方式来存储、分析、处理数据的系统。

    文件存贮数据库(Document Store Databases):又称为文档数据库,为存储、管理、恢复文档数据而专门设计的数据库,这类文档数据也称为半结构化数据。

     

    E

     

    探索性分析(Exploratory analysis):在没有标准的流程或方法的情况下从数据中发掘模式。是一种发掘数据和数据集主要特性的一种方法。

    提取-转换-加载(ETL:Extract,Transform and Load):是一种用于数据库或者数据仓库的处理过程,天善学院有国内唯一的最全的ETL学习课程。即从各种不同的数据源提取(E)数据,并转换(T)成能满足业务需要的数据,最后将其加载(L)到数据库。

     

    G

     

    游戏化(Gamification):在其他非游戏领域中运用游戏的思维和机制,这种方法可以以一种十分友好的方式进行数据的创建和侦测,非常有效。

    图形数据库(Graph Databases):运用图形结构(例如,一组有限的有序对,或者某种实体)来存储数据,这种图形存储结构包括边缘、属性和节点。它提供了相邻节点间的自由索引功能,也就是说,数据库中每个元素间都与其他相邻元素直接关联。

    网格计算(Grid computing):将许多分布在不同地点的计算机连接在一起,用以处理某个特定问题,通常是通过云将计算机相连在一起。

     

    H

     

    Hadoop:一个开源的分布式系统基础框架,可用于开发分布式程序,进行大数据的运算与存储。

    Hadoop数据库(HBase):一个开源的、非关系型、分布式数据库,与Hadoop框架共同使用。

    HDFS:Hadoop分布式文件系统(Hadoop Distributed File System);是一个被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。

    高性能计算(HPC:High-Performance-Computing):使用超级计算机来解决极其复杂的计算问题。

     

    I

     

    内存数据库(IMDB:In-memory):一种数据库管理系统,与普通数据库管理系统不同之处在于,它用主存来存储数据,而非硬盘。其特点在于能高速地进行数据的处理和存取。

    物联网(IoT):最新的流行语是物联网(IOT)。IOT通过互联网将嵌入式对象(传感器,可穿戴设备,汽车,冰箱等)中的计算设备进行互连,并且能够发送以及接收数据。IOT生成大量数据,提供了大量大数据分析的机会。

     

    K

     

    键值数据库(Key-Value Databases):数据的存储方式是使用一个特定的键,指向一个特定的数据记录,这种方式使得数据的查找更加方便快捷。键值数据库中所存的数据通常为编程语言中基本数据类型的数据。

     

    L

     

    负载均衡(Load balancing):将工作量分配到多台电脑或服务器上,以获得最优结果和最大的系统利用率。

    位置信息(Location data):GPS信息,即地理位置信息。

    日志文件(Log file):由计算机系统自动生成的文件,记录系统的运行过程。

     

    M

     

    M2M数据(Machine 2 Machine data):两台或多台机器间交流与传输的内容。

    机器数据(Machine data):由传感器或算法在机器上产生的数据。

    机器学习(Machine learning):人工智能的一部分,指的是机器能够从它们所完成的任务中进行自我学习,通过长期的累积实现自我改进。

    Map Reduce:是处理大规模数据的一种软件框架(Map:映射,Reduce:归纳)。

    大规模并行处理(MPP:Massivel yParallel Processing):同时使用多个处理器(或多台计算机)处理同一个计算任务。

    元数据(Meta data):被称为描述数据的数据,即描述数据数据属性(数据是什么)的信息。

    多维数据库(Multi-Dimensional Databases):用于优化数据联机分析处理(OLAP)程序,优化数据仓库的一种数据库。

    多值数据库(MultiValue Databases):是一种非关系型数据库(NoSQL),一种特殊的多维数据库:能处理3个维度的数据。主要针对非常长的字符串,能够完美地处理HTML和XML中的字串。

     

    N

     

    自然语言处理(Natural Language Processing):是计算机科学的一个分支领域,它研究如何实现计算机与人类语言之间的交互。

    网络分析(Network analysis):分析网络或图论中节点间的关系,即分析网络中节点间的连接和强度关系。

    NewSQL:一个优雅的、定义良好的数据库系统,比SQL更易学习和使用,比NoSQL更晚提出的新型数据库。

    NoSQL:顾名思义,就是“不使用SQL”的数据库。这类数据库泛指传统关系型数据库以外的其他类型的数据库。这类数据库有更强的一致性,能处理超大规模和高并发的数据。

     

    O

     

    对象数据库(Object Databases):(也称为面象对象数据库)以对象的形式存储数据,用于面向对象编程。它不同于关系型数据库和图形数据库,大部分对象数据库都提供一种查询语言,允许使用声明式编程(declarative programming)访问对象。

    基于对象图像分析(Object-based Image Analysis):数字图像分析方法是对每一个像素的数据进行分析,而基于对象的图像分析方法则只分析相关像素的数据,这些相关像素被称为对象或图像对象。

    操作型数据库(Operational Databases):这类数据库可以完成一个组织机构的常规操作,对商业运营非常重要,一般使用在线事务处理,允许用户访问、收集、检索公司内部的具体信息。

    优化分析(Optimization analysis):在产品设计周期依靠算法来实现的优化过程,在这一过程中,公司可以设计各种各样的产品并测试这些产品是否满足预设值。

    本体论(Ontology):表示知识本体,用于定义一个领域中的概念集及概念之间的关系的一种哲学思想。(译者注:数据被提高到哲学的高度,被赋予了世界本体的意义,成为一个独立的客观数据世界)

    异常值检测(Outlier detection):异常值是指严重偏离一个数据集或一个数据组合总平均值的对象,该对象与数据集中的其他它相去甚远,因此,异常值的出现意味着系统发生问题,需要对此另加分析。

    联机分析处理(On-Line Analytical Processing,OLAP):能让用户轻松制作、浏览报告的工具,这些报告总结相关数据,并从多角度分析。

     

    P

     

    模式识别(Pattern Recognition):通过算法来识别数据中的模式,并对同一数据源中的新数据作出预测

    平台即服务(PaaS:Platform-as-a-Service):为云计算解决方案提供所有必需的基础平台的一种服务。

    预测分析(Predictive analysis):大数据分析方法中最有价值的一种分析方法,这种方法有助于预测个人未来(近期)的行为,例如某人很可能会买某些商品,可能会访问某些网站,做某些事情或者产生某种行为。通过使用各种不同的数据集,例如历史数据,事务数据,社交数据,或者客户的个人信息数据,来识别风险和机遇。

    公共数据(Public data):由公共基金创建的公共信息或公共数据集。

     

    Q

     

    数字化自我(Quantified Self):使用应用程序跟踪用户一天的一举一动,从而更好地理解其相关的行为。

     

    R

     

    R:是一种编程语言,在统计计算方面很出色。如果你不知道 R,你就称不上是数据科学家。R 是数据科学中最受欢迎的语言之一。

    再识别(Re-identification):将多个数据集合并在一起,从匿名化的数据中识别出个人信息。

    回归分析(Regression analysis):确定两个变量间的依赖关系。这种方法假设两个变量之间存在单向的因果关系(译者注:自变量,因变量,二者不可互换)。

    实时数据(Real-time data):指在几毫秒内被创建、处理、存储、分析并显示的数据。

    推荐引擎(Recommendation engine):推荐引擎算法根据用户之前的购买行为或其他购买行为向用户推荐某种产品。

    路径分析(Routing analysis):–针对某种运输方法通过使用多种不同的变量分析从而找到一条最优路径,以达到降低燃料费用,提高效率的目的。

     

    S

     

    半结构化数据(Semi-structured data):半结构化数据并不具有结构化数据严格的存储结构,但它可以使用标签或其他形式的标记方式以保证数据的层次结构。

    结构化数据(Structured data):可以组织成行列结构,可识别的数据。这类数据通常是一条记录,或者一个文件,或者是被正确标记过的数据中的某一个字段,并且可以被精确地定位到。

    情感分析(Sentiment Analysis):通过算法分析出人们是如何看待某些话题。

    信号分析(Signal analysis):指通过度量随时间或空间变化的物理量来分析产品的性能。特别是使用传感器数据。

    相似性搜索(Similarity searches):在数据库中查询最相似的对象,这里所说的数据对象可以是任意类型的数据。

    仿真分析(Simulation analysis):仿真是指模拟真实环境中进程或系统的操作。仿真分析可以在仿真时考虑多种不同的变量,确保产品性能达到最优。

    软件即服务(SaaS:Software-as-a-Service):基于Web的通过浏览器使用的一种应用软件。

    空间分析(Spatial analysis):空间分析法分析地理信息或拓扑信息这类空间数据,从中得出分布在地理空间中的数据的模式和规律。

    SQL:在关系型数据库中,用于检索数据的一种编程语言。

    流处理(Stream processing):流处理旨在对有“连续”要求的实时和流数据进行处理。结合流分析,即在流内不间断地计算数学或统计分析的能力。流处理解决方案旨在对高流量进行实时处理。

     

    T

     

    时序分析(Time series analysis):分析在重复测量时间里获得的定义良好的数据。分析的数据必须是良好定义的,并且要取自相同时间间隔的连续时间点。

    拓扑数据分析(Topological Data Analysis):拓扑数据分析主要关注三点:复合数据模型、集群的识别、以及数据的统计学意义。

    交易数据(Transactional data):随时间变化的动态数据

    透明性(Transparency):–消费者想要知道他们的数据有什么作用、被作何处理,而组织机构则把这些信息都透明化了。

    文本挖掘(Text Mining):对包含自然语言的数据的分析。对源数据中词语和短语进行统计计算,以便用数学术语表达文本结构,之后用传统数据挖掘技术分析文本结构。

     

    U

     

    非结构化数据(Un-structured data):非结构化数据一般被认为是大量纯文本数据,其中还可能包含日期,数字和实例。

     

    V

     

    价值(Value):(译者注:大数据4V特点之一)所有可用的数据,能为组织机构、社会、消费者创造出巨大的价值。这意味着各大企业及整个产业都将从大数据中获益。

    可变性(Variability):也就是说,数据的含义总是在(快速)变化的。例如,一个词在相同的推文中可以有完全不同的意思。

    多样(Variety):(译者注:大数据4V特点之一)数据总是以各种不同的形式呈现,如结构化数据,半结构化数据,非结构化数据,甚至还有复杂结构化数据

    高速(Velocity):(译者注:大数据4V特点之一)在大数据时代,数据的创建、存储、分析、虚拟化都要求被高速处理。

    真实性(Veracity):组织机构需要确保数据的真实性,才能保证数据分析的正确性。因此,真实性(Veracity)是指数据的正确性。

    可视化(Visualization):只有正确的可视化,原始数据才可被投入使用。这里的“可视化”并非普通的图型或饼图,可视化指是的复杂的图表,图表中包含大量的数据信息,但可以被很容易地理解和阅读。

    大量(Volume):(译者注:大数据4V特点之一)指数据量,范围从Megabytes至Brontobytes。

     

    W

     

    天气数据(Weather data):是一种重要的开放公共数据来源,如果与其他数据来源合成在一起,可以为相关组织机构提供深入分析的依据。

    网络挖掘/网络数据挖掘(Web Mining / Web Data Mining):使用数据挖掘技术从互联网站点、文档或服务中自动发现和提取信息。

     

    X

     

    XML数据库(XML Databases):XML数据库是一种以XML格式存储数据的数据库。XML数据库通常与面向文档型数据库相关联,开发人员可以对XML数据库的数据进行查询,导出以及按指定的格式序列化。

    展开全文
  • 电商数据分析方法和指标整理

    万次阅读 多人点赞 2018-11-25 12:06:14
    对于电商行业来说,数据分析的核心公式是:销售额 = 流量*转化率*客单价。因此,分析可以从流量、转化率和客单价这三个维度进行: 1、流量 流量分析,可以从中发现用户访问网站的规律,并根据这些规律改进网站设计...
  • 数据分析报告包含哪些指标

    千次阅读 2019-05-24 15:10:56
    1、首先你需要根据活动目标确定你的目标达成率,完成百分比,提升百分比。...在这张图里,要每个数据的拐点做分析,比如图中11月7日、8日两天的uv价值有明显提升,这个的原因,要找到并写在报告里。 ...
  • Apache Griffin 开源的数据质量分析工具

    千次阅读 热门讨论 2019-09-26 21:50:47
    文章目录一 简介二 架构Apache Griffin具备的能力Apache Griffin处理数据的方式Apache Griffin架构图Apache Griffin的工作流三 环境部署1,部署jdk版本2,部署mysql版本3,部署hadoop版本4,部署hive版本5,部署...
  • 数据分析中的指标和维度

    千次阅读 2020-04-03 09:46:03
    数据分析中的指标和维度 指标与维度是数据分析中最常用到的术语,它们是非常基础的,但是又很重要,经常有朋友没有搞清楚它们之间的关系,只有掌握理解了,我们的数据分析工作开展就就容易多了。现在就来说说指标与...
  • 产品运营数据分析指标有哪些?

    千次阅读 2019-07-04 15:39:05
    根据海盗模型AARRR产品增长模型,可以将指标分为五大类:拉新指标、活跃指标、留存指标、转化指标、传播指标。 1、拉新指标:运营通过渠道投放让“用户”接触到产品,当“用户”觉得产品不错就会去下载它,打开产品...
  • 数据仓库中数据质量评价标准

    千次阅读 2020-06-07 17:33:42
    1、数据质量的定义 数据质量是指在特点情况下,数据的特性满足明确的和隐含的要求的程度。 2、数据评价标准框架 说明: 规范性:数据符合数据标准、数据模型、业务规则、元数据或权威参考数据的程度。 完整性:按照...
  • 游戏常用数据分析指标汇总

    万次阅读 多人点赞 2019-10-22 21:31:25
    乐元素移动游戏运营数据分析指标汇总 一、用户获取 1、mobile用户获取流程 点击-下载-安装-激活-注册-DNU 点击:点击广告页或者点击广告链接数 下载:点击后成功下载用户数 安装:下载程序并成功安装用户数 ...
  • 老李给大家整了各行业的数据指标体系框架,帮助大家理清分析思路,上次分享了关于线下零售指标体系的文章,不少朋友觉得过瘾,今天继续给大家带来电商行业的全指标体系详解!建议收藏! 下面我们详细解释其中...
  • 信息流、物流和资金流三大平台是...电商数据分析指标体系分为八大类指标,包括总体运营指标、网站流量累指标、销售转化指标、客户价值指标、商品及供应链指标、营销活动指标、风险控制指标和市场竞争指标。同类...
  • 数据质量数据质量八个维度指标

    千次阅读 2020-03-30 11:34:34
    数据质量数据质量八个维度指标 数据的质量直接影响着数据的价值,并且直接影响着数据分析的结果以及我们以此做出的决策的质量。质量高的数据仅仅是数据本身的问题,还会影响着企业经营管理决策;错误的数据还...
  • 网站流量分析数据指标

    千次阅读 2018-05-11 15:04:04
    类似地,在网站分析中我们也要了解这些数据,并作为后续业务调整的依据:比如,多少人进入了网站、浏览了多少页面、多少人办理会员等,网站分析指标数据化地呈现网站运营的状况,帮助站长从各维度了解...
  • 互联网数据分析--指标和维度

    千次阅读 2019-07-22 07:13:37
    指标和维度是数据分析的两个基础术语。 指标用来衡量事物发展程度,通过几个关键指标可衡量公司业务运营情况的好坏。指标需通过加和、平均等汇总计算得到,提前是要通过在一定的统计口径和范围内计算(如时间、地点...
  • 超详细的APP数据指标体系分析

    万次阅读 多人点赞 2019-07-16 23:20:38
    一个APP的构建与运营工作通常由多个角色分工实现,由于大家的工作重点不同,仅关注一个方面的数据就如同管中窥豹,无法全面了解产品运营情况,能提出行之有效的分析建议。因此,只有搭建完善的数据运营分...
  • 数据标准】数据指标体系建立

    万次阅读 多人点赞 2019-10-15 22:03:22
    然而还有些业务人员对分析系统能做什么、如何做没有太多经验,于是他们也找来了实施厂商,但结果却是…… 客户尽管知道大数据分析对于经营管理的意义所在,但事实上国内绝大多数企业的大数据能力成熟度仍停留...
  • 银行分析指标

    千次阅读 2020-06-10 13:03:42
    商业银行分析指标的基本依据是安全性、流动性、盈利性 参考:https://mp.weixin.qq.com/s/jnTg99zd4Xg64VDTEpeClQ 1. 资产充足指标 ** 资本充足率** 我国总行采用资本与权重风险资产相比分析资本充足程度,并规定...
  • 作者l 李朋波 编辑l 李朋波本文目录CONTENTS ☞ 数据质量管理流程 ☞数据质量管理工具设计思路上篇我们主要介绍了以下三部分内容。第一部分,介绍了五种常见的数...
  • 企业级指标数据体系建设思路探讨

    千次阅读 2022-03-03 20:36:24
    企业级数据指标体系建设思路及方法
  • 数据质量评估方法

    万次阅读 2019-01-17 16:48:46
    数据质量评估方法数据质量评估方法数据质量评估具体检测的内容数据完整性检测数据准确性检测数据有效性检测数据时效性检测数据一致性检测数据质量评估流程 数据质量评估方法 数据质量评估体系主要参考以下指标: ...
  • AQI空气质量分析与预测

    万次阅读 多人点赞 2021-04-04 03:13:58
    AQI分析与预测 AQI全称是Air Quality Index,指空气质量指数,用来衡量空气清洁或者污染的程度,值越小,表示空气质量越好。 本文的分析目标是: 一、描述性统计 那些城市的空气质量较好/较差? 空气质量在地理位置...
  • 浅谈数据指标以及指标体系

    千次阅读 2022-03-04 23:22:53
    笔者之前就用户行为数据写过一篇科普文《用户行为数据入门理论与实例》,里面有用户行为分析的整体介绍,其中包括数据指标以及指标体系搭建这个重要的环节;但是受文章篇幅所限,能完整、体系化地介绍数据指标、...
  • 电商数据分析基础指标体系

    千次阅读 2016-03-15 18:26:07
    电商数据分析基础指标体系 傅志华 信息流、物流和资金流三大平台是电子商务的三个最为重要的平台。而电子商务信息系统最核心的能力是大数据能力,包括数据处理、数据分析数据挖掘能力。无论是电商平台(如淘宝)...
  • 数据治理系列5:浅谈数据质量管理

    万次阅读 多人点赞 2019-08-10 16:31:51
    题外话:看过之前的文章的小伙伴难发现,文章开篇几乎都是定义、概念,这已成了笔者写文章的一个习惯。本着专业知识和技术的敬畏以及文章主题的聚焦,笔者认为文章的开篇是非常有必要先把概念或定义交待清楚的...
  • 数据质量保证主要包括数据概要分析(Data Profiling)、数据审核(Data Auditing)和数据修正(Data Correcting)三个部分,前一篇文章介绍了Data Profiling的相关内容,从Data Profiling的过程中获得了数据的概要...
  • 数据分析(一)——数据分析思维

    千次阅读 多人点赞 2020-10-04 18:47:27
    大概从数据分析现在的应用现状、数据分析的概念、数据分析分析方法、为什么要学习数据分析以及数据分析的结构层次等几方面给大家介绍了数据分析,让大家初步对数据分析有一个大概的了解。这篇文章具体的给大家介绍...
  • 数据仓库之指标体系建设分享

    千次阅读 2020-08-28 00:10:35
    1 指标体系 2 为什么要搭建指标体系 3 如何搭建指标体系 4怎么管理指标体系 5 如何产品化指标体系 6 结束 7 参考文献
  • 面对数据报表,知道该怎么分析知道该分析什么? 数据分析作为运营最基础的一项技能,你是否真正的将其价值发挥出来,合格的运营一定是数据驱动运营,而非运营驱动数据! 1、从单一维度到体系化的思考,是做...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 72,385
精华内容 28,954
关键字:

对数据质量分析的指标不包括