精华内容
下载资源
问答
  • 用户分析
    千次阅读
    2021-03-18 11:22:50

    一、目的与价值
    用户分析的本质就是对用户进行分类。
    用户生命周期:(拉新、促活留存、转化、推荐)
    引入期—成长期—成熟期—休眠期—流失期

    二、如何进行分析

    ①用户结构分析
    一般包含以下几方面:
    1.社会属性:年龄,性别,地域,学历,家庭状况,婚姻,子女等等。
    2.商业属性:财富等级,消费档次,信用等等。
    3.心理属性:价格敏感性、偏好属性等等。
    4.行为属性:游览频次,浏览品类、浏览价格带、下单频次、下单品类、 下单价格带等等。
    5.价值属性: ADR贡献等的行为总结(ADR指标又叫涨跌比率指标或上升下降比指标,其英文全称是“Advance Decline Ratio”)。

    用户结构信息可以分为静态和动态两大类,静态信息如性别,地域,家庭状况,婚姻等这些变化较小的信息,动态信息如产品的行为信息,在产品上贡献价值的信息等。如果我们后续要制定更加精准的策略,动态用户结构信息是要重点收集的

    ②用户行为分析

    1.要有完备的获取用户行为的机制,并且行为数据可以被分析师获取。
    2.要根据业务特性和需要,定义出关键行为,并且能够在行为数据中找到数据依据。
    3.根据行为结果定义出用户标识,便于后续对用户进行分类。
    4.行为结果要经常回顾和更新,因为行为是动态的不是静止的。

    ③用户价值分析
    做用户价值分析,首先要打通用户行为数据和用户交易数据

    ④用户分类

    更多相关内容
  • 基于Spark的用户分析系统

    万次阅读 2015-07-30 18:58:36
    我们可以通过用户的行为分析用户的偏好,给用户打上各种各样的标签,比如性别、地域、使用设备、兴趣爱好等,进而找到一群用户的整体偏好,这样可以对用户或内容进行精准营销。实际应用中,我们需要搭建一个系统,...

    每天有大量的用户通过浏览器、手机app、TV访问优酷土豆网站,在优酷土豆上观看视频,并且可以对视频进行评论、顶踩、收藏、转发。我们可以通过用户的行为分析用户的偏好,给用户打上各种各样的标签,比如性别、地域、使用设备、兴趣爱好等,进而找到一群用户的整体偏好,这样可以对用户或内容进行精准营销。实际应用中,我们需要搭建一个系统,通过这个系统可以很快的知道符合某些条件的用户到底有多少,比如北京的男性用户有多少、喜欢看汽车视频和动漫的用户有多少。还可以很快的知道某个视频的观众有多少、喜欢看哪个类型的节目、我的订阅用户和他的订阅用户有什么不同等等。搭这样的一个用户分析系统,我们面临的是一个大数据的问题:近一个月出现的cookie和id可能有20亿,标签的维度有成千上万,我们应该选择怎样的架构才能在几秒或十几秒之内返回用户期待的分析结果。

    优酷土豆的大数据平台提供了各种各样的分布式系统,hadoop,storm,spark,hbase等等给我们使用。Hadoop的MR框架是计算不动,数据动,map过程需要写文件,不能准实时返回结果,适合离线任务;storm是流式计算,适合数据分批到达,实时处理,可以用于构建实时用户画像;hbase提供key、value的查询适合获取单个或连续的key值,不适合对随机的一群用户进行分析;spark是将所有数据加载到内存中(也可缓存在磁盘上),在内存中迭代计算,不用将中间数据写入磁盘,运算比较快,能提供准实时的服务,正是我们需要的架构。

    我们调研了下,发现Ooyala已经开发一套了 Sparkas a service服务spark job server (https://github.com/spark-jobserver/spark-jobserver),RDD可以在不同的job间共享,即可以将数据永久保存在spark服务器的内存中,通过web交互式的进行提交命令,接收spark返回的结果。我们的用户分析系统在spark, spark job server的基础上进行搭建。

    1.  系统架构

    用户分析系统的基本架构如下图所示:


    图中,标签体系为所有模块提供统一编码以及层级查询功能。人群筛选与人群投影模块各自拥有自身的订单管理系统,并且共用一个Spark App。Spark App直接与Spark集群进行交互,负责提交Spark计算任务,从HDFS上加载RDD数据。标签数据更新模块则负责将标签计算结果进行merge并且通知Spark App进行RDD数据更新。

    1.1.  标签体系

    标签体系本质的意义在于刻画用户不同维度的特征,这些维度包括用户的一些自然属性例如年龄,性别等,还包括用户的社会属性例如教育背景,经济背景等,此外还需要囊括用户的文化属性例如兴趣爱好,内容倾向等。

    标签体系本身是有层级结构的,比如一级频道电影是一级标签,电影下面的二级频道是二级标签等等,不同层级标签在不同粒度上表示了用户的兴趣。我们可以给用户打上下一层级的标签时也打上上一层级的标签。这样将层级的标签扁平化,标签和标签之间在使用时是平级的。对标签进行编码,每个标签都有一个自己唯一的编码,4个字节,考虑到spark内存的限制,以及所有标签不是同时出现,我们在spark中使用的编码是一个内部编码(2或3字节),每天在做数据的时候根据标签配置表对标签进行重新编码,生成一个内部编码和唯一编码的映射表,在UP应用系统内进行转换,对用户透明。

    1.2.  标签存储

    原始的标签数据来源于算法团队或其他团队,还有一些来自第三方的数据,每个来源的标签都只是用户标签的一部分,用户分析的updater程序会每天合并所有的标签数据,并进行压缩存储为最终标签数据。示意图如下图所示:


    有些用户一个月的行为太少,不能计算出对应的兴趣标签,因此我们会过滤行为少的用户,只保留“真正”的用户,过滤完后,我们保留3.5亿用户进行分析,原始的标签以文本格式存储在hadoop上,每行代表一个用户。为了spark能快速加载,将原始的标签转换为SequenceFile的格式进行存储,key和value都是BytesWritable,因为将所有标签以bytes连续保存最省内存。

    1.3.  人群筛选投影Server

    人群筛选投影Server主要是接收前端用户请求,对部分请求参数进行处理,向Spark App提交操作任务,接收结果,并将结果返回给用户,其系统结构示意图如下图所示:



    图中,SparkApp是基于Spark Job Server的api开发的主要功能模块,人群筛选投影Server的主要是中转和存储作用,将用户的分析请求转换格式发送给Spark App,将Spark App的结果封装后回复给用户,并且将结果缓存,留待用户下一次请求。

    2.  解决的技术问题

    技术方面主要是解决存储和快速的问题,存储的问题通过设计数据的存储格式来解决,对不同操作使用不同的解决方式。

    2.1.  快速的人群筛选

    人群筛选要解决的问题是如何快速的判断某个id是否满足一些条件,我们可以将条件写成一个表达式,比如(tagid1.weight>0 && tagid2.weigth>10),然后解析表达式,将id对应的标签值填入来判断表达式是否满足

    实际使用中我们发现对大量数据来说这样一个个的去判断计算很慢,我们采用了Janino内存编译技术。将表达式写成java代码,动态编译,生成class,然后加载到内存中,调用该类的方法来判断表达式是否满足。待编译的代码如下所示:

        protected final static String template =
                "import com.youku.recommend.up.drill.expression.Index;\r\n" +
                        "import com.youku.recommend.up.drill.expression.Calculate;\r\n" +
                        "public class Exp implements Calculate {\r\n" +
                        "public  boolean calculate(Index index){\r\n" +
                        "boolean flag=${expression};\r\n" +
                        "return flag;\r\n" +
                        "}\r\n" +
                        "}\r\n";


    2.2.  快速的人群投影

    两个数据集 (RDD) A,B,其中A是全量数据,包括id和标签,B数据集只包含id,需要知道B数据集中有多少id在A中存在,以及需要知道存在的id的标签统计结果,我们可以根据id对A,B俩数据集进行join来过滤出在A、B中同时存在的id,然后再统计这些id各标签的数量。

    Spark原生的join会对两个RDD都进行一次shuffle,每个worker将数据根据hash值重新分发到各worker上,由于A数据集是全量数据,量非常大,而且常驻内存,而且一天才更新一次,我们不希望每次计算时都要对它进行shuffle,这样系统开销很大,我们完全可以先对A数据集进行Shuffle并且在每个partition上按照id排好序,这样A和B进行join时,A不用shuffle,只需要将B按照同样的hash算法Shuffle然后排序,再按序遍历A和B相同的partition,就能过滤出AB中同时存在的id。类似于做好工作后,求两个有序数组的交集,只需 O(M+N)  的时间就够。

    3.  计划

    用户分析中计划添加的功能主要是人群扩散,给一个种子人群,分析该人群的兴趣特征或内容偏好,找出相似的人群,扩充原有人群。


    展开全文
  • 用户研究是用户中心的设计流程中的第一步。...本篇重点围绕七大用户分析方法论/模型,展开分享几个比较常见的用户运营实际案例。 六大用户分析方法论 1、行为事件分析 2、点击分析模型 3、用户行为路...

     

    用户研究是用户中心的设计流程中的第一步。它是一种理解用户,将他们的目标、需求与商业宗旨相匹配的理想方法,能够帮助企业定义产品的目标用户群。在用户研究过程中,数据的使用及挖掘是非常重要的。那么,有哪些通用的用户分析方法?如何分析你的用户?本篇重点围绕七大用户分析方法论/模型,展开分享几个比较常见的用户运营实际案例。

    六大用户分析方法论

    1、行为事件分析

    2、点击分析模型

    3、用户行为路径分析

    4、用户健康度分析

    5、漏斗模型分析

    6、用户画像分析

    下面一一解析每种方法论的定义及实战案例

    先从最基础的行为事件分析法开始

    01

    行为事件分析

    行为事件分析法主要用于研究某行为事件的发生对企业组织价值的影响以及影响程度。企业借此来追踪或记录用户行为及业务过程,如用户注册、浏览商品详情页、成功下单、退款等,通过研究与事件发生关联的所有因素来挖掘用户行为事件背后的原因、交互影响等。

    行为事件分析法一般经过三大环节:事件定义、多维度下钻分析、解释与结论。

    1、事件定义

    事件定义包括定义所关注的事件及事件窗口的长度,这也是事件分析法最为核心和关键的步骤。事件的定义遵循5W原则:Who、When、Where、What、How。

    5W事件定义方式:

     某X平台的所有注册用户在X月X日使用优惠券下单购买的单数是多少?这是一个完整的时间定义,一般数据人员需要记录的对应字段有:时间、商品名称、商品是否使用优惠券、父单数、购买数量、购买金额等。

    5W

    (Where)某X平台

    (Who)所有注册用户

    (When)在X月X日

    (How)使用优惠券

    (What)下单购买的单数

    在大厂混的我们都多少接触过各种数据报表,Path口径、Session口径等各种口径,我们所熟悉的字段“访问次数”、“浏览深度”、“使用时长”、“停留时长”、“跳出率”、“页面退出率”等指标,都需引入 Session 才能分析。因此,创建和管理 Session 是事件定义的关键步骤。

    这里需要了解“Session”的概念,Session一般翻译为时域。在计算机专业术语中,Session是指一个终端用户与交互系统进行通信的时间间隔,通常指从注册进入系统到注销退出系统之间所经过的时间。具体到Web中的Session指的就是用户在浏览某个网站时,从进入网站到关闭浏览器所经过的这段时间,也就是用户浏览这个网站所花费的时间。因此从上述的定义中我们可以看到,Session实际上是一个特定的时间概念。

    2、多维度下钻分析

    最为高效的行为事件分析要支持任意下钻分析和精细化条件筛选。当行为事件分析合理配置追踪事件和属性,可以激发出事件分析的强大潜能,为企业回答关于变化趋势、维度对比等等各种细分问题。“筛选条件”例如:“地理位置”、“时间”、“广告系列媒介”、“操作系统”、“渠道来源”等。当进行细分筛查时,才可以更好地精细化定位问题来源。

    3、解释与结论

    解释与结论即所谓的出分析报告阶段。对分析结果进行合理的理论解释,判断数据分析结果是否与预期相符,如果相悖,则应该针对不足的部分进行再分析与实证。

    行为事件分析案例解说

    运营A在日常运营某平台频道的过程中发现,某天的UV值突然翻倍异常标高,需要快速定位:是异常流量还是虚假流量?我们可以先按照5W法则拆解事件,可以发现实际上我们是要找出HOW,也就是为什么流量飙升的理由。

    (Where)某平台

    (Who)某频道

    (When)某天

    (How)???

    (What)UV值异常翻倍

    紧接着,通过多维度“筛选条件”进行下钻分析:选择“流量入口来源”、“时间点”、“地理位置”、“操作系统”等。当进行细分筛查时,运营A发现:早上10点钟时,微信渠道侧的流量飙高并且是由于公众号推送场景带来的流量,确认公众号确实为早上10点推动并且当天的推送质量很高,用户点击数较往常更高,基本判断UV的飙高是异常值,不是虚假流量,并且是由于该事件带来。

    02

    点击分析模型

    点击分析模型在各行业内数据分析应用较为广泛,是重要的数据分析模型之一。其中点击图是点击分析方法的效果呈现,在用户行为分析领域,点击分析包括元素被点击的次数、占比、发生点击的用户列表、按钮的当前与历史内容等因素。

    点击分析方法主要解决的问题主要有三点:

    1、精准评估用户与产品交互背后的深层关系;

    2、实现产品的跳转路径分析,完成产品页面之间的深层次的关系需求挖掘;

    3、与其他分析模型配合,全面视角探索数据价值,深度感知用户体验,实现科学决策。

    点击分析模型主要用于什么分析?

    1、官网

    2、活动页面

    3、产品频道/首页

    4、详情页

    点击分析通用的两种形式包括:可视化与固定埋点,可视化多用热力图进行呈现,运营可以根据点击密度判断用户的浏览喜好。

    1.jpg

    热力图形式 

    图片来源:百度

    2.jpg

    固定埋点形式 

    图片来源:天猫超市(数据虚构)

    下面对比热力图与固定埋点形式的差异化

     

    数据形式热力图固定埋点

    用户
    友好性

    操作简单,可视化直观地将流量数据分布通过不同颜色区块呈现,可快速判断点击分布

    操作繁琐,需要导出报表后进行加工分析,无法可视化取数

    入手
    难度

    简单入手,无须报告数据分析,无需任何页面分析经验

    入手稍难,需要对埋点、对数据统计维度有一定数据分析经验

    灵活性

    灵活性强,可对页面任意位置进行数据监测

    灵活性弱,无法对页面任意位置进行数据监测;若页面更改埋点需同步更改

    长期
    取数

    无法进行长期数据固定对比,形成报表性差,无法对页面定向区域进行定期取数分析

    可长期取数形成报表,可对页面定向区域进行定期取数分析

    热力图VS固定埋点

    点击分析模型案例解说

    以上图天猫超市为案例,开发可对每一个前端模块进行埋点,然后上报数据,运营可在数据报表处下载对应数据,数据可包括:PV、UV、下单、GMV等,可针对不同指标进行分析。

    假设上图中个人护理icon点击UV占比为67%,是频道内所有icon中最高的一个,那么对于猫超这么一个老用户居多的业务场景来说,老用户对在超市中购买“个人护理”有很强烈的诉求与黏性,可以重点挖掘业务价值。再比如,假设banner模块的日均UV为1w,我们假定这个值是偏低的,并且banner在页面首页的使用面积占比又超过UV及订单的贡献占比,此时可以考虑两种方案:压缩banner尺寸或者提升banner点击率。

    从长期监控数据上看,点击分析可以观察页面某位置(业务)的改变对于用户的价值,一般而言,点击UV越高,说明用户的黏性越大。当然点击率还跟所处位置有关,同一页面高度,根据用户视觉习惯,一般左边点击优于右边。

    03

    用户行为路径分析

    用户路径的定义,就是用户在APP或网站中的访问行为路径。对于一个指定的页面(URL),用户是从哪些场景来到这个页面(来源)?进入这个页面后又去往哪些场景(去向)?用户浏览路径是否是按照运营设计的路径前进还是偏移?用户行为路径分析就是解决以上问题的分析方法:指导运营明确用户现存路径,优化用户行为沿着最优访问路径前进,结合业务场景需求进行前端布局调整。

    以电商为例,买家从登录网站/APP到支付成功需要经过首页浏览、搜索商品、加入购物车、提交订单、支付订单等一系列过程。一个新用户和一个老用户在进行购买流程的时候,他们的浏览路径是否有区别?新用户倾向什么路径?老用户倾向什么路径?与其他分析模型配合进行深入分析后,可以快速找到用户动机,从而引领用户走向最优路径或者期望中的路径。

    3.jpg

    电商平台店铺用户行为路径图

    用户路径分析案例解说

    假设上图中,用户进入店铺页中选择以下路径:

    1、约40%的客户会点击Banner活动页;

    2、约30%的客户会直接进行商品搜索;

    3、约10%的用户会浏览商品详情页;

    4、约5%的客户啥都不干直接退出店铺;

    假设以上四种路径中,第三种直接浏览商品详情页的用户下单比例最高,超过90% ,与其形成鲜明对比的是,尽管第一种“点击Banner活动页”的用户占比高达40%,但是仅5%的用户下单了,说明Banner的内容布局和利益点有着比较糟糕的用户体验,则将此作为首选优化与改进的方向。

    改进方式:

    1、优化内容质量:素材图片、利益点、承接页动线、承接页商品让利程度等;

    2、压缩banner模块实际面积:比如淘宝的banner基本为千人千面或者商家直通车购买,展示总量大,比较难控制所有内容质量,因此选择更小的尺寸高度来分散用户点击占比,为其它首屏优质业务提供更多的流量;相对的,天猫的banner活动一般为类目排期活动,较少商家购买(能花得起这个钱的商家一般也是KA,不会把内容质量搞的很糟糕),因此天猫的banner高度较淘宝会更醒目;

    04

    用户健康度分析

    用户健康度是基于用户行为数据综合考虑的核心指标,体现产品的运营情况,为产品的发展进行预警。包括三大类型指标:产品基础指标、流量质量指标、产品营收指标。它们三者构成了评价产品健康度的体系,它们也各有侧重点。

    1、产品基础指标,主要评价产品本身的运行状态:PV、UV、新用户数;

    2、流量质量指标,主要评价用户流量的质量高低:跳出率、人均浏览次数、人均停留时间、用户留存率、用户回访率;

    3、产品营收指标,主要评价产品的盈利能力与可持续性:用户支付金额(GMV)、客单价(ARPU)、订单转化率;

    1、产品基础指标

    UV:独立访客数(unique visitor),指通过互联网访问、浏览这个网页的自然人。但对于UV的定义有一个时间限制,一般是1天之内,访问你的产品的独立访客数,如果一个用户一天内多次访问也只计算为1个访客。UV是衡量产品量级的最重要指标。

    PV:页面浏览量(Page View),用户每1次对网站中的每个网页访问均被记录1次。用户对同一页面的多次访问,访问量累计。因此一般PV值大于UV值。

    新用户数:对于电商来说,新用户一般定义为未注册或者已注册,但还未进行首单支付的用户。一个新用户到老用户的转变过程可以用四象空间来划分:次数、金额、时间、品类;

    2、流量质量指标

    跳出率:跳出率(Bounce Rate)也被称为蹦失率:浏览单页即退出的次数/访问次数=single access/entry visits。浏览单页即退出的次数——简单说就是进入某个页面后没有点击任何页面就离开。一般用来来衡量用户访问质量,高跳出率通常表示内容对用户不具针对性(吸引);

    4.jpg

    A页面的跳失率=(5/10) *100%

    A页面的退出率= (5+2/10+2 )*100%

    人均停留时间:是指用户浏览某一页面时所花费的平均时长,平均停留时间越长,说明网站或页面对用户的吸引力越强,能带给用户的有用信息越多。

    用户留存率:留存指的就是“有多少用户留下来了”。用户在某段时间内开始使用应用的用户,经过一段时间后,仍然继续使用的用户,被认作是留存用户。

    留存率=新增用户中登录用户数/新增用户数

    (一般统计周期为天)

    留存率反映的实际上是用户的一个留存漏斗,即新用户转化为活跃用户、稳定用户、忠诚用户的过程,宏观观察用户的生命进程情况,通过用户的后期留存情况就能从一个层面把握渠道质量,比如,付费,粘性,价值量,CAC成本。

    用户回访率:用户在某段时间内开始使用应用,经过一段时间后,继续登陆使用的用户,被认作是回访用户。比如用户在使用该App之后的N天/周/月之后,再次使用该App的比例,叫做N天/周/月回访率。留存与回访这两者的区别就是:前者是新增多少用户,留下来多少;后者是在某时间段内,用户再次使用、访问app、软件的数量。

    3、产品营收指标

    客单价(ARPU):客单价=支付有效金额/支付用户数,客单价反应平均一个用户支付的金额,金额越高,为企业带来的利润也越多,因此提升客单价是一个很好几刺激毛利润的方法,比如我们常见的促销手段:买2件减10元,买2件送赠品等;

    转化率:订单转化率=有效订单用户数/UV。转化率是做成交营收的一个关键因素,转化越高表示越多用户在目标页面下单。

    用户支付金额(GMV):支付金额即产品某段时间的流水。产品的营收做得好与不好,主要就是看支付流水。盈利模式如何,有没有稳定的创收能力,是对一个产品终极的考验(战略烧钱和圈用户的先不算在内)

    产品营收指标有一个恒等式:

    销售额=访客数×成交转化率×客单价

    销售额=曝光次数×点击率×成交转化率×客单价;

    这是电商入门基础中的战斗机

    05

    漏斗模型分析

    定义:漏斗模型分析,本质是分解和量化,也就是说从一个事件环节的最开始(获取用户)到最终转化成购买这整个流程中的一个个子环节,相邻环节的转化率表现力,就是指用数据指标来量化每一个步骤的表现。所以整个漏斗模型就是先将整个事件流程拆分成一个个步骤,然后用转化率来衡量每一个步骤的表现,最后通过异常的数据指标找出有问题的环节,从而解决问题,优化该步骤,最终达到提升整体购买转化率的目的。

    流量漏斗模型在产品运用中的一个经典运用是AARRR模型,来自增长黑客Growth hacker一书中(这本书特别值得一看),AARRR模型是结合产品本身的特点以及产品的生命周期位置,来关注不同的数据指标,最终制定不同的运营策略。

    《增长黑客》增长黑客是介于技术和市场之间的新型团队角色,主要依靠技术和数据的力量来达成各种营销目标,而非传统意义上靠砸钱来获取用户的市场推广角色。他们能从单线思维者时常忽略的角度和难以企及的高度通盘考虑影响产品发展的因素,提出基于产品本身的改造和开发策略,以切实的依据、低廉的成本、可控的风险来达成用户增长、活跃度上升、收入额增加等商业目的。简单来说,就是低成本甚至零成本地让产品获得有效增长。增长黑客的核心是:自传播/病毒传播。

    5.jpg

    AARRR的说明:

    获取Acquisition:用户如何发现并来到你的产品?(浏览层)

    激活Activation:用户的第一次使用体验如何?(点击/参与)

    留存Retention:用户是否还会回到产品?(回访/留存)

    收入Retention:产品怎样通过用户赚钱?(付费)

    传播Retention:用户是否愿意告诉其他用户?(忠实/传播用户)

    漏斗模型在实际的运营中很常见,我们可以抽象出决定漏斗形态的三个元素:时间、节点、流量。

    1、时间:转化周期,即为完成每一层漏斗所需时间的集合。通常来讲,一个漏斗的转化周期越短越好。

    2、节点:每一层漏斗,就是一个节点。而对于节点来说,最核心的指标就是转化率,转化率 = 通过该层到达下一次层的流量/到达该层的流量。

    3、流量:每个环节的数值大小,也就是人群数。

    流量漏斗模型案例解说

    以电商实际运营过程中的具体案例说明流量漏斗模型的运用,假设(数据均虚拟)我们做了一场营销活动,活动页面的流量漏斗模型如下图:用户的流量路径如下:点击主会场页面→进入商品详情页→下单购买→发货(上账);

    电商主会场流量漏斗数据

    6.jpg

    对比正常卖场流量漏斗平均图可以看出,用户在“活动页面→进入商品详情页”这个步骤中,跳转率只有40%,假设远低于平均值45%,可以思考下用户进入主会场后为什么不点击商品呢?一般而言,跳转率低下主要由以下几个原因:

    1、页面开发问题bug:手机机型适配问题、无法点击、页面空窗、链接错误等;

    2、内容与引流用户不匹配:引流用户对商品/内容不感兴趣、BI推荐不准确等 ;

    3、页面运营问题:利益点对应商品承接、商品让利不够、文案内容与承接落地页面不符;

    一个个去排除问题后,我们可以初步将问题点锁定,针对性解决。简单总结,漏斗模型适合运用于监控不同的产品环节数据指标,并找出对应的问题。

    06

    用户画像分析

    用户画像的正式名称是User Profile,是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特征标识。通过打标签可以利用一些高度概括、容易理解的特征来描述用户,可以让人更容易理解用户,并且可以方便计算机处理。在产品早期和发展期,会较多地借助用户画像,帮助产品运营理解用户的需求,想象用户使用的场景,产品设计从为所有人做产品,变成为带有某些标签的3-5个人群做产品,间接降低复杂度。

    用户画像的数据内容包含但不局限于:

    1、人口属性:包括性别、年龄等人的基本信息;

    2、兴趣特征:浏览内容、收藏内容、阅读咨询、购买物品偏好等;

    3、位置特征:用户所处城市、所处居住区域、用户移动轨迹等;

    4、设备属性:使用的终端特征等;

    5、行为数据:访问时间、浏览路径等用户在网站的行为日志数据;

    6、社交数据:用户社交相关数据;

    用户画像主要运用常场景如下图

    7.jpg

    图片来源:CSND 博客

    用户画像运用场景三维空间图,X轴代表业务场景维度;Y轴代表用户标签维度;Z轴代表服务层次维度。首先用户画像业务场景可以分为用户细分、产品优化、渠道拓展、运用提升、风险控制等。基于每一个业务场景,都有不同的用户标签定义,比如用户细分场景业务中,主要是用户的基本属性,包括性别、年龄、地域等。而风险控制业务场景中,主要是用户风险控制标签,包括黄牛标签、异常评分标签等。首先对用户群进行用户标签处理,根据不同的标签进行个性化推荐,再到到运营层面进行决策运营。环环相扣,所以用户画像的核心是标签的建立。

    用户画像分析案例解说

    「她是一位住在北京的80后的女性白领,起居时间规律,喜欢运动,家有幼儿,关注时尚爱兰蔻……」这段话语用来描述的是某个用户,并不是一类用户。我们谈的用户画像User Profile,本质是对任何一个用户都能用标签和数据描述。

    8.jpg

    因此,我们将此类用户标签化为:作息规律、注重品质、生活健康、尝试新鲜、小资;当然这种标签没办法精细化指导运营工作,对于用户运营而言,比较经典的用户画像指导运营的模型是RFM模型。

    展开全文
  • 游戏数据分析 | 用户流失原因分析

    千次阅读 2020-04-02 20:43:57
    流失用户分析的方法有很多,常见的方法有流失等级分布、 等级停滞率、分渠道和平台的留存率对比、主线任务持有率。本文将从合理定义流失用户、客户端卸载原因和5W1H分析法来分析流失用户,并且用聚类分析对活跃用户...

    流失用户分析的方法有很多,常见的方法有流失等级分布、 等级停滞率、分渠道和平台的留存率对比、主线任务持有率。本文将从合理定义流失用户、客户端卸载原因和5W1H分析法来分析流失用户,并且用聚类分析对活跃用户进行细分,其目标在于更好地了解用户并满足用户需求,使游戏运营活动做到有的放矢,以提高游戏的盈利能力,推动收入的增长。


    一、合理定义流失用户

    用户多久没上线算流失?

    用户流失分析第一步是要定位流失用户,而流失期限就是定义用户是否流失的关键。通常在游戏中,会有对流失玩家召回的活动,假如流失玩家的流失期限定义太短,比如3天未登录游戏即算流失,这样虽然能够覆盖更多的真实流失玩家,但同时也会对许多非真实流失玩家,在召回活动中大量发放奖励,不仅浪费资源,也破坏了一定的游戏平衡性;假如流失玩家的流失期限定义太长,比如60天未登录游戏即算流失,这样覆盖全部真实流失玩家的比例较低,召回活动显得没有太大的意义。所以玩家流失多久才能定义为流失玩家至关重要。

    流失用户回归率

    流失用户回归是指流失之后的用户再次登录游戏,根据回归用户数可以计算得到用户回归率,即:
    流 失 用 户 回 归 率 = 回 归 用 户 数 / 流 失 用 户 数 × 100 % 流失用户回归率 = 回归用户数/流失用户数\times100\% =/×100%流失用户回归率在流失用户定义合理的情形下,通常数值比较低,移动游戏的用户回归率通常在5%以下。用户流失的流失期限长度与流失用户回归率通常成反比,即随着流失期增大,流失用户回归率递减,并逐渐趋近于0。

    拐点理论

    X轴上数值的增加会带来Y轴数值大幅增益(减益),直到超过某个点之后,当X增加时Y的数据增益(减益)大幅下降,即经济学里面的边际收益的大幅减少,那个点就是图表中的“拐点”。
    假设我们以1天为单位定义用户流失期限,即用户某日登录游戏,在此后1天内没有继续登录,我们就认为它已流失;再假设以3天为单位,那么在用户某日登录游戏,在此之后3天内没有继续登录游戏,我们就认为它已流失。以此类推,我们也可以以周为单位。下图是以3天为单位的流失用户回归率曲线,可以看到,当流失期限超过15天的时候,曲线逐渐平滑,那么我们可以认为当一个玩家连续15天没有登录游戏时,即判断它已经流失。
    在这里插入图片描述

    二、玩家等级副本流失分析

    谈到玩家流失分析,我们要关心的问题有流失用户分布在哪些等级?是不是副本难度造成了玩家流失?玩家在哪些副本流失的人数最多?我们可以很容易拿到玩家的流失等级分布数据,如下图所示,从某手游的流失等级分布图我们可以看到,前面几级的流失人数是最多的(正常现象,不管什么类型的游戏,对新进玩家来讲,前面几级的流失人数都是的最高的,可能出于对游戏风格的喜好、可能渠道带进来的质量比较差,可能游戏新手引导阶段易用性较差,等等),30~40级流失玩家人数又开始缓慢回升,40级是分水岭,40级之后高等级的玩家流失快速下降。
    在这里插入图片描述
    那玩家流失跟副本的关系有多少呢, 接下来我们可以查看不同等级的流失玩家停留在哪些副本。从表中数据我们可以看到,第1个副本4级玩家停留最多,第3个副本5级玩家停留最多,第7个副本6级玩家停留最多,以此类推,不同等级玩家在哪些副本停留状况都可以明显地看到。那么我们可以进一步思考是不是某些副本的难度太高了呢!因此可以进一步查看不同等级玩家的副本通过率。副本通过率一方面能够反映副本难度符不符合当初的预期,例如10级玩家原本应该顺利通过副本10到13,结果数据发现10级玩家在这几个副本中通过率不高,那么这时候应该对副本难度进行调节;另一方面通过副本通过率可以确认某一副本某一等级的大量流失玩家停留是不是由于副本难度造成的。例如表中中7级流失玩家在副本11停留人数最多,达255人,我们可以查看该等级段玩家在该副本的通过率情况,如果不符合预期,相对周边副本通过率确实较低,那降低副本难度将有助于降低玩家流失。

    副本ID停留角色数4级5级6级7级8级
    1122094971867812
    278554064706222
    31896116021427743
    4725480928026
    5530301529825
    64771526710129
    761236010867
    82941386036
    93021068543
    10258212758
    1145625589
    122089952
    131806351
    1427113960
    15381211
    16247111
    17255114
    1823995
    192851108
    2016623

    三、等级付费转化率分析

    等级付费转化率描述玩家在游戏进程的不同等级阶段的付费转化率,在哪些等级玩家容易产生付费,我们可以根据付费转化率高的等级来回顾玩家可能存在的游戏行为,并实施相应的运营策略,提升付费。
    等级付费转化率一般只适用于游戏的前期,在游戏前期玩家能够跟着策划人员的思路往下走,容易在设计的付费点处产生付费。而到了游戏后期,玩家往往各自练级,发展道路,是否付费受到的制约因素较多。

    指标

    • 等级付费转化率 = 当前等级付费用户数 / 当前等级用户总数
    • 等级人均付费次数 = 当前等级用户付费总次数 / 当前等级付费用户数
    • 等级人均付费总额 = 当前等级用户付费总额 / 当前等级付费用户数

    对于付费转化率高的等级,可以针对性加强消费引导和曝光;在付费转化率较低的等级,可以使玩家平滑过渡,虽然不产生付费,但可以有效避免玩家流失。


    四、卸载客户端的用户流失分析

    卸载客户端的玩家一般是真正的流失,回流的可能性很小,因此分析卸载客户端的用户,定位流失用户是非常准确的,也是流失用户分析的一个重要组成部分。
    主要采用对比分析、结构分析、交叉分析方法,比较重要的分析指标有客户端卸载率、卸载客户端的原因、卸载客户端账号游戏行为。


    五、总结:5W1H分析法分析用户流失

    1. 发生了什么(What):指将近20万的官方平台用户在游戏公测7天后流失,流失率达35%。
    2. 在哪里流失(Where):上海的上班族用户流失率最高,为77%。15级流失用户主要在海盗地图流失。
    3. 什么人流失(Who):新用户流失比较多,达79%。游戏职业1和职业2的流失人数较多。上班族和学生的流失比例为55∶45,上班族在周末的流失率较工作日减少3%。
    4. 什么时候流失(When):主要是新手期玩家和高级期玩家流失,新手期玩家主要集中在6级、15级流失。高级期玩家主要集中在55级流失。
    5. 为什么流失(Why):新手期玩家是因为任务A和任务B给他们造成了困拢,高级期玩家主要是因为好友流失,游戏热情降低。职业1流失较多是因为防御能力较弱,职业2是因为该职业对玩家站位的要求较高。因为工作比较忙、没时间而流失的玩家占比超过30%。

    参考文献:《游戏数据分析实战》——黎湘艳,叶洋 著

    展开全文
  • 网站/APP 流量分析用户访问分析 网站/APP 流量分析、点击流分析用户访问分析 网站埋点+网站日志自定义采集系统+nginx的相关安装 1.点击流数据模型 1.点击流概念 点击流(Click Stream)是指用户在...
  • 大数据实战:知乎百万用户分析

    万次阅读 2018-04-18 12:11:30
    这次我将利用知乎用户的数据,从数据分析的角度,以用户、区域、行业、专业、大学、喜欢数、粉丝数和性别为交叉对比展开分析,因为我迫切想知道,那些大 V 从哪来,做了什么事,是个什么背景等等像打了马赛克一样的...
  • 最近有些忙,但是看到了很好的分析模型也要跟大家分享的,这篇博客有些粗糙,主要是po上一些链接供大家学习,有时间的话,我也会写出自己关于用户行为分析的理解的。 下面是关于用户行为分析常见的分析维度,有助于...
  • 大数据背景下互联网用户行为分析

    千次阅读 2018-03-29 11:03:34
    原文地址:https://blog.csdn.net/sinat_22659313/article/details/53420492一、用户行为分析概念:是指在获得网站访问量基本数据的情况下,对有关数据进行统计、分析,从中发现用户访问网站的规律,并将这些规律与...
  • 用户画像分析总结

    万次阅读 2018-12-11 16:57:45
    通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特征标识。通过打标签可以利用一些高度概括、容易理解的特征来描述用户,可以让人更容易理解用户,并且可以方便计算机处理。 用户画像是对...
  • 哔哩哔哩用户需求分析报告

    万次阅读 多人点赞 2020-05-03 18:42:57
    先说总结与建议 根据需求优先级列表排序和用户需求...针对弹幕等UGC内容,通过技术手段加强内部审核,并激励外部用户举报反馈,打造清朗的社区文化环境,满足用户的优质的内容需求和社交文化需求; 功能方面 ...
  • 六种常见的「用户行为」分析方法

    千次阅读 2020-04-10 23:20:24
    日常的用户行为分析中,常用的六大分析方法有:行为事件分析页面点击分析用户行为路径分析用户健康度分析漏斗模型分析用户画像分析用户分析能够更好地了解用户的行为习惯,发现产品在推广、拉新、用户...
  • 完整可运行的python代码。 数据过滤,清洗,分割,特征选择,训练词向量模型,测试等等, 每行都有注释,真实的数据集超过20w条,是个不错的nlp入门例子。
  • Python大数据-对淘宝用户的行为数据分析

    千次阅读 多人点赞 2022-01-07 17:43:38
    数据获取 本次数据是在网上获取的来源于: 数据集-阿里云天池 ,不在进行抓取或收集,大家可以看这篇文章Python爬虫-抓取数据到可视化全流程的实现,详细的写了数据抓取的过程 数据清洗 首先该数据是在多个文件下...
  • 用户流失分析

    万次阅读 2018-04-17 10:21:13
    用户流失预警模型的建立小白学数据分析----->流失分析设计用户的召回与促活:多案例深度解析用户的流失与激活转赞自知乎作者:王玮链接:https://www.zhihu.com/question/26225801/answer/33133761来源:知乎...
  • 本文从RFM模型概念入手,结合实际案例,详解Python实现...RFM,是一种经典到头皮发麻的用户分类、价值分析模型,同时,这个模型以直白著称,直白到把需要的字段写在了脸上,让我们再念一遍:“R!F!M!”: R,R...
  • 如果希望DAU更反映有效登录用户,则可以使用“登录时长超过1分钟的用户”;如果是角色扮演游戏,还可以使用“账号数”、“角色数”等指标;也可以使用唯一指标表示,比如日活设备数。 1. 如何理解DAU反映了哪些问题...
  • 万字详解用户行为分析

    千次阅读 2022-04-02 00:48:20
    本次分析的目的是想通过对淘宝用户行为进行数据分析,为以下问题提供解释和改进建议:(1)分析用户使用APP过程中的常见电商分析指标,确定各个环节的流失率。(2)利用假设检验思想分析流失原因,找到需要改进的...
  • 新氧数据化运营已覆盖市场分析、同业分析与经营分析,可助力用户做出更具竞争力及差异化的决策。 新氧可产出消费规模、品类热度等在内的市场数据,帮助用户快速把握市场趋势。而在更具体的同业分析上,新氧则帮助...
  • 电商用户行为数据分析

    万次阅读 多人点赞 2019-05-15 20:00:54
    本文针对淘宝app的运营数据,以行业常见指标对用户行为进行分析,包括 一、提出问题 1.电商常用分析体系 2.电商常用分析指标 3.本次分析的业务问题以及分析逻辑 本次想通过对淘宝用户行为数据的分析,解决...
  • 1,前言:针对用户增长分析这个课题,本文主要从用户防流失的角度,阐述如何基于QQ社交网络数据构建用户流失预警模型,找出高潜流失用户,用于定向开展运营激活,从而有效控制用户流失风险,提升大盘用户的留存率和...
  • 移动APP用户行为分析

    千次阅读 2017-01-22 09:53:55
    一、用户行为分析需要解决3个问题 什么样的用户用户从何而来?用户来到产品里做了什么?(合适来,何时走) 用户从何而来属于渠道范畴,PC互联网产品与移动互联网产品在推广上存在区别,移动互联网更多的是在...
  • 用户行为分析模型——RFM模型

    万次阅读 多人点赞 2019-07-10 16:34:54
    用户行为分析模型——RFM模型1. RFM模型 1. RFM模型        RFM模型根据客户活跃程度和交易金额的贡献,进行客户价值细分的一种方法。 R(Recency)——最近一次交易时间间隔。基于最近一次...
  • 电商用户行为分析需求分析说明书 项目名称: 电商用户行为分析 修订时间: 2021-05-28 修订版本: 3.0 一、引言 1.目的 通过编写需求分析文档,对基于电商数据的用户行为分析系统进行介绍,使得文档的目标阅读人员...
  • 在互联网行业普遍产品的数据分析中,我认为用户行为分析最重要的三个点是渠道分析、转化分析和留存分析。  用户行为数据分析最重要的三个点:渠道分析、转化分析和留存分析。  了解Growth Hacker(增长黑客)的...
  • 用户分析(或帐户分析),是指对用户、帐户明细数据进行统计分析计算。常见的有:用户行为分析、银行帐户统计、漏斗转化率、保险单分析等等。
  • 【去哪儿旅行】产品分析报告

    万次阅读 2019-09-10 16:06:30
    一.产品基本信息 ...数据显示,在线旅游APP的用户规模保持持续增长,同时用户使用时长也正稳步提高。可以预知的是,未来旅游APP市场将继续稳步增长,APP如何完善和推广产品,留住老用户,同时吸...
  • 电力窃漏电用户自动识别 参考书:《Python数据分析与挖掘实战》 工具:Pycharm2019.2.2 + Anaconda3(导入需要的库及Python.exe) 新建工程如下: 1.背景与数据分析目的 a.通过电力系统采集到的数据,提取出窃漏电...
  • 大数据下,用户分析的核心是什么? ——解决实际问题 确定用户分析目的,具体是为了降低成本?增加收入?优化用户体验?提升营销效果?用户针对性管理? 确定目的后开始选择合适的数据,然后搭建模型,最后得出...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 2,267,020
精华内容 906,808
关键字:

用户分析

友情链接: windfarm_windspeed.rar