精华内容
下载资源
问答
  • 用户画像就是根据用户特征、业务场景和用户行为等信息,构建一个标签化的用户模型。简而言之,用户画像就是将典型用户信息标签化。在金融领域,构建用户画像变得很重要。比如金融公司会借助用户画像,采取垂直或精准...

    用户画像就是根据用户特征、业务场景和用户行为等信息,构建一个标签化的用户模型。简而言之,用户画像就是将典型用户信息标签化。

    在金融领域,构建用户画像变得很重要。比如金融公司会借助用户画像,采取垂直或精准营销的方式,来了解客户、挖掘潜在客户、找到目标客户、转化用户。

    以某P2P公司智投产品搞的投资返现活动为例,通过建立用户画像,来避免大量烧钱的运营行为。经过分析得知,出借人A的复投意愿概率为45%,出借人B的复投意愿概率为88%。为了提高平台成交量,在没有建立用户画像前,我们可能会对出借人A和B实行同样的投资返现奖励,但分析结果是,只需激励出借人A进行投资,从而节约了运营成本。此外,我们在设计产品时,也可以根据用户差异化分析去做针对性的改进。

    对产品经理而言,掌握用户画像的搭建方法,即了解用户画像架构,是做用户研究前必须要做的事情。

    58ba6e636ce9bc0cb4674f8bcb8b3223.png

    一、收集数据

    收集数据是用户画像中十分重要的一环。用户数据来源于网络,而如何提取有效数据,比如打通平台产品信息,引流渠道用户信息,收集用户实时数据等,这也是产品经理需要思考的问题。

    用户数据分为静态信息数据和动态信息数据。对于一般公司而言,更多是根据系统自身的需求和用户的需要收集相关的数据。

    数据收集主要包括用户行为数据、用户偏好数据、用户交易数据。

    以某跨境电商平台为例,收集用户行为数据:比如活跃人数、页面浏览量PV、访问时长、浏览路径等;收集用户偏好数据:比如登录方式、浏览内容、评论内容、互动内容、品牌偏好等;收集用户交易数据:比如客单价、回头率、流失率、转化率和促活率等。收集这些指标性的数据,方便对用户进行有针对性、目的性的运营。

    708598dd3a53a08d8cccd7a2f92963c4.png

    我们可对收集的数据做分析,让用户信息形成标签化。比如搭建用户账户体系,可自建立数据仓库,实现平台数据共享,或打通用户数据。

    二、行为建模

    行为建模就是根据用户行为数据进行建模。通过对用户行为数据进行分析和计算,为用户打上标签,可得到用户画像的标签建模,即搭建用户画像标签体系。

    标签建模主要是基于原始数据进行统计、分析和预测,从而得到事实标签、模型标签与预测标签。

    3f18fca4865ddb5ab42dbe8cf3bd9823.png

    标签建模的方法来源于阿里巴巴用户画像体系,广泛应用于搜索引擎、推荐引擎、广告投放和智能营销等各种应用领域。

    以今日头条的文章推荐机制为例,通过机器分析提取你的关键词,按关键词贴标签,给文章打上标签,给受众打标签。接着内容投递冷启动,通过智能算法推荐,将内容标签跟观众标签相匹配,把文章推送给对应的人,实现内容的精准分发。

    b38d6c00e00827d5baffa59de6ccccfa.png

    三、构建画像

    用户画像包含的内容并不完全固定,不同企业对于用户画像有着不同对理解和需求。根据行业和产品的不同,所关注的特征也有不同,但主要还是体现在基本特征、社会特征、偏好特征、行为特征等。

    cbd39256a509d695b802a9aa2ffae37d.png

    用户画像的核心是为用户打标签。即将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。

    以李二狗的户画像为例,我们将其年龄、性别、婚否、职位、收入、资产标签化,通过场景描述,挖掘用户痛点,从而了解用户动机。其中将21~30岁最为一个年龄段,薪资20~25K作为一个收入范围,利用数据分析得到数据标签结果,最终满足业务需求,从而让构建用户画像形成一个闭环。

    41e103f3ff279e58dac23d6b3e772b52.png

    用户画像作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,被应用在精准营销、用户分析、数据挖掘、数据分析等。

    总而言之,用户画像根本目的就是寻找目标客户、优化产品设计,指导运营策略,分析业务场景和完善业务形态。

    作者:朱学敏 资深产品经理

    展开全文
  • 如何做用户画像分析?用户画像分析的作用有哪些?本期,我们就给大家分享一下用户画像的相关知识点,欢迎补充交流。1、用户画像分析的基本要素用户分析可以从其社会属性、心理属性、兴趣特征、消费特征、位置特征、...

    我们在推广一个产品的时候,需要对产品用户有一个深入的了解。那么用户画像的维度包括哪些方面?怎么进行目标人群的画像分析?用户画像分析的要素包括哪些方面?如何做用户画像分析?用户画像分析的作用有哪些?本期,我们就给大家分享一下用户画像的相关知识点,欢迎补充交流。

    1、用户画像分析的基本要素

    用户分析可以从其社会属性、心理属性、兴趣特征、消费特征、位置特征、设备特征、行为数据、社交数据等维度进行分析。

    ①社会属性:包括年龄、性别、地域、血型、受教育程度、职业、收入、家庭状况、身高、体重等基本信息;

    ②心理属性:包括性格、能力、气质、价值观、情感、思维等;

    ③兴趣特征:浏览内容、收藏内容、阅读咨询、购买物品偏好等;

    ④消费特征:与消费相关的特征,通常以收入多少来划分;

    ⑤位置特征:用户所处城市、所处居住区域、用户移动轨迹等;

    ⑥设备属性:使用的终端特征等,如手机品牌、安卓还是iso系统、移动还是PC端、使用4G还是wifi等;

    ⑦行为数据:访问记录、访问时间、浏览路径等用户在网站的行为日志数据;

    ⑧社交数据:用户社交相关数据,包括圈子、兴趣喜好、互动行为等;

    2、用户画像分析的作用

    总体来说,用户画像可以围绕产品进行人群细分,确定产品的核心人群,从而有助于确定产品定位,优化产品的功能点。同时,也可以帮助企业进行市场洞察、预估市场规模,从而辅助制定阶段性目标,指导重大决策,提升ROI;更有助于避免同质化,进行个性化营销。用户画像分析的作用主要体现在以下5个方面:

    ①精准营销:根据历史用户特征,分析产品的潜在用户和用户的潜在需求,针对特定群体,利用短信、邮件等方式进行营销;

    ②用户统计:根据用户的属性、行为特征对用户进行分类后,统计不同特征下的用户数量、分布;分析不同用户画像群体的分布特征;

    ③数据挖掘:以用户画像为基础构建推荐系统、搜索引擎、广告投放系统,提升服务精准度;

    ④服务产品:对产品进行用户画像,对产品进行受众分析,更透彻地理解用户使用产品的心理动机和行为习惯,完善产品运营,提升服务质量;

    ⑤行业报告&用户研究:通过用户画像分析可以了解行业动态,比如人群消费习惯、消费偏好分析、不同地域品类消费差异分析;

    简单来说,所谓的用户画像,无非就是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型,也就是将用户信息标签化。我们可以根据这些标签,建立用户画像进行精准营销,进而不断提高广告投放的转化率。

    【原创】  &nbsp本篇文章属于爱盈利原创,如需转载:1、网站端请注明出处,并在文章中附带原文链接。2、微信公号及其他自媒体平台需联系授权方可,未经授权严禁转载!

    展开全文
  • 你是否有过类似经历:当在购物网站有过一次购物或者搜索经历后,网站会为你推送各种同类型替代产品或者互补商品;...当你打开新闻APP时,系统...其实这一切,都是基于用户画像的精准化营销的常见套路。在互联网大数据...

    你是否有过类似经历:当在购物网站有过一次购物或者搜索经历后,网站会为你推送各种同类型替代产品或者互补商品;当你成为某消费品牌的注册会员后,特殊的日子(比如生日、会员日)会收到品牌商发来的祝福短信以及优惠券;当你打开新闻APP时,系统总是可以为你推送符合个人喜好的内容;当你去到一个新的地方旅游时,与衣食住行相关的推送信息总是如期而至。

    其实这一切,都是基于用户画像的精准化营销的常见套路。

    在互联网大数据时代,全社会信息化程度越来越高,无处不在的网络将人和设备连接在一起,用户的一切行为都是可追溯和分析的。随着大数据技术的深入应用,企业也日益聚焦在如何利用大数据来为精细化运营和精准营销服务,而要实现这些目标的前提基础,首先则需要建立一套完善的用户画像。

    1、什么是用户画像

    用户画像,即将用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌。

    49f59be25dbd45fe78a6ba22f8f75f71.png

    2、用户画像的构建过程

    用户画像的构建过程其实就是对用户“打标签”,其过程可以拆分为以下几个关键步骤:

    3eccb2f3a73b85e4922eb4b692bd25a2.png

    1、确定对象

    用户画像首先是基于业务模型的,所以进行标签建设,首先要清楚对哪类对象建设标签。对象是客观世界中研究目标的抽象,有实体的对象,也有虚拟的对象。在企业经营过程中可以抽象出非常多的对象,包括“人”“物”“关系”,这些对象在不同的业务场景下交叉产生联系,是企业的重要的资产,需要全面刻画了解。

    2、对象ID打通

    在确认对象后,由于存在同一个对象在多个不同业务中的标识ID不同的情况,因此需要将同一个具体对象的不同ID标识打通,以便所有业务数据都能在该对象上打通,完成对该对象的全面数据刻画。

    3、标签类目设计、标签设计

    企业业务需要使用的标签项比较多时,就会给使用、查找以及管理标签带来麻烦,这种情况下就需要对标签类目进行设计,比如构建多级目录分类管理,保证标签类目的易理解、易使用、易管理。

    通过标签类目设计,已经有了某类对象的标签体系框架,只是还没有具体的标签内容。标签设计就是设计合适的标签并将其挂载到标签类目。

    2acf7f23a18a495ed80c0d9793ca83e8.png

    4、标签融合表设计、标签融合表实现

    对象的标签体系是对象有价值数据的全域标签,跨业务板块、跨主题,比如用户属性、用户行为、用户消费、风险控制、社交属性等都是标签,在设计标签融合表时可以选择二维表或者K-V表的组织方式,因为二维表更能满足性能和易用性的要求,所以推荐使用二维表作为标签融合表的实现方式。在大数据场景下,如果标签众多,可以通过多张融合表来存储标签。

    5、作业流程调度、开发性能调优

    完成标签融合表设计后,就需要添加ETL作业流程调度,并针对调度过程进行性能调优,同时配置相应的质量监控和报警机制,持续进行任务运维监控。

    6、上线应用

    完成所有测试后,将验证合格的系统部署到正式环境,并开放给业务人员使用。

    3、用户画像应用

    1、实现精准化营销

    实现精准化营销精准化营销具有极强的针对性,是企业和用户之间点对点的交互。精准营销不但可以让营销变得更加高效,也能为企业节约成本,文章开头的几个场景均是精准营销的典型场景。

    2、指导产品研发以及优化用户体验

    在过去较为传统的生产模式中,企业始终奉行着“生产什么就卖什么给用户”的原则,这种闭门造车的产品开发模式,常常会产生“做出来的东西用户完全不买账”的情况。如今,“用户需要什么企业就生产什么”成为主流,越来越多的企业把用户的真实需求摆在了最重要的位置。

    在用户需求为导向的产品研发中,企业通过获取到的大量目标用户数据,进行分析、处理、组合,初步搭建用户画像,做出用户喜好、功能需求统计,从而设计制造更加符合核心需要的新产品,为用户提供更加良好的体验和服务。

    3、做相关的分类统计

    基于用户画像的信息标签,借助永洪BI,通过简单的拖拽操作,就可以快速制作出各种满足业务需要的可视化分析报告,再通过数据过滤、多维钻取分析、数据高亮分析、趋势分析、目标值分析、聚焦分析等永洪内置功能,获取隐藏在数据背后的价值,提高整体决策效率和决策水平,为业务增长注入动力。

    5eccac02056034a4a8ab807cc12496c7.png

    4、做相关的数据挖掘

    在用户画像数据的基础上,借助永洪深度分析模块,可以选择如一元线性回归、逻辑回归、K-means聚类、HoltWinters时序分析、关联分析、决策树等各种经典机器学习算法,通过简单的可视化操作,即可轻松构建机器学习模型,完成预测分析。下图就是通过关联规则计算,由A联想到B,也就是著名的“啤酒和尿布”的故事。

    89f42ac833b2a61aa16e62eea6dc2c4d.png
    881df3610c492b481fcd036b63a8ed12.png
    展开全文
  • 如何做用户画像,收藏!

    千次阅读 2020-08-05 06:45:00
    导读:在互联网步入大数据时代后,用户行为给企业的产品和服务带来了一系列的改变和重塑,其中最大的变化在于,用户的一切行为在企业面前是可“追溯”“分析”的。企业内保存了大量的原始数据和各种业...

    导读:在互联网步入大数据时代后,用户行为给企业的产品和服务带来了一系列的改变和重塑,其中最大的变化在于,用户的一切行为在企业面前是可“追溯”“分析”的。企业内保存了大量的原始数据和各种业务数据,这是企业经营活动的真实记录,如何更加有效地利用这些数据进行分析和评估,成为企业基于更大数据量背景的问题所在。随着大数据技术的深入研究与应用,企业的关注点日益聚焦在如何利用大数据来为精细化运营和精准营销服务,而要做精细化运营,首先要建立本企业的用户画像。

    01

    画像简介

    用户画像,即用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌,如图1-1所示。用户画像可看作企业应用大数据的根基,是定向广告投放与个性化推荐的前置条件,为数据驱动运营奠定了基础。由此看来,如何从海量数据中挖掘出有价值的信息越发重要。

    图1-1 某用户标签化

    大数据已经兴起多年,其对于互联网公司的应用来说已经如水、电、空气对于人们的生活一样,成为不可或缺的重要组成部分。从基础设施建设到应用层面,主要有数据平台搭建及运维管理、数据仓库开发、上层应用的统计分析、报表生成及可视化、用户画像建模、个性化推荐与精准营销等应用方向。

    很多公司在大数据基础建设上投入很多,也做了不少报表,但业务部门觉得大数据和传统报表没什么区别,也没能体会大数据对业务有什么帮助和价值,究其原因,其实是“数据静止在数据仓库,是死的”。

    而用户画像可以帮助大数据“走出”数据仓库,针对用户进行个性化推荐、精准营销、个性化服务等多样化服务,是大数据落地应用的一个重要方向。数据应用体系的层级划分如图1-2所示。

    图1-2 数据应用体系的层级划分

    标签类型:

    用户画像建模其实就是对用户“打标签”,从对用户打标签的方式来看,一般分为3种类型(如图1-3所示):①统计类标签;②规则类标签;③机器学习挖掘类标签。

    图1-3 标签类型

    下面我们介绍这3种类型的标签的区别:

    ① 统计类标签

    这类标签是最为基础也最为常见的标签类型,例如,对于某个用户来说,其性别、年龄、城市、星座、近7日活跃时长、近7日活跃天数、近7日活跃次数等字段可以从用户注册数据、用户访问、消费数据中统计得出。该类标签构成了用户画像的基础。

    ② 规则类标签

    该类标签基于用户行为及确定的规则产生。例如,对平台上“消费活跃”用户这一口径的定义为“近30天交易次数≥2”。在实际开发画像的过程中,由于运营人员对业务更为熟悉,而数据人员对数据的结构、分布、特征更为熟悉,因此规则类标签的规则由运营人员和数据人员共同协商确定;

    ③ 机器学习挖掘类标签

    该类标签通过机器学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断。例如,根据一个用户的行为习惯判断该用户是男性还是女性、根据一个用户的消费习惯判断其对某商品的偏好程度。该类标签需要通过算法挖掘产生。

    在项目工程实践中,一般统计类和规则类的标签即可以满足应用需求,在开发中占有较大比例。机器学习挖掘类标签多用于预测场景,如判断用户性别、用户购买商品偏好、用户流失意向等。一般地,机器学习标签开发周期较长,开发成本较高,因此其开发所占比例较小。

    02

    数据架构

    在整个工程化方案中,系统依赖的基础设施包括Spark、Hive、HBase、Airflow、MySQL、Redis、Elasticsearch。除去基础设施外,系统主体还包括Spark Streaming、ETL、产品端3个重要组成部分。图1-4所示是用户画像数仓架构图,下面对其进行详细介绍。

    图1-4 用户画像数仓架构

    图1-4下方虚线框中为常见的数据仓库ETL加工流程,也就是将每日的业务数据、日志数据、埋点数据等经过ETL过程,加工到数据仓库对应的ODS层、DW层、DM层中。

    中间的虚线框即为用户画像建模的主要环节,用户画像不是产生数据的源头,而是对基于数据仓库ODS层、DW层、DM层中与用户相关数据的二次建模加工。在ETL过程中将用户标签计算结果写入Hive,由于不同数据库有不同的应用场景,后续需要进一步将数据同步到MySQL、HBase、Elasticsearch等数据库中。

    • Hive:存储用户标签计算结果、用户人群计算结果、用户特征库计算结果。

    • MySQL:存储标签元数据,监控相关数据,导出到业务系统的数据。

    • HBase:存储线上接口实时调用类数据。

    • Elasticsearch:支持海量数据的实时查询分析,用于存储用户人群计算、用户群透视分析所需的用户标签数据(由于用户人群计算、用户群透视分析的条件转化成的SQL语句多条件嵌套较为复杂,使用Impala执行也需花费大量时间)。

    用户标签数据在Hive中加工完成后,部分标签通过Sqoop同步到MySQL数据库,提供用于BI报表展示的数据、多维透视分析数据、圈人服务数据;另一部分标签同步到HBase数据库用于产品的线上个性化推荐。

    03

    主要覆盖模块

    搭建一套用户画像方案整体来说需要考虑8个模块的建设,如图1-5所示。

    • 用户画像基础:需要了解、明确用户画像是什么,包含哪些模块,数据仓库架构是什么样子,开发流程,表结构设计,ETL设计等。这些都是框架,大方向的规划,只有明确了方向后续才能做好项目的排期和人员投入预算。这对于评估每个开发阶段重要指标和关键产出非常重要,重点可看1.4节。

    • 数据指标体系:根据业务线梳理,包括用户属性、用户行为、用户消费、风险控制等维度的指标体系。

    • 标签数据存储:标签相关数据可存储在Hive、MySQL、HBase、Elasticsearch等数据库中,不同存储方式适用于不同的应用场景。

    • 标签数据开发:用户画像工程化的重点模块,包含统计类、规则类、挖掘类、流式计算类标签的开发,以及人群计算功能的开发,打通画像数据和各业务系统之间的通路,提供接口服务等开发内容。

    图1-5 用户画像主要覆盖模块

    • 开发性能调优:标签加工、人群计算等脚本上线调度后,为了缩短调度时间、保障数据的稳定性等,需要对开发的脚本进行迭代重构、调优。

    • 作业流程调度:标签加工、人群计算、同步数据到业务系统、数据监控预警等脚本开发完成后,需要调度工具把整套流程调度起来。本书讲解了Airflow这款开源ETL工具在调度画像相关任务脚本上的应用。

    • 用户画像产品化:为了能让用户数据更好地服务于业务方,需要以产品化的形态应用在业务上。产品化的模块主要包括标签视图、用户标签查询、用户分群、透视分析等。

    • 用户画像应用:画像的应用场景包括用户特征分析、短信、邮件、站内信、Push消息的精准推送、客服针对用户的不同话术、针对高价值用户的极速退货退款等VIP服务应用。

    04

    开发阶段流程

    本节主要介绍画像系统开发上线的流程以及各阶段的关键产出。

    1. 开发上线流程

    用户画像建设项目流程,如图1-6所示。

    图1-6 用户画像建设项目流程

    第一阶段:目标解读

    在建立用户画像前,首先需要明确用户画像服务于企业的对象,再根据业务方需求,明确未来产品建设目标和用户画像分析之后的预期效果。

    一般而言,用户画像的服务对象包括运营人员和数据分析人员。不同业务方对用户画像的需求有不同的侧重点,就运营人员来说,他们需要分析用户的特征、定位用户行为偏好,做商品或内容的个性化推送以提高点击转化率,所以画像的侧重点就落在了用户个人行为偏好上;就数据分析人员来说,他们需要分析用户行为特征,做好用户的流失预警工作,还可根据用户的消费偏好做更有针对性的精准营销。

    第二阶段:任务分解与需求调研

    经过第一阶段的需求调研和目标解读,我们已经明确了用户画像的服务对象与应用场景,接下来需要针对服务对象的需求侧重点,结合产品现有业务体系和“数据字典”规约实体和标签之间的关联关系,明确分析维度。就后文将要介绍的案例而言,需要从用户属性画像、用户行为画像、用户偏好画像、用户群体偏好画像等角度去进行业务建模。

    第三阶段:需求场景讨论与明确

    在本阶段,数据运营人员需要根据与需求方的沟通结果,输出产品用户画像需求文档,在该文档中明确画像应用场景、最终开发出的标签内容与应用方式,并就该文档与需求方反复沟通并确认无误。

    第四阶段:应用场景与数据口径确认

    经过第三个阶段明确了需求场景与最终实现的标签维度、标签类型后,数据运营人员需要结合业务与数据仓库中已有的相关表,明确与各业务场景相关的数据口径。在该阶段中,数据运营方需要输出产品用户画像开发文档,该文档需要明确应用场景、标签开发的模型、涉及的数据库与表以及应用实施流程。该文档不需要再与运营方讨论,只需面向数据运营团队内部就开发实施流程达成一致意见即可。

    第五阶段:特征选取与模型数据落表

    本阶段中数据分析挖掘人员需要根据前面明确的需求场景进行业务建模,写好HQL逻辑,将相应的模型逻辑写入临时表中,并抽取数据校验是否符合业务场景需求。

    第六阶段:线下模型数据验收与测试

    数据仓库团队的人员将相关数据落表后,设置定时调度任务,定期增量更新数据。数据运营人员需要验收数仓加工的HQL逻辑是否符合需求,根据业务需求抽取表中数据查看其是否在合理范围内,如果发现问题要及时反馈给数据仓库人员调整代码逻辑和行为权重的数值。

    第七阶段:线上模型发布与效果追踪

    经过第六阶段,数据通过验收之后,会通过Git进行版本管理,部署上线。使用Git进行版本管理,上线后通过持续追踪标签应用效果及业务方反馈,调整优化模型及相关权重配置。

    2. 各阶段关键产出

    为保证程序上线的准时性和稳定性,需要规划好各阶段的任务排期和关键产出。画像体系的开发分为几个主要阶段,包括前期指标体系梳理、用户标签开发、ETL调度开发、打通数据服务层、画像产品端开发、面向业务方推广应用、为业务方提供营销策略的解决方案等,如表1-1所示。

    表1-1 用户画像项目各阶段关键产出

    • 标签开发:根据业务需求和应用场景梳理标签指标体系,调研业务上定义的数据口径,确认数据来源,开发相应的标签。标签开发在整个画像项目周期中占有较大比重。

    • ETL调度开发:梳理需要调度的各任务之间的依赖关系,开发调度脚本及调度监控告警脚本,上线调度系统。

    • 打通服务层接口:为了让画像数据走出数据仓库,应用到用户身上,需要打通数据仓库和各业务系统的接口。

    • 画像产品化:需要产品经理与业务人员、技术开发人员一起对接业务需求点和产品功能实现形式,画产品原型,确定工作排期。Java Web端开发完成后,需要数据开发人员向对应的库表中灌入数据。

    • 开发调优:在画像的数据和产品端搭建好架构、能提供稳定服务的基础上,为了让调度任务执行起来更加高效、提供服务更加稳健,需要对标签计算脚本、调度脚本、数据同步脚本等相关计算任务进行重构优化。

    • 面向业务方推广应用:用户画像最终的价值产出点是业务方应用画像数据进行用户分析,多渠道触达运营用户,分析ROI,提升用户活跃度或营收。因此,面向业务人员推广画像系统的使用方式、提供针对具体业务场景的解决方案显得尤为重要。在该阶段,相关人员需要撰写画像的使用文档,提供业务支持。

    05

    画像应用的落地

    用户画像最终的价值还是要落地运行,为业务带来实际价值。这里需要开发标签的数据工程师和需求方相互协作,将标签应用到业务中。否则开发完标签后,数据还是只停留在数据仓库中,没有为业务决策带来积极作用。

    画像开发过程中,还需要开发人员组织数据分析、运营、客服等团队的人员进行画像应用上的推广。对于数据分析人员来说,可能会关注用户画像开发了哪些表、哪些字段以及字段的口径定义;对运营、客服等业务人员来说,可能更关注用户标签定义的口径,如何在Web端使用画像产品进行分析、圈定用户进行定向营销,以及应用在业务上数据的准确性和及时性。

    只有业务人员在日常工作中真正应用画像数据、画像产品,才能更好地推动画像标签的迭代优化,带来流量提升和营收增长,产出业绩价值。

    06

    某用户画像案例

    这里通过一个实践案例来将大家更好地带入实际开发画像、应用画像标签的场景中。本节主要介绍案例背景及相关的元数据,以及开发标签中可以设计的表结构样式。

    在本案例的开发工作中,基于Spark计算引擎,主要涉及的语言包括HiveQL、Python、Scala、Shell等。

    1. 案例背景介绍

    某图书电商网站拥有超过千万的网购用户群体,所售各品类图书100余万种。用户在平台上可进行浏览、搜索、收藏、下单、购买等行为。商城的运营需要解决两个问题:一方面在企业产品线逐渐扩张、信息资源过载的背景下,如何在兼顾自身商业目标的同时更好地满足消费者的需求,为用户带来更个性化的购物体验,通过内容的精准推荐,更好地提高用户的点击转化率;另一方面在用户规模不断增长的背景下,运营方考虑建立用户流失预警机制,及时识别将要流失的用户群体,采取运营措施挽回用户。

    商城自建立以来,数据仓库中积累着大量的业务数据、日志数据及埋点数据。如何充分挖掘沉淀在数据仓库中的数据的价值,有效支持用户画像的建设,成为当前的重要工作。

    2. 相关元数据

    在本案例中,可以获取的数据按其类型分为:业务类数据和用户行为数据。其中业务类数据是指用户在平台上下单、购买、收藏物品、货物配送等与业务相关的数据;用户行为数据是指用户搜索某条信息、访问某个页面、点击某个按钮、提交某个表单等通过操作行为产生(在解析日志的埋点表中)的数据。

    涉及数据仓库中的表主要包括用户信息表、商品订单表、图书信息表、图书类目表、App端日志表、Web端日志表、商品评论表等。下面就用户画像建模过程中会用到的一些数据表做详细介绍。

    ① 用户信息表

    用户信息表(见表1-2)存放有关用户的各种信息,如用户姓名、年龄、性别、电话号码、归属地等信息。

    表1-2 用户信息表(dim.user_basic_info)

    ② 商品订单表

    商品订单表(见表1-3)存放商品订单的各类信息,包括订单编号、用户id、用户姓名、订单生成时间、订单状态等信息。

    表1-3 商品订单表(dw.order_info_fact)

    ③ 埋点日志表

    埋点日志表(见表1-4)存放用户访问App时点击相关控件的打点记录。通过在客户端做埋点,从日志数据中解析出来。

    表1-4 埋点日志表(ods.page_event_log)

    ④ 访问日志表

    访问日志表(见表1-5)存放用户访问App的相关信息及用户的LBS相关信息,通过在客户端埋点,从日志数据中解析出来。

    表1-5 访问日志表(ods.page_view_log)

    ⑤ 商品评论表

    商品评论表(见表1-6)存放用户对商品的评论信息。

    表1-6 商品评论表(dw.book_comment)

    ⑥ 搜索日志表

    搜索日志表(见表1-7)存放用户在App端搜索相关的日志数据。

    表1-7 搜索日志表(dw.app_search_log)

    ⑦ 用户收藏表

    用户收藏表(见表1-8)记录用户收藏图书的数据。

    表1-8 用户收藏表(dw.book_collection_df)

    ⑧ 购物车信息表

    购物车信息表(见表1-9)记录用户将图书加入购物车的数据。

    表1-9 购物车信息表(dw.shopping_cart_df)

    3. 画像表结构设计

    表结构设计也是画像开发过程中需要解决的一个重要问题。

    表结构设计的重点是要考虑存储哪些信息、如何存储(数据分区)、如何应用(如何抽取标签)这3个方面的问题。

    不同业务背景有不同的设计方式,这里提供两种设计思路:一是每日全量数据的表结构;二是每日增量数据的表结构。

    Hive需要对输入进行全盘扫描来满足查询条件,通过使用分区可以优化查询。对于用户标签这种日加工数据,随着时间的推移,分区数量的变动也是均匀的。

    每日全量数据,即该表的日期分区中记录着截止到当天的全量用户数据。例如,“select  count(*)  from userprofile  where data='20180701'”这条语句查询的是userprofile表截止到2018年7月1日的全量用户数据。日全量数据的优势是方便查询,缺点是不便于探查更细粒度的用户行为。

    每日增量数据,即该表的日期分区中记录着当日的用户行为数据。例如,同样是“select count(*) from userprofile where data='20180701'”,这条语句查询的是userprofile表在2018年7月1日记录的当日用户行为数据。日增量数据可视为ODS层的用户行为画像,在应用时还需要基于该增量数据做进一步的建模加工。

    下面详细介绍这两种表结构的设计方法。

    ① 日全量数据

    日全量数据表中,在每天对应的日期分区中插入截止到当天为止的全量数据,用户进行查询时,只需查询最近一天的数据即可获得最新全量数据。下面以一个具体的日全量表结构的例子来进行说明。

    这里userid表示用户id,labelweight表示标签权重,theme表示标签归属的二级主题,labelid表示一个标签id。通过“日期 +标签归属的二级主题+标签id”的方式进行分区,设置三个分区字段更便于开发和查询数据。该表结构下的标签权重仅考虑统计类型标签的权重,如:历史购买金额标签对应的权重为金额数量,用户近30日访问天数为对应的天数,该权重值的计算未考虑较为复杂的用户行为次数、行为类型、行为距今时间等复杂情况。

    通过表名末尾追加“_all”的规范化命名形式,可直观看出这是一张日全量表。

    例如,对于主题类型为“会员”的标签,插入“20190101”日的全量数据,可通过语句:

    insert overwrite table dw. userprofile_userlabel_all partition(data_date= '20190101', theme= 'member', labelid='ATTRITUBE_U_05_001')来实现。

    查询截止到“20190101”日的被打上会员标签的用户量,可通过语句:

    select count(distinct userid) from dw.userprofile_userlabel_all where data_date='20190101'来实现。

    ② 日增量数据

    日增量数据表,即在每天的日期分区中插入当天业务运行产生的数据,用户进行查询时通过限制查询的日期范围,就可以找出在特定时间范围内被打上特定标签的用户。下面以一个具体的日增量表结构的例子来说明。

    这里,labelid表示标签名称;cookieid表示用户id;act_cnt表示用户当日行为次数,如用户当日浏览某三级品类商品3次,则打上次数为3;tag_type_id为标签类型,如母婴、3C、数码等不同类型;act_type_id表示行为类型,如浏览、搜索、收藏、下单等行为。分区方式为按日期分区,插入当日数据。

    通过表名末尾追加“_append”的规范化命名形式,可直观看出这是一张日增量表。

    例如,某用户在“20180701”日浏览某3C电子商品4次(act_cnt),即给该用户(userid)打上商品对应的三级品类标签(tagid),标签类型(tag_type_id)为3C电子商品,行为类型(act_type_id)为浏览。这里可以通过对标签类型和行为类型两个字段配置维度表的方式,对数据进行管理。例如对于行为类型(act_type_id)字段,可以设定1为购买行为、2为浏览行为、3为收藏行为等,在行为标签表中以数值定义用户行为类型,在维度表中维护每个数值对应的具体含义。

    该日增量数据表可视为ODS层用户行为标签明细。在查询过程中,例如对于某用户id为001的用户,查询其在“20180701”日到“20180707”日被打上的标签,可通过命令:

    select * from dw.userprofile_act_feature_append where userid = '001' and data_date>='20180701' and data_date<= '20180707'查询。

    该日增量的表结构记录了用户每天的行为带来的标签,但未计算打在用户身上标签的权重,计算权重时还需做进一步建模加工。标签权重算法详见4.6节的内容。

    ③ 关于宽表设计

    用户画像表结构如何设计,没有一定要遵循的固定的格式,符合业务需要、能满足应用即可。下面通过两个宽表设计的案例,提供另一种解决方案的思路。

    用户属性宽表设计(见表1-10),主要记录用户基本属性信息。

    表1-10 用户属性宽表设计

    用户日活跃宽表设计(见表1-11),主要记录用户每天访问的信息。

    表1-11 用户日活跃宽表设计

    07

    定性类画像

    本书重点讲解如何运用大数据定量刻画用户画像,然而对于用户的刻画除了定量维度外,定性刻画也是常见手段。定性类画像多见于用户研究等运营类岗位,通过电话调研、网络调研问卷、当面深入访谈、网上第三方权威数据等方式收集用户信息,帮助其理解用户。这种定性类调研相比大数据定量刻画用户来说,可以更精确地了解用户需求和行为特征,但这个样本量是有限的,得出的结论也不一定能代表大部分用户的观点。

    通过制定调研问卷表,我们可以收集用户基本信息以及设置一个或多个场景,专访用户或网络回收调研问卷,在分析问卷数据后获取用户的画像特征。目前市场上“问卷星”等第三方问卷调查平台可提供用户问卷设计、链接发放、采集数据和信息、调研结果分析等一系列功能,如图1-7所示。

    图1-7 某调研问卷示例(截图自“问卷星”)

    根据回收的调研问卷,可结合统计数据进一步分析用户画像特征(如图1-8所示)。

    图1-8 回收的调研问卷(截图自“问卷星”)

    08

    小结

    本文主要介绍了用户画像的一些基础知识,包括画像的简介、标签类型、整个画像系统的数据架构,开发画像系统主要覆盖的8个模块,以及开发过程中的各阶段关键产出。初步介绍了画像系统的轮廓概貌,帮助读者对于如何设计画像系统、开发周期、画像的应用方式等有宏观的初步的了解。

    ——本文摘自机械工业出版社华章图书

    《用户画像方法论与工程化解决方案》

    作者介绍:

    赵宏田,资深大数据技术专家。擅长Hadoop、Spark等大数据技术,以及业务数据分析、数据仓库开发、爬虫、用户画像系统搭建等。著有畅销书《数据化运营:系统方法与实践案例》 《用户画像:方法论与工程化解决方案》。


    在文末分享、点赞、在看,给个三连击呗~~


    09

    赠书活动

    福利时间:本期活动为大家带来1本正版新书。在文末留言区留言谈谈你对用户画像的看法,2020年8月6日20点前评论留言点赞最多的,赠送正版图书1本。注:等不及的小伙伴也可以点击下面的购买按钮直接拿下哦。

    历史好文推荐

    1. 数据分析为什么火了

    2. 如何入门数据分析?

    3. 你是分析师,还是“提数机”?

    4. 谈谈ETL中的数据质量

    展开全文
  • 构建产品用户画像也是产品经理进行用户研究与分析最常用...(3)如何构建用户画像(how),下文将会对这三部分内容详细介绍。图6-4用户画像的定义与构建方法(1)什么是用户画像用户画像是一种用来描述产品目标用户特征...
  • 导读:在互联网步入大数据时代后,用户行为给企业的产品和服务带来了一系列的改变和重塑,其中最大的变化在于,用户的一切行为在企业面前是可“追溯”“分析”的。企业内保存了大量的原始数据和各种业务数据,这是...
  • 为此我们需要做用户分析,从而得出我们的用户画像,提供解决方案,用户调研是用户分析的一种方法,用户画像是结果,提供解决方案(需求)是用户分析的目的二、如何做用户调研一般先组织内部头脑风暴,初步创建用户...
  • 如何构建用户画像

    2018-10-24 11:28:19
    三、如何构建用户画像 一 个标签通常是人为规定的高度精炼的特征标识,如年龄段标签:25~35岁,地域标签:北京,标签呈现出两个重要特征:语义化,人能很方便地理解每个标签含 义。这也使得用户画像模型具备实际...
  • 如何挖掘用户画像

    2020-08-12 16:45:25
    在当今快节奏的社会,如何做一款最懂用户的互联网产品,让他们用拇指投票是最好的选择(用完即走,下次还来)。 这一篇记录的虽然跟开发没有很大的关系,但我觉得还是有很大的必要写出来,因为只有充分的了解了用户...
  • 如何进行用户画像

    2019-07-31 22:54:24
    对于营销增长的产品,首先需要掌握的就是用户画像的能力。用户行为数据无法直接用于数据分析和模型训练,只有将用户行为标签化之后,才能对用户有一个直观的认识。 用户画像的本质就是给用户打标签,标签通常是...
  • 豌豆荚一直通过绘制用户画像( Persona )来帮助团队更好地理解用户的特征和行为,从而更准确地判断他们面临的问题和真正的痛点。更重要的是:Persona 把抽象的用户变成了一个个具体的人,当我们纠结于产品的某个功能...
  • 上周,Kyligence 的两位资深讲师为大家带来了《如何使用 Kylin 进行海量自定义标签的用户画像分析》线上分享。错过直播的同学可以直接点击此处查看视频和下载演讲资料。 以下为 Q&A 实录 功能原理 Q:...
  • 为此我们需要做用户分析,从而得出我们的用户画像,提供解决方案,用户调研是用户分析的一种方法,用户画像是结果,提供解决方案(需求)是用户分析的目的二、如何做用户调研一般先组织内部头脑风暴,初步创建用户...
  • 用户画像-如何设计

    千次阅读 2017-09-01 10:03:49
    推荐星级:★★★★★  ▌阅读时间:12min  ▌推荐理由:用户画像分析是PM的基本能力,也是优秀运营人的必会技能。... 为什么要做用户画像分析?【干货x1】  用户画像构建的基本流程【干货x1】  Step
  • 那么如果不是你的产品,而是你要研究的产品,你如何确定自己的目标用户,接下来细化就是(什么问题),然后是(什么场景),也就是我们常说的研究产品的用户画像呢?这里要说一下,虽然都叫用户画像,产品设计阶段的...
  • 现代商业离不开对用户的理解,任何业务的决策者都不会希望在认识用户上存在盲区,因此在用研的日常工作中,“一个用户画像”是经常收到的需求。但同样的需求背后,往往对应着不同的目标和问题,搞清楚了解用户能...
  • 有了用户画像,这些问题的答案就变得逐渐清晰起来。那么关键问题来了,用户数据要从哪里获取呢?你可以从CRM系统中寻找,也可以去各种网站收集用户留下的蛛丝马迹,还可以到微博中找到用户属性和对产品的情感倾向,...
  • 复仇者联盟2之用户画像分析

    千次阅读 2015-05-22 11:04:02
    最近很火的《复仇者联盟2》(以下简称复联2)电影,吸引了很多观众观摩,但是看完后却是云里雾里的,以下从用户画像分析上浅谈各位英雄,也借此总结一点产品的角度如何分析用户行为。 见过很多的产品经理会经常说...
  • 本文来自作者罗志恒,文章重点讲解了用户画像在数据分析中的应用;如何构建用户画像。在日常商业活动中,有各种各样的职能划分:增长、内容、活动、产品,虽然具体工作和最终目标不一样,但其实都是围绕着“用户”去...
  • 如何创建定性用户画像

    千次阅读 2015-10-23 11:10:46
    【编者注】我们在做完数据分析模型时,常常会提到用户画像一词,那么定性研究中的用户画像如何做呢?下面来看看中国统计网推荐的来自腾讯CDC的这篇文章,看完后你应该就知道如何在工作中处理类似的问题了。  在...
  • 我们在营销推广、写软文时,总是说要针对目标群体,满足特定需求的那部分人,那么我们如何找到我们的目标用户群体呢?创新营销思维认为可以从这四个维度去分析:1、人设属性人设属性是对目标人群画像的基本框架...
  • 用户画像到底如何使用? 在抛出这个疑问之前,我研究过许多文章,这些文章的研究方向更热衷于如何给用户360度画像,用常见的人物形象...这是一种典型的用户画像,也是许多企业热衷做用户画像分析的方法,这种人物画...
  • 用户画像

    2020-12-04 09:25:09
    随着大数据技术的深入研究与应用,企业的关注点日益聚焦在如何利用大数据来为精细化运营和精准营销服务,而要精细化运营,首先要建立本企业的用户画像。 画像简介 用户画像,即用户信息标签化,通过收集用户的...
  • 然而,在实际的业务中大多数是依靠业务人员或者分析人员的经验去看待,有很多验证方法又不一定适用实际的业务场景,所以在网上一番搜索后在验证思路上有了一些起色,同时也想把这些内容些分享,也希望在这个方向上...
  • 导读:在互联网步入大数据时代后,用户行为给企业的产品和服务带来了一系列的改变和重塑,其中最大的变化在于,用户的一切行为在企业面前是可“追溯”“分析”的。企业内保存了大量的原始数据和各种业务数据,这是...
  • 用户画像该怎么

    2020-04-09 10:22:55
    今天继续分享如何写数据分析报告。之前2期举的例子都是监控数据,监控数据是连续观测,会很明显的看到曲线变动。于是很多同学便问:“静态数据的报告该咋写”。尤其以用户画像报告为甚。很多时候业务提了需求:看看...
  • 2.如何构建用户画像。 干货 | 数据分析用户画像方法与实践 作者:罗志恒 在日常商业活动中,有各种各样的职能划分:增长、内容、活动、产品,虽然具体工作和最终目标不一样,但其实都是围绕着“用户”去,可以说...
  • 用户画像基础

    2021-02-24 03:27:14
    随着大数据技术的深入研究与应用,企业的关注点日益聚焦在如何利用大数据来为精细化运营和精准营销服务,而要精细化运营,首先要建立本企业的用户画像用户画像,即用户信息标签化,通过收集用户的社会属性、消费...

空空如也

空空如也

1 2 3 4 5 6
收藏数 114
精华内容 45
关键字:

如何做用户画像分析