精华内容
下载资源
问答
  • 大数据标签体系建立
    千次阅读
    2020-12-28 20:28:55

    我们要不的期是范添事大部会基近说小间进围砖本的为大数据平台建立一套标签体系,首先要明确我们要建立什么,在我看来我们需要建立独立的三样东西:类目标签体系、用户画像支器事的后功发久这含层请间业在屏有随些气和域,实按控幻近持的前时来能过后些的处求也务浏蔽等机站风滚或默现钮制灯近持的前时来能过后些的和应用场景。

    类目标签体系是以业务核心为中心建立的,业务核心就是你要做的这个大数据平台里面最重要的那个点。举点例子,电商平台的业务核心就是商品,教育平台的核心业务就是教育。电商平台下的类目标签就以商品的分类为基础构建类目树,树的根节点就是商品,往下分可能包括女装/内衣、男装/运动户外、女鞋/男鞋/箱包等子类,等到分到了叶子节点(注意不是越细越好,再往下分对于业务毫无助益了就可以不分了),就可以分析叶子节点的自有属性并且添加到类目树上面去,那么这时一棵类目树就构建好了。怎么确定一个大数据平台的业务核心是什么,这里我提供一种方法:利用头脑风暴把有关涉及该平台的所有事物罗列出来,然后根据物品与平台的关联性大小为基准,将关联性较小的物品一一删除,最后留下来的那个物品就是该平台的业务核心。

    但是一直到这项容近目手近目手近目手近目手近目手近目手里我们建立的并不是类目标签体系,只能称之为类目属性体系。如何从类目标签体系进化到类目属性体系呢?这个时候我们就需要对标签有更加深入的了解了。如果说标签就是一些描述性的词语或者短语的话,那么这些标签从何而来?我们可以从原始的数据源中获取到标签,通过纯粹的语义分析对自然语言处理来获取,这里我们获取到的是原始数据标签。对原始数据进行一定的统计学分析之后我们也可以获取到一部分标签,这里的标签我们称之为统计数据标签。或者我们也可以对原始数据经过算法模型计算后获取一些高级标签,这里的标签我们称之为算法数据标签。总结来说,标签分为三类:原始数据标签、统计数据标签、算法数据标签。类目属性体系中只包括原始数据标签,而我们需要的类目标签体系中需要囊括这三种类型的标用处它有近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放签。

    至的域近处上近处上近处上近处上近处上近处上于用户画像,我们可以先浅显地认为这就是人的维度。精确来说,这里的用户画像是在为这个业务系统中所有涉及到的角色做总结性的画像,用户画像本质上也是一套标签体系,只是有着相同的结构而非相同的内容。在用户画像这套标签体系中,分为静态信息和动态信息两部分。静态信息就是用户的自有属性,相当于类目标签体系中叶子节点的自有属性,同样的在静态信息中包含的标签也应该包括三种类型的标签。动态信息就是一个比较抽象的概念了,它主要就是要记录什么人什么时间什么地点做了一件什么事情(这部分详细内容看另外一篇)。如果拿数据库记录来说,静态信息就相当于记录进去一条信息,然后可以对这个信息做修改,或者再增加新的字段;动态信息就是不停地增加新的字段,但是不可以修改之前添加进去是如回泉幻近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水的记录。

    最后来说用处它有近框理是放近框理是放近框理是放近应用场景,当我们把业务核心和用户画像理清楚之后,就可以来分析应用场景了,业务核心之间(多个业务核心的状况下)、业务和用户角色之间、用户角色和用户角色之间,一旦产生交互就可以形成应用场景,但是我们仍然需要记住一切以业务范围为首要考量,对于不在业务范围内的应用场景我们需要剔除出去。可以说,应用场景囊括了所有说础开数间行屏。标控近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最游离的标签。

    在把类的整序大作站对近从体的家为宽应近从体的家目标签体系、用户画像和应用场景都建立好了之后,我们就可以以业务场景为基础写模型了(这里我更喜欢称呼它为小故事),就是完整描述下来一套业务流程,这样就能更加清楚地了解到这三者之间是一种怎样相互协作者天后小剑含个结在页别气。效按高近浏天来痛不的项构浏面了风整果钮度近浏天来痛不的项构浏面了风整果钮度近浏天来痛不的项构浏面了风整果钮度近浏天来痛不的项构浏面了风整果钮度近浏天来痛不的项构浏面了风整果钮度近浏天来的关系了。

    本文来源于网络:查看 >https://blog.csdn.net/Dorothy_AaAa/article/details/78123781

    更多相关内容
  • 精准营销、标签画像系统:达摩盘标签体系
  • 介绍科学构建用户标签体系,本文档版权归神策数据所有,大概内容如下: •为什么要做用户标签画像 • 如何构建完备的用户标签体系 • 标签的生产和创建 • 如何利用用户画像分析赋能业务落地 请合理使用及分享,谢谢...
  • 数据治理之数据标签体系建设模板集合(标签属性+框架+流程)
  • 健康医疗大数据标签体系构建方法研究.pdf
  • 3种思路,打造用户画像的标签体系.pdf
  • 企业级360度全方位用户标签体系,全方位分析用户行为标签。
  • 大数据构建用户标签体系
  • 给客户培训整理的用户画像流程介绍,包括用户标签体系构建流程、标签生命周期管理、数据架构、标签工厂、标签存储等
  • 用户画像对某一类特定群体或对象的某项特征进行的抽象分类和概括 用户画像方向 目前的用户画像研究主要集中在三个方向上:用户属性、用户偏好和用户行为三个主要方面。
  • 科学构建用户标签体系 -构建用户标签体系,助力企业精细化运营.pdf
  • 项目中形成的某商城用户标签体系和画像设计
  • 基于大数据和知识图谱的零售客户标签体系设计.pdf
  • 来源:网络全文共9694个字,建议阅读25分钟01什么是用户画像用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。通俗说就是给用户打标签,而标签是通...

    9a77b696b970d5d67adc2234e093fc27.png

    来源:网络

    全文共9694个字,建议阅读25分钟

    01

    什么是用户画像

    用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特征标识。通过打标签可以利用一些高度概括、容易理解的特征来描述用户,可以让人更容易理解用户,并且可以方便计算机处理。

    b421fecf1ae4ca9eb86d90f78c91a200.png

    用户画像是对现实世界中用户的建模,用户画像应该包含目标,方式,组织,标准,验证这5个方面。

    目标:指的是描述人,认识人,了解人,理解人。

    方式:又分为非形式化手段,如使用文字、语言、图像、视频等方式描述人;形式化手段,即使用数据的方式来刻画人物的画像。

    组织:指的是结构化、非结构化的组织形式。

    标准:指的是使用常识、共识、知识体系的渐进过程来刻画人物,认识了解用户。

    验证:依据侧重说明了用户画像应该来源事实、经得起推理和检验。

    207a146025bc3fc08453df1388a879e3.png

    在产品早期和发展期,会较多地借助用户画像,帮助产品人员理解用户的需求,想象用户使用的场景,产品设计从为所有人做产品变成为三四个人做产品,间接的降低复杂度。

    用户画像使用的标签是网络标签的一种深化应用方式,是某一种用户特征的符号表示,是我们观察、认识和描述用户的一个角度,用户标签是基于用户的特征数据、行为数据和消费数据进行统计计算得到的,包含了用户的各个维度。而所谓的用户画像就是可以用用户标签的集合来表示的,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具。

    用户画像,即用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌作是企业应用大数据技术的基本方式。用户画像为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。

    c7e8e6cb618b5ee03e40930221a58754.png

    02

    用户标签的分类

    1、按照标签的变化频率,可分为静态标签和动态标签。

    静态标签是指用户与生俱来的属性信息,或者是很少发生变化的信息,比如用户的姓名、性别、出身日期,又例如用户学历、职业等,虽然有可能发生变动,但这个变动频率是相对比较低或者很少发生变化的。动态标签是指非常经常发生变动的、非常不稳定的特征和行为,例如“一段时间内经常去的商场、购买的商品品类”这类的标签的变动可能是按天,甚至是按小时计算的。

    2、按照标签的指代和评估指标的不同,可分为定性标签和定量标签。

    定性标签指不能直接量化而需通过其他途径实现量化的标签,其标签的值是用文字来描述的,例如“用户爱好的运动”为“跑步、游泳”,“用户的在职状态”为“未婚”等。定量标签指可以准确数量定义、精确衡量并能设定量化指标的标签,其标签的值是常用数值或数值范围来描述的。定量标签并不能直观的说明用户的某种特性,但是我们可以通过对大量用户的数值进行统计比较后,得到某些信息。例如“用户的年龄结构”为“20-25岁”、“单次购买平均金额”为“300元”,“购买的总金额”为“20万元”……,当我们获得以上信息是否就可以将该用户划分为高价值客户呢?

    3、按照标签的来源渠道和生成方式不同,可以分为基础标签、业务标签、智能标签。

    基础标签主要是指对用户基础特征的描述,比如:姓名、性别、年龄、身高、体重等。业务标签是在基础标签之上依据相关业务的业务经验并结合统计方法生成的标签,比如:用户忠诚度、用户购买力等标签就是根据用户的登录次数、在线时间、单位时间活跃次数、购买次数、单次购买金额、总购买金额等指标计算出来的。业务标签可以将经营固化为知识,为更多的人使用。智能标签是利用人工智能技术基于机器学习算法,通过大量的数据计算而实现的自动化、推荐式的进行打标签,比如今日头条的推荐引擎就是通过智能标签体系给用户推送其感兴趣的内容的。

    4、按照标签体系分级分层的方式,可以分为一级标签、二级标签、三级标签等,每一个层级的标签相当于一个业务维度的切面。在标签应用中按照不同的业务场景进行标签组合,形成相应用户画像。

    0a6a8054f154b3022aebadf9928b2b2d.png

    5、按照数据提取和处理的维度,可以将标签分为事实标签,模型标签,预测标签。这种用户标签的分类方式更多是面向技术人员使用,帮助他们设计合理的数据处理单元。

    事实标签。既定事实,直接从原始数据中提取,描述用户的自然属性、产品属性、消费属性等,事实标签其本身不需要模型与算法,实现简单,但规模需要不断基于业务补充与丰富,比如:姓名、购买的产品品类、所在小区等。

    模型标签。对用户属性及行为等属性的抽象和聚类,通过剖析用户的基础数据为用户贴上相应的总结概括性标签及指数,标签代表用户的兴趣、偏好、需求等,指数代表用户的兴趣程度、需求程度、购买概率等。

    预测标签。参考已有事实数据,基于用户的属性、行为、位置和特征,通过机器学习、深度学习以及神经网络等算法进行用户行为预测,针对这些行为预测配合营销策略、规则进行打标签,实现营销适时、适机、适景推送给用户。例如试用了某产品A后预测可能还想买产品B并推送购买链接给该用户。

    3d3d642879a50e47e7de5ec1e24123f3.png

    03

    用户画像标签体系的建立

    1、什么是标签体系

    用户画像是对现实用户做的一个数学模型,在整个数学模型中,核心是怎么描述业务知识体系,而这个业务知识体系就是本体论,本体论很复杂,我们找到一个特别朴素的实现,就是标签。

    标签是某一种用户特征的符号表示。是一种内容组织方式,是一种关联性很强的关键字,能方便的帮助我们找到合适的内容及内容分类。(注:简单说,就是你把用户分到多少个类别里面去,这些类是什么,彼此之间有什么关系,就构成了标签体系)

    标签解决的是描述(或命名)问题,但在实际应用中,还需要解决数据之间的关联,所以通常将标签作为一个体系来设计,以解决数据之间的关联问题。

    一般来说,将能关联到具体用户数据的标签,称为叶子标签。对叶子标签进行分类汇总的标签,称为父标签。父标签和叶子标签共同构成标签体系,但两者是相对概念。例如:下表中,地市、型号在标签体系中相对于省份、品牌,是叶子标签。

    1b39c454d86e8dc2e4ddcdce57e666ca.png

    用户画像标签体系创建后一般要包含以下几个方面的内容

    9e37e96db0501c2807f27a1ede08255f.png

    (1)标签分类

    用户画像标签可以分为基础属性标签和行为属性标签。

    391c957dc82be3ecfa813b0b021d6002.png

    由于基于一个目标的画像,其标签是在动态扩展的,所以其标签体系也没有统一的模板,在大分类上,与自身的业务特征有很大的关联,在整体思路上可以从横纵两个维度展开思考:横向是产品内数据和产品外数据,纵向是线上数据和线下数据。而正中间则是永恒不变的“人物基础属性”。

    如果说其他的分类因企业特征而定,那么只有人物特征属性(至于名字叫什么不重要,关键是内涵)是各家企业不能缺失的板块。

    所谓人物基础属性指的是:用户客观的属性而非用户自我表达的属性,也就是描述用户真实人口属性的标签。所谓非“自我表达”,举例来说,某产品内个人信息有性别一项,用户填写为“女”,而通过用户上传的身份证号,以及用户照片,用户购买的产品,甚至用户打来的客服电话,都发现该用户性别是“男性”。那么在人物基础属性中的性别,应该标识的是“男性”,但是用户信息标签部分,自我描述的性别则可能标注为女性。

    (2)标签级别(标签的体系结构)

    分级有两个层面的含义,其一是:指标到最低层级的涵盖的层级;其二是指:指标的运算层级。其一非常好理解,这里重点说运算层级。

    标签从运算层级角度可以分为三层:事实标签、模型标签、预测标签。

    事实标签:是通过对于原始数据库的数据进行统计分析而来的,比如用户投诉次数,是基于用户一段时间内实际投诉的行为做的统计。

    模型标签:模型标签是以事实标签为基础,通过构建事实标签与业务问题之间的模型,进行模型分析得到。比如,结合用户实际投诉次数、用户购买品类、用户支付的金额等,进行用户投诉倾向类型的识别,方便客服进行分类处理。

    预测标签:则是在模型的基础上做预测,比如针对投诉倾向类型结构的变化,预测平台舆情风险指数。

    f55208be6a0bb79d982b16334af0fe66.png

    (3)标签命名&赋值

    我们用一张图来说明一下命名和赋值的差别,只要在构建用户标签的过程种,有意识的区别标签命名和赋值足矣,不再赘述。

    515eed1aebb33fc7c9c74d543f403339.png

    (4)标签属性

    标签属性可以理解为针对标签进行的再标注,这一环节的工作主要目的是帮助内部理解标签赋值的来源,进而理解指标的含义。如图所示,可以总结为5种来源:

    1、固有属性:是指这些指标的赋值体现的是用户生而有之或者事实存在的,不以外界条件或者自身认知的改变而改变的属性。比如:性别、年龄、是否生育等。

    2、推导属性:由其他属性推导而来的属性,比如星座,我们可以通过用户的生日推导,比如用户的品类偏好,则可以通过日常购买来推导。

    3、行为属性:产品内外实际发生的行为被记录后形成的赋值,比如用户的登陆时间,页面停留时长等。

    4、态度属性:用户自我表达的态度和意愿。比如说我们通过一份问卷向用户询问一些问题,并形成标签,如询问用户:是否愿意结婚,是否喜欢某个品牌等。当然在大数据的需求背景下,利用问卷收集用户标签的方法效率显得过低,更多的是利用产品中相关的模块做了用户态度信息收集。

    5、测试属性:测试属性是指来自用户的态度表达,但并不是用户直接表达的内容,而是通过分析用户的表达,结构化处理后,得出的测试结论。比如,用户填答了一系列的态度问卷,推导出用户的价值观类型等。

    415f1165c7c80975aa0caba6bec0f90e.png

    值得注意的是,一种标签的属性可以是多重的,比如:个人星座这个标签,既是固有属性,也是推导属性,它首先不以个人的意志为转移,同时可以通过身份证号推导而来。

    即便你成功了建立用户画像的标签体系,也不意味着你就开启了用户画像的成功之路,因为有很大的可能是这些标签根本无法获得,或者说无法赋值。

    标签无法赋值的原因有:数据无法采集(没有有效的渠道和方法采集到准确的数据,比如用户身份证号)、数据库不能打通、建模失败(预测指标无法获得赋值)等等。

     2、标签体系结构

    标签体系可以归纳出如下的层级结构。

    a1e981641800bac453a0d754b95d04ac.png

    (1)原始输入层

    主要指用户的历史数据信息,如会员信息、消费信息、网络行为信息。经过数据的清洗,从而达到用户标签体系的事实层。

    (2)事实层

    事实层是用户信息的准确描述层,其最重要的特点是,可以从用户身上得到确定与肯定的验证。如用户的人口属性、性别、年龄、籍贯、会员信息等。

    (3)模型预测层

    通过利用统计建模,数据挖掘、机器学习的思想,对事实层的数据进行分析利用,从而得到描述用户更为深刻的信息。如通过建模分析,可以对用户的性别偏好进行预测,从而能对没有收集到性别数据的新用户进行预测。还可以通过建模与数据挖掘,使用聚类、关联思想,发现人群的聚集特征。

    (4)营销模型预测

    利用模型预测层结果,对不同用户群体,相同需求的客户,通过打标签,建立营销模型,从而分析用户的活跃度、忠诚度、流失度、影响力等可以用来进行营销的数据。

    (5)业务层

    业务层可以是展现层。它是业务逻辑的直接体现,如图中所表示的,有车一族、有房一族等。

    3、标签体系结构分类

    一般来说,设计一个标签体系有3种思路,分别是:(1)结构化标签体系;(2)半结构化标签体系;(3)非结构化标签体系。

    (1)结构化标签体系

    简单地说,就是标签组织成比较规整的树或森林,有明确的层级划分和父子关系。结构化标签体系看起来整洁,又比较好解释,在面向品牌广告井喷时比较好用。性别、年龄这类人口属性标签,是最典型的结构化体系。下图就是Yahoo!受众定向广告平台采用的结构化标签体系。

    c891317946302a1da05955f79a2a2e7d.png

    (2)半结构化标签体系

    在用于效果广告时,标签设计的灵活性大大提高了。标签体系是不是规整,就不那么重要了,只要有效果就行。在这种思路下,用户标签往往是在行业上呈现出一定的并列体系,而各行业内的标签设计则以“逮住老鼠就是好猫”为最高指导原则,切不可拘泥于形式。下图是Bluekai聚合多家数据形成的半结构化标签体系。

    24969def624c885d99813c3a1141f18c.png

    (3)非结构化标签体系

    非结构化,就是各个标签就事论事,各自反应各自的用户兴趣,彼此之间并无层级关系,也很难组织成规整的树状结构。非结构化标签的典型例子,是搜索广告里用的关键词。还有Facebook用的用户兴趣词。

     4、用户画像标签层级的建模方法

    用户画像的核心是标签的建立,用户画像标签建立的各个阶段使用的模型和算法如下图所示。

    2a4baf3ef5b14ecacb8135156e30d170.png

    fea1dc981cfeb1ca9d90da25fdebc93b.png

    原始数据层。对原始数据,我们主要使用文本挖掘的算法进行分析如常见的TF-IDF、TopicModel主题模型、LDA 等算法,主要是对原始数据的预处理和清洗,对用户数据的匹配和标识。

    事实标签层。通过文本挖掘的方法,我们从数据中尽可能多的提取事实数据信息,如人口属性信息,用户行为信息,消费信息等。其主要使用的算法是分类和聚类。分类主要用于预测新用户,信息不全的用户的信息,对用户进行预测分类。聚类主要用于分析挖掘出具有相同特征的群体信息,进行受众细分,市场细分。对于文本的特征数据,其主要使用相似度计算,如余弦夹角,欧式距离等。

    模型标签层。使用机器学习的方法,结合推荐算法。模型标签层完成对用户的标签建模与用户标识。其主要可以采用的算法有回归,决策树,支持向量机等。通过建模分析,我们可以进一步挖掘出用户的群体特征和个性权重特征,从而完善用户的价值衡量,服务满意度衡量等。

    预测层。也是标签体系中的营销模型预测层。这一层级利用预测算法,如机器学习中的监督学习,计量经济学中的回归预测,数学中的线性规划等方法。实习对用户的流失预测,忠实度预测,兴趣程度预测等等,从而实现精准营销,个性化和定制化服务。

    不同的标签层级会考虑使用对其适用的建模方法,对一些具体的问题,有专门的文章对其进行研究。

    05

    用户画像的应用场景

    用户画像,即用户信息标签化,是企业通过收集与分析消费者基本属性、社会属性、生活习惯、行为特征等主要信息的数据之后,抽象出用户的商业全貌。大数据的发展让各行各业都日益聚焦于怎样利用大数据了解用户需求,实现精准营销,进而深入挖掘潜在的商业价值。

    不同的企业做用户画像有不同的战略目的,广告公司做用户画像是为精准广告服务,电商做用户画像是为用户购买更多商品,内容平台做用户画像是推荐用户更感兴趣的内容提升流量再变现。企业对用户的了解越多,就越容易为用户提供所需产品和服务,从而提升用户的粘性,提升企业盈利能力。

    5fa77aba9da0fb6f32227e6c17b00ee0.png

    1、了解用户

    不得不承认大数据正在改变着各行各业,以前了解用户主要是通过用户调研和访谈的形式,形式单一、数据收集不全、真假难辨。尤其是在产品用户量扩大后,调研的效用降低,以不能满足企业发展的要求。利用大数据技术,基于标签体系构建用户的360°画像,从用户的各个维度进行分析,了解用户是谁,他们有什么特征,他们的兴趣偏好,而这些信息的研究是企业制定营销策略、服务策略,提升用户满意度的重要依据。

    2、精准营销

    要做到精准营销,数据是最不可缺的存在。以数据为基础,建立用户画像,利用标签,让系统进行智能分组,获得不同类型的目标用户群,针对每一个群体策划并推送针对性的营销。精准化营销具有极强的针对性,是企业和用户之间点对点的交互。它不但可以让营销变得更加高效,也能为企业节约成本。

    3、产品创新

    在用户需求为导向的产品研发中,企业通过获取到的大量目标用户数据,进行分析、处理、组合,初步搭建用户画像,做出用户喜好、功能需求统计,从而设计制造更加符合用户核心需求的新产品,为用户提供更加良好的体验和服务。

    4、渠道优化

    当前的零售企业的销售渠道有多种,比如:自营门店、经销商代理、电商平台、电商APP等,每个渠道的用户群体的消费能力、兴趣偏好可能是不一样的,通过用户画像可以让合适的产品投放在合适的渠道投放,从而增加销售量,这是目前零售行业惯用的方法。

    5、个性推荐

    众所周知,今日头条是个个性化的新闻推荐引擎,在今日头条CEO张一鸣看来,算法是《今日头条》这款兴趣推荐搜索引擎应用的核心,这也是与传统媒体最本质的区别,今日头条之所以能够非常懂用户,精准推荐出用户所喜好的新闻,完全得益于算法,而正是精准推荐,使得今日头条在短短两年多的时间内拥有了2.2亿用户,每天有超过2000万用户在今日头条上阅读自己感兴趣的文章。

    06用户画像的分类

    从画像方法来说,可以分为定性画像、定性+定量画像、定量画像

    e8d2113cc6de9b7dc9bbeebbd50ace49.png

    从应用角度来看,可以分为行为画像、健康画像、企业信用画像、个人信用画像、静态产品画像、旋转设备画像、社会画像和经济画像等。

    07

    用户画像需要用到哪些数据

    一般来说,根据具体的业务内容,会有不同的数据,不同的业务目标,也会使用不同的数据。在互联网领域,用户画像数据可以包括以下内容:

    (1)人口属性:包括性别、年龄等人的基本信息
    (2)兴趣特征:浏览内容、收藏内容、阅读咨询、购买物品偏好等
    (3)消费特征:与消费相关的特征
    (4)位置特征:用户所处城市、所处居住区域、用户移动轨迹等
    (5)设备属性:使用的终端特征等
    (6)行为数据:访问时间、浏览路径等用户在网站的行为日志数据
    (7)社交数据:用户社交相关数据

    37d31722624762f513f6290fe503f155.png

    用户画像数据来源广泛,这些数据是全方位了解用户的基础,这里以Qunar的画像为例,其画像数据主要维度如下所示,包括用户RFM信息、航线信息等。

    f28360ae0d682611d17abc633e5f8b28.png

    Qunar的画像数据仓库构建都是基于Qunar基础数据仓库构建,然后按照维度进行划分。

    45852fe4bacce9f4090edea541b568d0.png

    08

    用户画像的作用

    在互联网、电商领域用户画像常用来作为精准营销、推荐系统的基础性工作,其作用总体包括:

    (1)精准营销:根据历史用户特征,分析产品的潜在用户和用户的潜在需求,针对特定群体,利用短信、邮件等方式进行营销。
    (2)用户统计:根据用户的属性、行为特征对用户进行分类后,统计不同特征下的用户数量、分布;分析不同用户画像群体的分布特征。
    (3)数据挖掘:以用户画像为基础构建推荐系统、搜索引擎、广告投放系统,提升服务精准度。
    (4)服务产品:对产品进行用户画像,对产品进行受众分析,更透彻地理解用户使用产品的心理动机和行为习惯,完善产品运营,提升服务质量。
    (5)行业报告&用户研究:通过用户画像分析可以了解行业动态,比如人群消费习惯、消费偏好分析、不同地域品类消费差异分析

    根据用户画像的作用可以看出,用户画像的使用场景较多,用户画像可以用来挖掘用户兴趣、偏好、人口统计学特征,主要目的是提升营销精准度、推荐匹配度,终极目的是提升产品服务,起到提升企业利润。用户画像适合于各个产品周期:从新用户的引流到潜在用户的挖掘、从老用户的培养到流失用户的回流等。

    bed28ec9b5e8b8c89fa400ce1ee6712c.png

    总结来说,用户画像必须从实际业务场景出发,解决实际的业务问题,之所以进行用户画像,要么是获取新用户,要么是提升用户体验、或者挽回流失用户等具有明确的业务目标。

    05eb6c71e4df675d936f6089a02cbb20.png0d04371c04691e1be2089d7b00933184.pngf8e731ff3d008555803ecbf92608c9e0.png

    另外关于用户画像数据维度的问题,并不是说数据维度越丰富越好,总之,画像维度的设计同样需要紧跟业务实际情况进行开展。

    09

    用户画像的体系架构

    按照应用系统分层设计的原则,基于标签体系的用户画像的体系结构可以分为:数据源层、数据采集层、数据建模层、数据应用层,行业应用层等。

    7565fe26cb4d48c6a579a861413bf48a.png

    数据源层:用户标签体系建设的需要从不同的来源汇集数据,例如,企业的核心系统(不同的行业其核心系统不同,对制造业来说核心系统有ERP、MES、PLM等),营销系统(CRM),互联网数据(电商平台以及微信、微博、论坛等社交平台获取的数据),以及从第三方专业机构获取的数据(各地的数据交易中心购买的数据)。

    数据采集层:与传统数据项目的数据采集不同,基于标签体系的用户画像的数据来源广泛、数据量巨大,数据类型丰富(包括:结构化数据、半结构化数据和非结构化数据),有线上的用户行为数据,也有应用系统日志数据,有互联网爬虫数据,也有API接口的第三方数据包。用户画像数据采集需要通过网络爬虫或网站公开API等方式从网站上获取数据信息,并且可以将非结构化数据从网页中抽取出来,将其存储为统一的本地数据文件,并支持以结构化的方式存储。同时支持图片、音频、视频等文件或附件的采集,附件与正文可以自动关联。

    数据建模:基于标签体系的用户画像建模主要是针对用户画像的建模和产品的建模。产品画像建模包括了数据清洗、文本建模、类别识别、品牌识别、属性识别、产品画像等;用户画像建模包括了数据清洗、用户全渠道ID识别、信息整合、分析建模和用户画像。通过统一产品类目和属性体系和统一的用户画像标签体系的建设,为用户标签的应用提供支撑。

    数据应用:即基于标签体系的应用,包括分析类应用(如用户分析、产品分析)、服务类应用(如服务及产品创新)、营销类应用(精准营销)、数据接口API等。行业应用:基于标签体系的用户画像在各行业的所应用和探索,将为行业的发展和创新带来更多可能。

    行业应用:基于标签体系的用户画像在各行业的所应用和探索,将为行业的发展和创新带来更多可能。

    10 

    用户画像的建设步骤

    d93ecec1fc5d94253d8d53d969261996.png

    1、数据采集

    用户画像是根据用户的人口信息、社交关系、偏好习惯和消费行为等信息而抽象出来的标签化画像,用户画像数据来源多样,采集方式也不同:线下采集、线上采集、第三方接口等。

    2、数据清洗

    要实现精准的用户画像就需要对这些噪声数据、脏数据进行处理,这个过程我们叫做数据清洗。

    3、数据标准化

    数据标准化的方法有很多种,常用的有“最小—最大标准化”、“Z-score标准化”和“按小数定标标准化”等。经过上述标准化处理,原始数据均转换为无量纲化指标测评值,即各指标值都处于同一个数量级别上,可以进行综合测评分析。

    4、数据建模

    数据建模就是根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。

    用户动态建模公式:用户标识 +时间 + 行为类型 + 接触点(网址+内容),表示某用户在什么时间、地点、做 了什么事,所以会打上某标签。用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子r,行为类型,同时该标签对该用户的重要程度也决定了用户标签的权重,进一步转换为公式:用户标签权重 = 行为类型权重 × 时间衰减 × 用户行为次数 × TF-IDF计算标签权重

    0fdf4a55fd7ea4f4ce1ded07108e4b2e.png

    行为类型权重:用户浏览、搜索、收藏、下单、购买等不同行为对用户而言有着不同的重要性(偏序关系),该权重值一般由运营人员或业务来决定;

    时间衰减:用户某些行为受时间影响不断减弱,行为时间距现在越远,该行为对用户当前来说的意义越小,采用牛顿冷却定律;

    行为次数:用户标签权重按天统计,用户某天与该标签产生的行为次数越多,该标签对用户的影响越大。

    公式:t=初始温度×exp(-冷却系数×间隔的时间),实际应用中,初始温度为1就行,间隔的时间为今天与产生行为那天的天数,或者小时数都行,根据业务进行调整,冷却系数的业务来决定,或者通过数据分析而来。

    TF-IDF计算标签权重:tf为某标签在该用户出现频率,idf为某标签在全部标签中的稀缺程度。

    5、标签挖掘

    标签挖掘,即对用户标签体系中的用户数据进行挖掘,形成用户标签,这个过程也叫标签生产。标签的生产方式主要有以下两种:①基于规则定义的标签生产方式,即根据固定的规则,通过数据查询的结果生产标签,重点在于如何制定规则。②基于主题模型的标签生产方式,主题模型最开始运用于内容领域,目的是找到用户的偏好,在用户标签中我们可以参照分类算法将用户进行分类、聚类,使用关键词的算法挖掘用户的偏好,从而生产标签。

    6、数据可视化

    数据可视化是基于标签体系的用户画像的重要应用, 通过详实、准确对用户的各类标签数据进行汇集和分析,并以图片、表格等可视化手段帮助企业全面了解用户的基础信息,用户关系情况,用户经济情况、用户偏好情况、健康情况、饮食情况等信息。同时,利用数据标签体系的用户画像可视化技术,通过对用户关系数据、用户内容数据、用户行为等数据进行可视化展示,能够帮助企业管理人员、业务人员全面了解用户,了解用户是谁,他们有什么特征,他们的兴趣偏好等,从而为智能推荐、精准营销、产品和服务创新、渠道优化等业务提供支撑。

    猜你喜欢
    Hive计算最大连续登陆天数
    Hadoop 数据迁移用法详解
    Hbase修复工具Hbck
    数仓建模分层理论
    Spark SQL知识点与实战
    大数据组件重点学习这几个

    展开全文
  • 标签体系应用及设计思路

    千次阅读 2021-01-23 14:39:38
    构建标签和画像体系的实操方法论; 证券行业案例。 我接触过各行各业的客户,在跟他们交流以及沟通需求的过程中,很明显的会感受到,在数据的基建和应用层面,除了重视数据分析外,也越来越重视数据资产在更多业务...

    本文将为你重点介绍:

    1. 企业做标签画像的目的;
    2. 标签和画像的应用场景及应用流程;
    3. 构建标签和画像体系的实操方法论;
    4. 证券行业案例。

    我接触过各行各业的客户,在跟他们交流以及沟通需求的过程中,很明显的会感受到,在数据的基建和应用层面,除了重视数据分析外,也越来越重视数据资产在更多业务场景中的应用,标签画像的建设和应用就是其中一类很常见的需求和期望。

    事实上,我认为从对业务的价值来说,标签和画像是类似中间层的系统模块,具体来说,数据资产本质上是一些采集、采购所获得的数据源,但企业希望在数据源的基础上,实现资产变现,而且不断扩大资产价值。

    在这个过程当中,企业需要把数据转化成一类真正对业务有价值输出的产物,然后在这些产物之上实现上层业务的应用,如类似 CRM 产品对客户做一些营销、个性化推荐等应用,真正将数据变为实现业务价值的利器。很多企业都意识到,这个中间层就是标签画像。

    那么,在标签画像建设之上,更加具体的应用目的是什么呢?

    一、企业做标签画像的目的

    很多企业虽然做标签和画像考虑的侧重点会不一样,但是全部抽象出来分析,可以分成以下几类(如下图):

    图 1 做标签画像的目的

    注:点击放大,查看高清图

    大多数处于对标签和画像探索阶段的客户,在早期会侧重在类似客户生命周期管理、高价值的客户深入开发、交叉营销等角度(如图 1 左侧),其本质原因是,企业希望把现有客户资产挖掘和客户运营做的更好。

    随着人口红利降低,用户获取成本越来越高,尤其对业务相对成熟的行业,如银行和证券这类公司,虽然在库里沉淀了几亿、几千万用户,但是真正活跃的用户量并不多,所释放的用户价值也比较少。

    在以前,银行的个人业务服务资产有的需要达到 6 百万以上,才会进入私人银行范畴,所以长尾客户群体的价值在业务运营范围内是被忽视的。现在,企业希望挖掘这类人群的价值,但因成本受限无法像以前使用理财经理、专人理财服务的方式去服务这群人,银行开始借鉴互联网理财和互联网运营方式挖掘用户价值。

    与此同时,企业开始极为重视数据,希望通过数据和数据资产花最小化成本将这群客户服务的更好,这是现阶段金融业相对主流的侧重需求。

    另外一类需求主要与个性化相关(如图 1 右侧),之所以将两类需求分开是因为图 1左侧这一类是以分群的思路来考虑的几个方面,把客户划分成几类,还没有细化到为某个客户做定制化的服务,相反,图 1右侧的几个方面个性化程度会更深一点,整体的投入成本也会显著比左边高。

    举个例子:个性化推荐本身对于数据资源、基础硬件、人力成本等方面的消耗都大于左边。因此,每个企业都有不同的发展阶段、业务诉求、投入产出比、可投入成本等决定企业是以上图左侧为主,还是以图 1右侧为主。

    事实上,从早期应用来说,我们也会推荐客户先主攻图 1左侧部分,因为相对而言,这部分使用较小的投入、可产生更大的边际价值,当这部分达到业务提升的天花板时,可以开始通过图 1中右侧的手段来进一步增加价值。

    也就是说,左侧的方式到达一定的上限以后,企业需要使用更极致的手段实现突破,如个性化推送、个性化推荐、个性化实时营销。

    如头部电商企业基本都实现了个性化实时营销,当用户准备购买一个商品,却在付款页面流失了,表明客户是有成单意愿,但存在某些疑虑,或者就是被打断后忘记回来了,系统就会在大概十分钟之后,基本上等于实时给客户做营销推送,Push 用户成单。

    当然,如果业务发展快,有明确的场景和充分的资源,想要两者一起来做,那当然也是可以的。

    二、标签画像的应用场景总结

    标签和画像实际上是对数据的再加工,根据不同的加工输出可分成四大类应用场景(如下图 2):

    图 2 标签画像的应用总结

    (1)精细化运营

    企业逐渐从粗放式到精细化,希望将用户群体切割成更细的粒度,辅以短信、推送、邮件、活动等手段,驱以关怀、挽回、激励等策略。

    (2)用户分析

    用户画像也是了解用户的必要补充,在产品用户量扩大后,需要辅以用户画像配合研究,如新增的用户有什么特征,核心用户的属性是否变化等。本质上来讲,标签就是对用户的描述,所以对标签的加工,相当于更深层地分析出贴近业务的用户信息,这个信息会减少大家基于原数据重新跑一些业务分析和用户分析的场景。

    在这里强调一点,我发现很多企业在使用数据时,会忽略思考数据背后代表的意义,但是企业需要在使用数据解释业务特征时,更深层次地剖析数据代表的用户特征,因为增添这一层思考,意味着企业的业务自始至终真正服务的对象都是用户,而不是把这些业务作为服务用户的手段。

    所以,当企业开始探索业务的持续性发展时,企业对用户的了解和认知非常重要。举个例子:我在给一些证券客户做咨询的时候,会首先引导企业梳理现有数据,基于客户视角把客户资产盘点一次。

    (3)数据分析

    标签可以理解成作为用户分层分类的规则之一,数据查询平台和这些数据打通后能支持更加丰富和深层的分析及对比。另外,数据分析的应用,可以更具像到一个概念,即产品的应用。

    (4)产品应用

    用户标签是很多数据产品的基础,诸如广告系统、个性化推荐系统、CRM 基础搭建等,事实上,自动化运营本质上在技术角度对底层的要求就是标签体系。

    三、标签画像的典型应用场景

    很多企业会使用 Push 来拉新、活跃、召回用户,其实企业如果是引入外部第三方企业来支持 Push 业务,第三方企业会根据公司的 DAU 或 MAU 来收取费用,这意味着企业每个月给客户推 0 次和推 5 次 Push,付出的成本一样。

    另一方面,企业对一个用户推 10 次与精准地推 3 次(3 次都产生效果)相比,后者 Push 用户产生的效果更好。所以 Push 的应用非常强调技巧,需要从成本和 Push 用户产生的效果两方面考虑。

    举个例子:如果企业的目的是通过 Push 增加理财交易,我们可以先通过两层标签筛选找到推送的用户,第一层是生命周期标签筛选,如处于交易流失期的用户,第二层是行为标签筛选,如最近七天查看过银行理财产品的用户。之所以设置第二层筛选将这群人抽取出来,是因为这群人是可被迁移的用户,而且是理财产品的潜在营销用户。

    如果企业不对这群用户采取相应措施,这些潜客就会流失,但是如果企业对这些用户做精准营销,不仅对理财业务,还是对整体业务都会产生很大的价值。

    图 3 典型应用场景

    这是一个真实场景的举例(如上图 3),理财业务的运营同学,通过上述规则筛选出 5 万人,并对这些人发了一条精准的 Push,推送后打开 App 人数达到 5680 人,打开率达到 11.4%(数据做了一定的处理)。

    事实上,通常金融类的 Push 打开率,能够达到 5% 已经非常不错了。但是,通过判断这群目标用户的特征和需求后采取定向推送,使 Push 打开率能达到接近 3 倍以上,这意味着如果企业采用非精准推送方式,所要覆盖的用户群需要精准推送的 3 倍。

    同时,采用非精准推送方式会造成两个大的影响:

    • 第一,那群被无效推送的用户的推送资格被占用了;
    • 第二,很可能其他的业务可以精准推送这群人,产生更好的效果。

    所以使用精准推送是对整体效率的提升,但是很多企业在具体的业务中很少对投入资源的有效性进行核算,这也是企业需要做精细化运营的必要性之一。

    四、标签画像的典型场景流程

    图 4 典型场景流程

    那么,我们刚刚讲的那个例子,在实际的业务过程中,一般是怎么操作和实现的呢?

    具体来说,我们可以分为 4 个步骤。首先,根据既定的目标确定一个人群的属性描述,其实这对应了企业的商业策略。

    举个例子,目标是提升理财的交易额,我把从流失的用户获取理财交易额的增长作为其中一个策略,并定义为对于交易流失用户的潜客营销。这时候人群策略就呼之欲出了,投放人群策略描述为交易高价值客户,且处于交易流失期的有理财意向的非理财用户,便可以从各种各样维度选取相应标签,并通过标签快捷筛选获取名单,然后实施精准触达用户,最后再评估营销效果。这整个流程也是个性化营销或分群营销中常见的一种思路。

    通过前面的介绍,我们知道标签和画像在企业变大变强中有举足轻重的作用,但是现在有不少企业,说是做了用户画像系统,可能就只是实现了一些静态标签,以用户基本属性为主,或者做一份高大上的用户画像报告,但跟业务系统并没有打通,没有真正用在实际业务中对业务没产生价值。因此很多企业做标签和画像的初衷很好,但却沦为了形式主义。

    所以,不是有标签画像了,企业就能驱动业务、实现增长,标签画像“做了”跟“做好”,以及“有了”和“用上了”,中间存在着很大的鸿沟。企业是为了驱动业务、实现增长才需要标签画像,而不是为了有标签画像而做标签画像,不能本末倒置。

    所以结合前面的案例标签画像从建立到应用的正确步骤可以用以下几个图概括:

    图 5 确定商业目的,设定目标

    图 6 明确目标人群特征

    图 7 抽取标签及属性值定义

    图 8 效果评估

    五、建立一个完整的标签体系的四个关键

    建立一个完整的标签体系需要注重四点:了解标签的获得形式;清楚业务形态,以商业目的出发,汇集标签;对标签池进行分类和定义;标签的维护。

    下面我将一一展开:

    图 9 如何建立一个完整的标签体系

    1. 了解标签的获得形式

    图 10 了解标签的获得形式

    首先我们都知道标签本身会有很多分类,但是从它的实现规则来看,大致可以分成以下几类:

    (1)基于统计类的标签

    顾名思义,这类标签是可以从用户注册、用户访问、消费类数据中统计得出,是最为基础的标签类型,例如:性别、城市、App 使用时长、周均启动次数、月均消费金额等字段构成了用户画像的基础。

    (2)基于规则类的标签

    该类标签基于用户行为及确定的规则产生,在实际开发标签过程中,该类标签的规则由运营人员和数据人员共同协商确定。如:距今 90 天内交易次数 > 3,是“交易活跃”标签的定义和口径;连续 12 个月内飞行航段 > 20 ,是“常旅客”标签的定义和口径。

    (3)基于挖掘类的标签

    该类标签为概率模型,概率是介于 0~1 之间的数值,需要通过算法挖掘产生。例如:根据一个用户的行为习惯判断是男性还是女性,根据一个用户的消费习惯判断其对某商品的偏好程度。

    需要注意的是数据源的梳理和基础规则的应用是应用挖掘类标签的前提。如果企业的数据源没有做规则,基础没打好,挖掘类标签可以暂时不考虑。因为建立规则仿佛在搭建一个小阶梯,如果这个阶梯搭好,证明你的数据质量和存在应用提升空间,你再往上提一阶是比较合理的方式。

    因为这里会涉及到成本的投入和人员的应用能力,这是个循序渐进的过程,包括我们给客户服务的时候都会给他强调存在阶梯式递进的过程。

    另外,图 10 中的用户自然属性、用户交易数据、用户资产数据、用户行为特征、第三方来源数据是基于数据源或具体的业务场景做的标签分类。事实上,最终呈现的标签,一般都是以业务视角的,标签与应用场景,以及统计的属性源会都有关联。

    之所以这样做,是因为这样的标签是以用户视角定义的,让用的人知道这个标签代表了什么含义,而不是了解通过什么方式抽取的。所以,我们真正给客户梳理标签的时候大多都是基于用户视角梳理。

    2. 清楚业务形态,以商业目的出发,汇集标签

    (1)还原业务流程

    图 11 还原业务流程

    用户画像首先是基于业务模型的。业务部门连业务模型都没有想好,数据部门只能巧妇难为无米之炊。但是数据部门也需要注意不能闭门造车,这其实跟做产品一样,连用户需求都没有理解透彻,匆匆忙忙上线一个 APP,结果往往是无人问津。因此,企业构建标签的第一个步骤为熟悉业务。

    事实上,我们在给客户做咨询的时候,有的客户刚开始会认为我们没有做过他的业务,并不清楚其业务形态,无法精准的梳理标签体系,但是,很快他们就会打消这个念头。因为我们做咨询的人会有一个体系化、方法论和迁移能力。

    例如:我在进入互金行业之前是做游戏行业的,但在两个月之内我对互金产品体验和对这个行业的把握可以达到在这个行业做了三年都达不到的水平。

    为什么呢?

    我会试用行业头部所有的产品,去真的做投资,把它们的产品体验和营销策略梳理出来,并在这个过程中运用之前学到的体系和方法论对这个应用场景做调整,事实上,你会发现真正做咨询和用户本身对业务的理解是互相匹配的过程。做业务的人很可能对这块业务相对熟悉的,但是他对怎么把这套东西体系化和交付给其他人去应用会比较陌生。所以,这也是企业需要咨询的价值。

    (2)明确商业目的

    图 12 明确商业目的

    这一步是需要明确标签是用来干什么的。每个公司,甚至每个运营对标签体系的设立都是非常不一样的。比如:企业要做个性化推荐,做关于物或人的兴趣、偏好的标签会比较有价值,但是如果企业要做用户运营,做关于用户的留存、活跃标签会更有价值。所以标签体系的建立最终是跟企业的商业目的强相关的。

    (3)汇集标签

    图 13 从策略推标签

    关于汇集标签,需要结合企业的运营策略和应用场景,使用户人群的定义归结到原子层的标签,考虑到涉及哪些数据源和标签赋值的区分度,这些最终会成为企业标签体系架构和标签数据源的梳理原则。

    (4)标签的分类与定义

    图 14 标签的分类

    上图是一个相对通用的标签体系架构,虽然并不一定适合每一家企业,但在梳理标签和画像时,这是一个很好的参考框架,通过这个框架给企业梳理业务场景和目标,再反向设计标签,但是标签的设计与应用一定要基于对业务和架构的理解。

    这个框架实际上应用了分类的概念,它会涉及到标签生成规则、所属的标签层级具体到属性参数等,这些都会标注在系统里。但是,神策数据给客户咨询,最终更多是结合应用场景给到客户,如标签归属在哪个层级,哪个业务体系,基本上是给具体应用的人看的最直接的标签体系。

    图 15 标签的定义

    (5)标签的维护

    标签的维护往往是容易被忽视的重点。事实上,标签也具有生命周期,从需求提出、到生成、到审批、到执行。

    对于很多企业来说,生成一期标签并不难,我们有很多客户自己梳理了三四百或者上千的标签,但是这些标签被生成之后,并没有明确的更新规则,更新规则包括:标签更新周期,如:实时更新、每月更新等;标签更新维度,在什么情况下触发对具体用户的更新,如什么情况下更新某类用户的风险评级;标签更新权限,如哪些人可以更新这个标签库;无用标签的淘汰,如标签库内只会使用到 60 个标签,但是标签库中有 90 个标签,其中有很多无效标签占用资源等。所以标签维护是非常重要和系统的工程。

    但是,很多企业没有意识到这一点,或者意识到了却最终不了了之。

    以上就是构建标签体系的几个关键点,事实上好的标签设计应具备以下特征:

    图 17 标签设计特征

    我还想强调一点,企业应该以终为始,用业务需求倒推标签设计,而不是有什么样的数据就生成什么样的标签非常重要,这两个思路的本质差异是企业是以目的为导向,还是以系统为导向,如果只是以系统为导向,很难做出有价值的产物,所以我们非常强调业务部门和技术部门的互动,生成标签不只与 IT 部门有关,还与业务使用场景强相关。

    关于标签体系的构建我做了一个总结,如下图:

    图 18 完整的标签体系建立流程

    六、证券行业的案例

    图 19 项目管理实施流程

    以上是一个神策标签画像产品的实施流程示意,如上图,可以发现,我们整体的项目管理做的非常精细,包括项目准备、系统部署、标签需求梳理、产品持续交付、标签系统实施、交付与培训、交付后支持七个步骤。

    1. 需求调研:梳理业务场景、运营策略和需求

    图 20 需求调研

    具体到其中的需求调研阶段,上图是我们根据了解到客户的业务场景、运营策略和需求初步建立的一个需求梳理框架。因为该企业设计标签体系的目的是做用户运营,所以会从新客培育、活跃留存、交易提升、资金留存、沉没唤醒、流失预防、丧失召回、用户体验、大客户运营等维度来梳理企业的业务体系,但是如果企业的标签体系设计目的是做个性化推荐,设计思路将完全不同。

    所以,我们为每一个企业梳理标签体系前都要明确目标,根据目标来梳理一个基本的业务需求框架,再通过前期调研,如访谈、查资料等来补充框架上的信息。

    2. 由业务需求抽离出标签需求

    明确企业的业务需求后,我们再根据企业的业务需求梳理标签需求,并梳理出相应的标签策略,最后制定对应的标签,这些标签是企业最终的场景应用会使用到的标签。

    图 21 需求梳理

    如上图,我们最终帮该证券客户的标签梳理成几大类。

    第一类是用户的基本信息。

    基本信息包括如用户识别、激活信息(引流或者拉新时的重要信息,如用户什么时候来、什么渠道来等)、风险特征(金融行业用的比较多)等信息。

    第二类是用户的账户特征。

    因为证券企业的用户有多套资金帐户,但是不管用户操作的是哪个资金帐户,企业最终营销的都是用户本身,关于用户本身的特征和偏好才是最重要的信息,所以我们会对用户的帐户做一层设计。

    第三类是业务特征。

    之所以我们会划分交易、理财、资讯、服务四类,与企业的运营体系相关,他们是按照板块划分具体的运营的。

    所以要建立真正代表用户在特定业务场景下的标签,我们会拆分业务层,业务层对应的标签就是表征业务本身的特点,如理财的标签与交易标签完全不一样,股票标签会涉及到个股偏好,但是理财产品实际上对特定产品偏好较弱,更看重产品类型。还有活跃特征和价值标签很好理解,我就不赘述了。

    展开全文
  • 数据治理——标签体系建设资料合集,共5份。 1、构建用户标签体系 2、客户标签管理办法 3、客户标签体系案例 4、如何建立数据标签体系 5、用户标签体系模板
  • 干货,如何建立数据标签体系

    千次阅读 2021-01-15 07:03:00
    公众号推文规则变了,点击上方"数据社"关注,设为星标后台回复【加群】,申请加入数据学习交流群大家好,我是一哥,今天给大家分享一篇标签体系如何建设的干货文章,欢迎转发收...

    公众号推文规则变了,点击上方 "数据社"关注, 设为星

    后台回复【加群】,申请加入数据学习交流群

    大家好,我是一哥,今天给大家分享一篇标签体系如何建设的干货文章,欢迎转发收藏~

    为什么要先介绍标签体系?

    一个推荐系统效果好与坏最基本的保障、最基础的是什么?如果让我来回答,一定是标签体系。我这里说的标签主要是针对物料的,对于电商平台来说就是商品;对于音乐平台来说就是每一个首歌,对于新闻资讯平台来说就是每一条新闻。下一篇要介绍的是用户画像,画像中那些用户实时变化的兴趣点大都也是来自于标签体系,依据用户长期和短期行为中对于物料搜索、点击、收藏、评论、转发等事件,将物料的标签传导到用户画像上,就构成了用户的实时画像和离线画像中的各个动态维度。

    标签体系概览

    以京东的标签体系中的京东超市为例用思维导图来拆解,后面我们会详细的介绍如何构建标签体系。

    这里对京东超市标签拆解粒度到三只松鼠年货大礼包的实体级别,实际上各个公司的标签体系大致都是如下构成

    一、二、三级分类体系都很好理解,参考京东超市的拆解,相信大家就会明白。标签体系中实体标签和概念标签不好理解。

    实体标签

    必须是名词,且必须是唯一指代。

    学术性的解释逼格高,但是不容易理解,回答下面的问题

    • 老板问:苹果,是实体标签吗?

    • 给你三秒钟思考

    • 你回答:是!

    • 老板说:错!

    • 你懵逼:靠!为啥不是?

    实体标签的要求:名词,且唯一指代。

    苹果,是名词,但不是唯一指代,苹果 = 科技公司、手机、水果、牛仔裤

    概念标签

    难道我就不能用“苹果”了吗?当然可以用,只不过要给它另外起个名字:概念标签。

    概念标签通常表示的是“一类”或“某种相似”的内容,例如

    主题词

    这里以之家的标签体系举例,要给买车用户推荐评测导购(一级)的文章,用户画像中车的品牌(二级)偏好太粗,而实体标签如奔驰GLC又太细,填补这中间的粒度空白,满足用户购车意图的画像,就加入“代步优选”的主题词,这样不仅保持了推荐的多样性,又不至于过分精准而导致的极度收敛。

    以上大致介绍了一下标签体系,那么我们接下介绍一下如何构建标签体系以及其构建过程中应遵循的一些原则。

    标签体系构建原则

    原则一、放弃⼤而全的框架,以业务场景倒推标签需求

    原则二、标签生成自助化,解决效率和沟通成本

    原则三、有效的标签管理机制

    分别解释以下为什么提炼出这三个原则,分别用于解决什么问题?

    关于第一项原则:

    每个公司的产品、运营、商务对标签的诉求有较大的差异,同时不同的运营团队的诉求也存在很大差异,⼤而全的标签框架实际是站在用户视角搭建的,但是标签的真正应用者是业务方,所以应该从业务视角来实现。

    因此最佳的处理方式是,我们应该放弃顶层的用户抽象视角,针对各业务线或部门的诉求和实际的应用场景,分别将标签聚类起来提供给相应部门。

    之家就是非常典型的情况,商业同学更关心用户的消费能力相关的标签;自驾游负责同学更关心用户的位置和出行相关的标签;车友圈的同学更关注用户的社交活跃相关的标签;所以不可能一套标签覆盖整个运营团队, 这种以业务场景倒推标签需求的方法,能够与业务场景贴合更紧密,可用性上升。

    关于第二项原则:

    1.标签生成的自助化能够让沟通成本降最低。前面讲到各业务线对标签的定义的理解不同,需要标签系统建设团队花费大量的时间沟通。如果能够让业务方自己定义规则,这必然是沟通成本最低的方式。

    2.标签生成的自助化,可重复修改的规则,降低无效标签的堆积。业务一直在发展,如果规则一成不变则很难跟上业务节奏的变化。我曾拜访过一家电商,他们发现半年前定义“母婴客户群”的转化率一直在降低,因此根据实际情况重新修改和定义了“母婴客户群”规则,并命名为“母婴客户群(新)”,这时之前的规则是无效的,且会一直占据计算资源……诸如此类,如果支持规则重复修改的话,这一类无效标签就会大量地消失。

    3.释放数据团队人力,释放业务团队的想象力。数据团队应该花较多的精力在企业的整个数据中台或新业务模型方面,而不是处理各业务线的标签诉求和标签维护上,自动化的标签生成能够极大限度地节省人力和释放团队想象力。

    关于第三项原则:

    1.规则及元信息维护:标签相关的规则和元信息要尽可能的暴露给使用者,让使用者在使用的时候,能清楚知道标签的规则是什么、创建者是谁、维护者是谁、标签的更新频率周期等,而不是没有规则,或者将规则存在标签建设团队内部的一个 word 文档中。

    2.调度机制及信息同步:标签之间有一些关联,标签之间的链条断裂,是否有个调度机制或者信息同步机制让大家的工作不被影响。

    3.高效统一的输出接口:将所有的业务信息和用户数据信息汇总在一起,有统一的输出接口,改变之前需要针对不同的业务系统开发不同接口的情况。

    我们回顾标签体系构建的三原则,本质上是解决了价值、手段、可持续性三方面的问题:以业务场景倒推需求,让业务方用起来作为最终目标,让标签系统价值得以实现;标签生成的自助化,它解决的是我们用什么样的手段去实现价值;有效的标签管理机制,意味着一套标签体系能否可持续性地在一家企业里面运作下去。

    总之,对企业最重要的是:一套标签系统能不能在业务上用起来,能不能覆盖更广泛的需求,而不是一个大而全的框架。

    标签体系构建的方法

    标签体系的实施架构

    标签体系架构可以分为三个部分:数据加工层,数据服务层,数据应用层。每个层面面向用户对象不一样,处理事务有所不同。层级越往下,与业务的耦合度就越小。层级越往上,业务关联性就越强

    以某电商公司为例

    数据加工层。数据加工层收集,清洗和提取来处理数据。M公司有多个产品线:电商交易,电子书阅读,金融支付,智能硬件等等。每个产品线的业务数据又是分属在不同位置。为了搭建完善的用户标签体系,需要尽可能汇总最大范围内的数据。同时每个产品线的也要集合所有端的数据,比如:App,web,微信,其它第三方合作渠道。

    收集了所有数据之后,需要经过清洗:去重,去刷单数据,去无效数据,去异常数据等等。然后再是提取特征数据,这部分就要根据产品和运营人员提的业务数据要求来做就好。

    数据业务层。数据加工层为业务层提供最基础数据能力,提供数据原材料。业务层属于公共资源层,并不归属某个产品或业务线。它主要用来维护整个标签体系,集中在一个地方来进行管理。

    在这一层,运营人员和产品能够参与进来,提出业务要求:将原材料进行切割。主要完成以下核心任务:

    • 定义业务方需要的标签。

    • 创建标签实例。

    • 执行业务标签实例,提供相应数据。

    数据应用层。应用层的任务是赋予产品和运营人员标签的工具能力,聚合业务数据,转化为用户的枪火弹药,提供数据应用服务。

    业务方能够根据自己的需求来使用,共享业务标签,但彼此业务又互不影响。实践中可应用到以下几块:

    • 智能营销

    • Feed流推荐

    • 个性化消息push

    标签体系的设计

    1.业务梳理

    以业务需求为导向,可以按下面的思路来梳理标签体系:

    • 有哪些产品线?产品线有哪些来源渠道?一一列出。

    • 每个产品线有哪些业务对象?比如用户,商品。

    • 最后再根据对象聚合业务,每个对象涉及哪些业务?每个业务下哪些业务数据和用户行为?

    结果类似如下:

    2.标签分类

    按业务需求梳理了业务数据后,可以继续按照业务产出对象的属性来进行分类,主要目的:

    • 方便管理标签,便于维护和扩展。

    • 结构清晰,展示标签之间的关联关系。

    • 为标签建模提供子集。方便独立计算某个标签下的属性偏好或者权重。

    梳理标签分类时,尽可能按照MECE原则,相互独立,完全穷尽。每一个子集的组合都能覆盖到父集所有数据。标签深度控制在四级比较合适,方便管理,到了第四级就是具体的标签实例。

    3.标签的模型

    按数据的实效性来看,标签可分为

    • 静态属性标签。长期甚至永远都不会发生改变。比如性别,出生日期,这些数据都是既定的事实,几乎不会改变。

    • 动态属性标签。存在有效期,需要定期地更新,保证标签的有效性。比如用户的购买力,用户的活跃情况。

    从数据提取维度来看,标签数据又可以分为类型。

    • 事实标签。既定事实,从原始数据中提取。比如通过用户设置获取性别,通过实名认证获取生日,星座等信息。

    • 模型标签。没有对应数据,需要定义规则,建立模型来计算得出标签实例。比如支付偏好度。

    • 预测标签。参考已有事实数据,来预测用户的行为或偏好。比如用户a的历史购物行为与群体A相似,使用协同过滤算法,预测用户a也会喜欢某件物品。

    4.标签的处理

    为什么要从两个维度来对标签区分?这是为了方便用户标签的进一步处理。

    静态动态的划分是面向业务维度,便于运营人员理解业务。这一点能帮助他们:

    • 理解标签体系的设计。

    • 表达自己的需求。

    事实标签,模型标签,预测标签是面向数据处理维度,便于技术人员理解标签模块功能分类,帮助他们:

    • 设计合理数据处理单元,相互独立,协同处理。

    • 标签的及时更新及数据响应的效率。

    以上面的标签图表为例,面临以下问题:

    • 属性信息缺失怎么办?比如,现实中总有用户未设置用户性别,那怎么才能知道用户的性别呢?

    • 行为属性,消费属性的标签能不能灵活设置?比如,活跃运营中需要做A/B test,不能将品牌偏好规则写死,怎么办?

    • 既有的属性创建不了我想要的标签?比如,用户消费能力需要综合结合多项业务的数据才合理,如何解决?

    模型标签的定义解决的就是从无到有的问题。建立模型,计算用户相应属性匹配度。现实中,事实标签也存在数据缺失情况。

    比如用户性别未知,但是可以根据用户浏览商品,购买商品的历史行为来计算性别偏好度。当用户购买的女性化妆品和内衣较多,偏好值趋近于性别女,即可以推断用户性别为女。

    模型计算规则的开放解决的是标签灵活配置的问题。运营人员能够根据自己的需求,灵活更改标签实例的定义规则。比如图表中支付频度实例的规则定义,可以做到:

    • 时间的开放。支持时间任意选择:昨天,前天,近x天,自定义某段时间等等。

    • 支付笔数的开放。大于,等于,小于某个值,或者在某两个值区间。

    标签的组合解决就是标签扩展的问题。除了原有属性的规则定义,还可以使用对多个标签进行组合,创建新的复合型标签。比如定义用户的消费能力等级。

    标签最终呈现的形态要满足两个需求:

    • 标签的最小颗粒度要触达到具体业务事实数据,同时支持对应标签实例的规则自定义。

    • 不同的标签可以相互自由组合为新的标签,同时支持标签间的关系,权重自定义。

    - END -

    历史好文推荐

    1. 从0到1搭建大数据平台之计算存储系统

    2. 从0到1搭建大数据平台之调度系统

    3. 从0到1搭建大数据平台之数据采集系统

    4. 如何从0到1搭建大数据平台

    展开全文
  • 个人工作的一些短视频标签体系建立。1.标签体系建立可以参考谷歌的标签体系,或者根据知识图谱建立。参考之后需要结合自己实际的业务进行粗化和细化,因为谷歌这个是针对一般的建立的,需要根据平台内容的分布和调性...
  • 大数据一直是各行各业的核心资产,蕴含巨大价值待挖掘,在数据→信息→知识的转化过程中,标签、指标是基础,它将抽象的数据转化为一个相对具象的信息中心,用户分群和用户画像都是在建立在信息中心上的综合应用手段...
  • 数据标签体系设计方案,包括了数据标签构建方法、体系架构、自然人和法人通用标签的基础模板等,用于指导企业标签体系建设。
  • 如何在ZB级的海量数据中获取并筛选有价值的信息,是对IT企业的一大挑战,通过构建客户标签,支撑精准营销服务,是应对上述挑战的有效解决方案,但是怎么设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打...
  • 易观用户标签体系设计
  • 标签体系实施架构

    千次阅读 2020-05-20 14:16:16
    标签体系架构可以分为三个部分:数据加工层,数据服务层,数据应用层。每个层面面向用户对象不一样,处理事务有所不同。层级越往下,与业务的耦合度就越小。层级越往上,业务关联性就越强。 数据加工层 数据加工层...
  • 标签体系构建原则

    千次阅读 2020-05-20 13:56:08
    每个公司的产品、运营、商务对标签的诉求有较大的差异,同时不同的运营团队的诉求也存在很大差异,⼤而全的标签框架实际是站在用户视角搭建的,但是标签的真正应用者是业务方,所以应该从业务视角来实现。...
  • 数据产品-指标标签体系构建

    千次阅读 2020-04-14 11:37:07
    数据产品-指标标签体系构建 作为刚毕业不到一年的数据产品经理,今天和大家分享一下我接触到和认知范围内的数据产品经理关于数据指标标签体系的构建过程是什么样子的 1、解读数据库数据 ①在我们公司(家居互联网...
  • 对用户标签的理解不够透彻?用户标签体系创建的方法论总是三头两绪?具体业务场景中,经常找不到数据分析的思路?本文根据神策数据业务咨询师钟秉哲以《构建用户标签体系,助力企业精细化运营》为主题...
  • 作者介绍 画像数据产品@草帽小子 《大数据实践之路:中台+分析+应用》核心作者 ...之前草帽小子有分析对比过不同厂的标签体系建设方法,对比后会发现不同业务下标签体系的分类方法也不一样,具体见《干货
  • 3种思路,打造用户画像的标签体系

    万次阅读 多人点赞 2018-05-22 21:17:17
    笔者见过很多做用户画像的产品经理,往往醉心于设计一个伟大、 光荣、正确的标签体系,这往往是形式主义的调调儿。 一般来说,设计一个标签体系有三种思路: 1. 结构化标签体系 简单地说,就是标签组织成...
  • 来源:谈数据(ID:learning-bigdata)本文长度为6500字,建议阅读10+分钟通过标签体系,建立数据中台,打通用户数据。01 从“标签”说起标签是用来标志您的产品目标和分...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 111,545
精华内容 44,618
关键字:

标签体系

友情链接: lamdam表达式.zip