精华内容
下载资源
问答
  • 标签体系

    2021-04-01 15:09:38
    为什么要先介绍标签体系? 一个推荐系统效果好与坏最基本的保障、最基础的是什么?如果让我来回答,一定是标签体系。 我这里说的标签主要是针对物料的,对于电商平台来说就是商品;对于音乐平台来说就是每一个首歌...

    为什么要先介绍标签体系?

    一个推荐系统效果好与坏最基本的保障、最基础的是什么?如果让我来回答,一定是标签体系

    我这里说的标签主要是针对物料的,对于电商平台来说就是商品;对于音乐平台来说就是每一个首歌,对于新闻资讯平台来说就是每一条新闻。对于用户画像中那些用户实时变化的兴趣点大都也是来自于标签体系,依据用户长期和短期行为中对于物料搜索、点击、收藏、评论、转发等事件,将物料的标签传导到用户画像上,就构成了用户的实时画像和离线画像中的各个动态维度。

    标签体系概览

    以京东的标签体系中的京东超市为例用思维导图来拆解,后面我们会详细的介绍如何构建标签体系

    这里对京东超市标签拆解粒度到三只松鼠年货大礼包的实体级别,实际上各个公司的标签体系大致都是如下构成

    一、二、三级分类体系都很好理解,参考京东超市的拆解,相信大家就会明白。标签体系中实体标签和概念标签不好理解。

    实体标签

    必须是名词,且必须是唯一指代。

    学术性的解释逼格高,但是不容易理解,回答下面的问题

    • 老板问:苹果,是实体标签吗?

    • 给你三秒钟思考

    • 你回答:是!

    • 老板说:错!

    • 你懵逼:靠!为啥不是?

    实体标签的要求:名词,且唯一指代。

    苹果,是名词,但不是唯一指代,苹果 = 科技公司、手机、水果、牛仔裤

    图片
    概念标签

    难道我就不能用“苹果”了吗?当然可以用,只不过要给它另外起个名字:概念标签。

    概念标签通常表示的是“一类”或“某种相似”的内容,例如

    图片
    主题词 


    这里以之家的标签体系举例,要给买车用户推荐评测导购(一级)的文章,用户画像中车的品牌(二级)偏好太粗,而实体标签如奔驰GLC又太细,填补这中间的粒度空白,满足用户购车意图的画像,就加入“代步优选”的主题词,这样不仅保持了推荐的多样性,又不至于过分精准而导致的极度收敛。

    图片

    以上大致介绍了一下标签体系,那么我们接下介绍一下如何构建标签体系以及其构建过程中应遵循的一些原则。

    标签体系构建原则


    原则一、放弃⼤而全的框架,以业务场景倒推标签需求

    原则二、标签生成自助化,解决效率和沟通成本

    原则三、有效的标签管理机制

    分别解释以下为什么提炼出这三个原则,分别用于解决什么问题?

    关于第一项原则:

    每个公司的产品、运营、商务对标签的诉求有较大的差异,同时不同的运营团队的诉求也存在很大差异,⼤而全的标签框架实际是站在用户视角搭建的,但是标签的真正应用者是业务方,所以应该从业务视角来实现。

    因此最佳的处理方式是,我们应该放弃顶层的用户抽象视角,针对各业务线或部门的诉求和实际的应用场景,分别将标签聚类起来提供给相应部门。

    之家就是非常典型的情况,商业同学更关心用户的消费能力相关的标签;自驾游负责同学更关心用户的位置和出行相关的标签;车友圈的同学更关注用户的社交活跃相关的标签;所以不可能一套标签覆盖整个运营团队, 这种以业务场景倒推标签需求的方法,能够与业务场景贴合更紧密,可用性上升。

    关于第二项原则:

    1. 标签生成的自助化能够让沟通成本降最低

    前面讲到各业务线对标签的定义的理解不同,需要标签系统建设团队花费大量的时间沟通。如果能够让业务方自己定义规则,这必然是沟通成本最低的方式。

    2. 标签生成的自助化,可重复修改的规则,降低无效标签的堆积

    业务一直在发展,如果规则一成不变则很难跟上业务节奏的变化。我曾拜访过一家电商,他们发现半年前定义“母婴客户群”的转化率一直在降低,因此根据实际情况重新修改和定义了“母婴客户群”规则,并命名为“母婴客户群(新)”,这时之前的规则是无效的,且会一直占据计算资源……诸如此类,如果支持规则重复修改的话,这一类无效标签就会大量地消失。

    3. 释放数据团队人力,释放业务团队的想象力

    数据团队应该花较多的精力在企业的整个数据中台或新业务模型方面,而不是处理各业务线的标签诉求和标签维护上,自动化的标签生成能够极大限度地节省人力和释放团队想象力。

    关于第三项原则:

    1. 规则及元信息维护

    标签相关的规则和元信息要尽可能的暴露给使用者,让使用者在使用的时候,能清楚知道标签的规则是什么、创建者是谁、维护者是谁、标签的更新频率周期等,而不是没有规则,或者将规则存在标签建设团队内部的一个 word 文档中。

    2. 调度机制及信息同步

    标签之间有一些关联,标签之间的链条断裂,是否有个调度机制或者信息同步机制让大家的工作不被影响。

    3. 高效统一的输出接口

    将所有的业务信息和用户数据信息汇总在一起,有统一的输出接口,改变之前需要针对不同的业务系统开发不同接口的情况。

    我们回顾标签体系构建的三原则,本质上是解决了价值、手段、可持续性三方面的问题:以业务场景倒推需求,让业务方用起来作为最终目标,让标签系统价值得以实现;标签生成的自助化,它解决的是我们用什么样的手段去实现价值;有效的标签管理机制,意味着一套标签体系能否可持续性地在一家企业里面运作下去。

    总之,对企业最重要的是:一套标签系统能不能在业务上用起来,能不能覆盖更广泛的需求,而不是一个大而全的框架。

    标签体系构建方法

     标签体系的实施架构 

    标签体系架构可以分为三个部分:数据加工层,数据服务层,数据应用层。每个层面面向用户对象不一样,处理事务有所不同。层级越往下,与业务的耦合度就越小。层级越往上,业务关联性就越强。

    以某电商公司为例:

    图片

    数据加工层

    数据加工层收集,清洗和提取来处理数据。M公司有多个产品线:电商交易,电子书阅读,金融支付,智能硬件等等。每个产品线的业务数据又是分属在不同位置。为了搭建完善的用户标签体系,需要尽可能汇总最大范围内的数据。同时每个产品线的也要集合所有端的数据,比如:App,web,微信,其它第三方合作渠道。

    收集了所有数据之后,需要经过清洗:去重,去刷单数据,去无效数据,去异常数据等等。然后再是提取特征数据,这部分就要根据产品和运营人员提的业务数据要求来做就好。

    数据业务层

    数据加工层为业务层提供最基础数据能力,提供数据原材料。业务层属于公共资源层,并不归属某个产品或业务线。它主要用来维护整个标签体系,集中在一个地方来进行管理。

    在这一层,运营人员和产品能够参与进来,提出业务要求:将原材料进行切割。主要完成以下核心任务:

    • 定义业务方需要的标签

    • 创建标签实例

    • 执行业务标签实例,提供相应数据

    数据应用层

    应用层的任务是赋予产品和运营人员标签的工具能力,聚合业务数据,转化为用户的枪火弹药,提供数据应用服务。

    业务方能够根据自己的需求来使用,共享业务标签,但彼此业务又互不影响。实践中可应用到以下几块:

    • 智能营销

    • Feed流推荐

    • 个性化消息push

    标签体系的设计 

    1. 业务梳理

    以业务需求为导向,可以按下面的思路来梳理标签体系:

    • 有哪些产品线?产品线有哪些来源渠道?一一列出

    • 每个产品线有哪些业务对象?比如用户,商品

    • 最后再根据对象聚合业务,每个对象涉及哪些业务?每个业务下哪些业务数据和用户行为?

    结果类似如下:

    图片

    2. 标签分类

    按业务需求梳理了业务数据后,可以继续按照业务产出对象的属性来进行分类,主要目的:

    • 方便管理标签,便于维护和扩展

    • 结构清晰,展示标签之间的关联关系

    • 为标签建模提供子集。方便独立计算某个标签下的属性偏好或者权重

    梳理标签分类时,尽可能按照MECE原则,相互独立,完全穷尽。每一个子集的组合都能覆盖到父集所有数据。标签深度控制在四级比较合适,方便管理,到了第四级就是具体的标签实例。

    图片

    3. 标签的模型

    按数据的实效性来看,标签可分为

    • 静态属性标签。长期甚至永远都不会发生改变。比如性别,出生日期,这些数据都是既定的事实,几乎不会改变

    • 动态属性标签。存在有效期,需要定期地更新,保证标签的有效性。比如用户的购买力,用户的活跃情况

    从数据提取维度来看,标签数据又可以分为类型。

    • 事实标签。既定事实,从原始数据中提取。比如通过用户设置获取性别,通过实名认证获取生日,星座等信息

    • 模型标签。没有对应数据,需要定义规则,建立模型来计算得出标签实例。比如支付偏好度

    • 预测标签。参考已有事实数据,来预测用户的行为或偏好。比如用户a的历史购物行为与群体A相似,使用协同过滤算法,预测用户a也会喜欢某件物品

    图片

    4. 标签的处理

    为什么要从两个维度来对标签区分?这是为了方便用户标签的进一步处理。

    静态动态的划分是面向业务维度,便于运营人员理解业务。这一点能帮助他们:

    • 理解标签体系的设计

    • 表达自己的需求

    事实标签,模型标签,预测标签是面向数据处理维度,便于技术人员理解标签模块功能分类,帮助他们:

    • 设计合理数据处理单元,相互独立,协同处理

    • 标签的及时更新及数据响应的效率

    以上面的标签图表为例,面临以下问题:

    • 属性信息缺失怎么办?比如,现实中总有用户未设置用户性别,那怎么才能知道用户的性别呢?

    • 行为属性,消费属性的标签能不能灵活设置?比如,活跃运营中需要做A/B test,不能将品牌偏好规则写死,怎么办?

    • 既有的属性创建不了我想要的标签?比如,用户消费能力需要综合结合多项业务的数据才合理,如何解决?

    模型标签的定义解决的就是从无到有的问题。建立模型,计算用户相应属性匹配度。现实中,事实标签也存在数据缺失情况。

    比如用户性别未知,但是可以根据用户浏览商品,购买商品的历史行为来计算性别偏好度。当用户购买的女性化妆品和内衣较多,偏好值趋近于性别女,即可以推断用户性别为女。

    模型计算规则的开放解决的是标签灵活配置的问题。运营人员能够根据自己的需求,灵活更改标签实例的定义规则。比如图表中支付频度实例的规则定义,可以做到:

    • 时间的开放。支持时间任意选择:昨天,前天,近x天,自定义某段时间等等

    • 支付笔数的开放。大于,等于,小于某个值,或者在某两个值区间

    标签的组合解决就是标签扩展的问题。除了原有属性的规则定义,还可以使用对多个标签进行组合,创建新的复合型标签。比如定义用户的消费能力等级。

    标签最终呈现的形态要满足两个需求:

    • 标签的最小颗粒度要触达到具体业务事实数据,同时支持对应标签实例的规则自定义

    • 不同的标签可以相互自由组合为新的标签,同时支持标签间的关系,权重自定义

    展开全文
  • 大数据构建用户标签体系
  • 我们要不的期是范添事大部会基近说小间进围砖本的为大数据平台建立一套标签体系,首先要明确我们要建立什么,在我看来我们需要建立独立的三样东西:类目标签体系、用户画像支器事的后功发久这含层请间业在屏有随些气...

    我们要不的期是范添事大部会基近说小间进围砖本的为大数据平台建立一套标签体系,首先要明确我们要建立什么,在我看来我们需要建立独立的三样东西:类目标签体系、用户画像支器事的后功发久这含层请间业在屏有随些气和域,实按控幻近持的前时来能过后些的处求也务浏蔽等机站风滚或默现钮制灯近持的前时来能过后些的和应用场景。

    类目标签体系是以业务核心为中心建立的,业务核心就是你要做的这个大数据平台里面最重要的那个点。举点例子,电商平台的业务核心就是商品,教育平台的核心业务就是教育。电商平台下的类目标签就以商品的分类为基础构建类目树,树的根节点就是商品,往下分可能包括女装/内衣、男装/运动户外、女鞋/男鞋/箱包等子类,等到分到了叶子节点(注意不是越细越好,再往下分对于业务毫无助益了就可以不分了),就可以分析叶子节点的自有属性并且添加到类目树上面去,那么这时一棵类目树就构建好了。怎么确定一个大数据平台的业务核心是什么,这里我提供一种方法:利用头脑风暴把有关涉及该平台的所有事物罗列出来,然后根据物品与平台的关联性大小为基准,将关联性较小的物品一一删除,最后留下来的那个物品就是该平台的业务核心。

    但是一直到这项容近目手近目手近目手近目手近目手近目手里我们建立的并不是类目标签体系,只能称之为类目属性体系。如何从类目标签体系进化到类目属性体系呢?这个时候我们就需要对标签有更加深入的了解了。如果说标签就是一些描述性的词语或者短语的话,那么这些标签从何而来?我们可以从原始的数据源中获取到标签,通过纯粹的语义分析对自然语言处理来获取,这里我们获取到的是原始数据标签。对原始数据进行一定的统计学分析之后我们也可以获取到一部分标签,这里的标签我们称之为统计数据标签。或者我们也可以对原始数据经过算法模型计算后获取一些高级标签,这里的标签我们称之为算法数据标签。总结来说,标签分为三类:原始数据标签、统计数据标签、算法数据标签。类目属性体系中只包括原始数据标签,而我们需要的类目标签体系中需要囊括这三种类型的标用处它有近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放近框理是放签。

    至的域近处上近处上近处上近处上近处上近处上于用户画像,我们可以先浅显地认为这就是人的维度。精确来说,这里的用户画像是在为这个业务系统中所有涉及到的角色做总结性的画像,用户画像本质上也是一套标签体系,只是有着相同的结构而非相同的内容。在用户画像这套标签体系中,分为静态信息和动态信息两部分。静态信息就是用户的自有属性,相当于类目标签体系中叶子节点的自有属性,同样的在静态信息中包含的标签也应该包括三种类型的标签。动态信息就是一个比较抽象的概念了,它主要就是要记录什么人什么时间什么地点做了一件什么事情(这部分详细内容看另外一篇)。如果拿数据库记录来说,静态信息就相当于记录进去一条信息,然后可以对这个信息做修改,或者再增加新的字段;动态信息就是不停地增加新的字段,但是不可以修改之前添加进去是如回泉幻近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水灯近是小事水的记录。

    最后来说用处它有近框理是放近框理是放近框理是放近应用场景,当我们把业务核心和用户画像理清楚之后,就可以来分析应用场景了,业务核心之间(多个业务核心的状况下)、业务和用户角色之间、用户角色和用户角色之间,一旦产生交互就可以形成应用场景,但是我们仍然需要记住一切以业务范围为首要考量,对于不在业务范围内的应用场景我们需要剔除出去。可以说,应用场景囊括了所有说础开数间行屏。标控近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最移制近术第发据也商蔽最游离的标签。

    在把类的整序大作站对近从体的家为宽应近从体的家目标签体系、用户画像和应用场景都建立好了之后,我们就可以以业务场景为基础写模型了(这里我更喜欢称呼它为小故事),就是完整描述下来一套业务流程,这样就能更加清楚地了解到这三者之间是一种怎样相互协作者天后小剑含个结在页别气。效按高近浏天来痛不的项构浏面了风整果钮度近浏天来痛不的项构浏面了风整果钮度近浏天来痛不的项构浏面了风整果钮度近浏天来痛不的项构浏面了风整果钮度近浏天来痛不的项构浏面了风整果钮度近浏天来的关系了。

    本文来源于网络:查看 >https://blog.csdn.net/Dorothy_AaAa/article/details/78123781

    展开全文
  • 大数据 行业标签体系云上大数据仓库解决方案阿里云为企业提供稳定可靠离线数仓和实时数仓的解决方案,包括数据采集、数据存储、数据开发、数据服务、数据运维、数据安全、数据质量、数据地图等完整链路。离线数仓...

    大数据 行业标签体系

    云上大数据仓库解决方案

    阿里云为企业提供稳定可靠离线数仓和实时数仓的解决方案,包括数据采集、数据存储、数据开发、数据服务、数据运维、数据安全、数据质量、数据地图等完整链路。

    离线数仓

    基于Serverless的云上数据仓库解决方案。

    架构特点

    开箱即用:简单几步开启自己的一站式大数据开发平台

    低TCO:Serverless服务,免运维,降低企业成本

    资源弹性:根据数据规模系统自动扩展集群存储和计算能力

    强数据安全:多层沙箱机制防护与监控,备细粒度化授权

    实时数仓架构特点

    秒级延迟,实时构建数据仓库,架构简单,传统数仓平滑升级。

    架构特点

    数据模型基本不变

    消息队列取代传统数仓分层表

    订阅式实时计算取代调度式批处理

    架构类型

    Lambda架构

    逐渐升级,批流结合

    Kappa架构

    一套系统,维护简单

    方案优势

    离线数仓超大规模计算和数据治理方案

    阿里云大数据计算服务针对PB/EB级数据进行分布式的数据加工,并在数据集成、加工、应用过程中提供全链路数据质量监控和保障,同时提供全方位的数据安全管控,字段级权限访问。

    实时数仓超强的实时计算能力与快速搭建

    阿里巴巴双11每秒处理日志数峰值达到25.5亿,全链路延迟在3秒,大幅提升了实时任务的可扩展性、性能、用户易用性、改善了任务延迟的SLA,并能够秒级恢复。

    展开全文
  • 给客户培训整理的用户画像流程介绍,包括用户标签体系构建流程、标签生命周期管理、数据架构、标签工厂、标签存储等
  • 但是怎么设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打?怎么使用用户标签创建商业价值?这些都是产品设计层面需要解决的问题。掌上医讯一直以来都致力于打造医生的今日头条和智能化的学习平台,通过...

    如何在ZB级的海量数据中获取并筛选有价值的信息,是对IT企业的一大挑战。通过构建客户标签,支撑精准营销服务,是应对上述挑战的有效解决方案。

    但是怎么设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打?怎么使用用户标签创建商业价值?

    这些都是产品设计层面需要解决的问题。

    掌上医讯一直以来都致力于打造医生的今日头条和智能化的学习平台,通过大数据技术实现医生学习的智能化和个性化,而要构建这样一个学习平台,最基础的就是要建立用户的标签体系。

    经过长时间的学习、思考、借鉴和实践,现在已经有了自己的标签构建思路,并且也已经提取出了符合自身业务的标签。我们十分重视用户行为日志的收集,现在已经有了亿万级别的日志数据,正在搭建数据处理和标签计算平台,以下是我们整理的建设思想。

    1.标签系统的结构

    标签系统可以分为三个部分:数据加工层、数据服务层和数据应用层。

    每个层面向的用户对象不一样,处理事务有所不同。层级越往下,与业务的耦合度就越小。层级越往上,业务关联性就越强。

    2.数据加工层

    数据加工层收集、清洗和提取数据。掌上医讯有诸多的学习模块,同时又有网站、APP、小程序等多个产品形式,每个产品模块和产品端都会产生大量的业务数据和行为数据,这些数据极为相似又各不相同,为了搭建完善的用户标签体系,需要尽可能汇总最大范围的数据。收集了所有数据之后,需要经过清洗、去重、去无效、去异常等等。

    3.数据业务层

    数据加工层为业务层提供最基础的数据能力,提供数据原材料。业务层属于公共资源层,并不归属某个产品或业务线。它主要用来维护整个标签体系,集中在一个地方来进行管理。

    在这一层,运营人员和产品能够参与进来,提出业务要求:将原材料进行切割。

    主要完成以下核心任务:

    定义业务方需要的标签。

    创建标签实例。

    执行业务标签实例,提供相应数据。

    4.数据应用层

    应用层的任务是赋予产品和运营人员标签的工具能力,聚合业务数据,构建具体的数据应用场景。

    (1)标签的类型

    从数据提取维度来看,标签可分为:事实标签、模型标签和预测标签。

    (2)事实标签

    从生产系统获取数据,定性或定量描述用户的自然属性、产品属性、消费属性、资源属性等,以及根据工作人员经验积累的业务规则进行筛选、分析生产的标签,如是否活跃用户、是否是考生等。

    (3)模型标签

    对用户属性及行为等属性的抽象和聚类,通过剖析用户的基础数据为用户贴上相应的总结概括性标签及指数,标签代表用户的兴趣、偏好、需求等,指数代表用户的兴趣程度、需求程度、购买概率等。

    (4)预测标签

    基于用户的属性、行为、信令、位置和特征,挖掘用户潜在需求,针对这些潜在需求配合营销策略、规则进行打标,实现营销适时、适机、适景推送给用户。

    从数据的时效性来看,标签可分为:静态属性标签和动态属性标签。

    (5)静态属性标签

    长期甚至永远都不会发生改变。比如性别,出生日期,这些数据都是既定的事实,几乎不会改变。

    (6)动态属性标签

    存在有效期,需要定期地更新,保证标签的有效性。比如:用户的购买力,用户的活跃情况。

    5.标签的定义

    给用户打标签,建立用户画像,最终都是为了去应用,所以我们要站在应用场景上去定义用户的标签体系,每个标签都有最终的用途。比如:我们做考试培训服务,我们需要建立“是否考生”的标签。

    另外,不同的行业他们的用户特征也是有显著区别的,比如:医生用户相比普通用户来说,就多了像“科室”、“职称”、“所在医院等级”等特殊含义的标签。

    而标签是有层级关系的,既是为了管理,更好的理解,又是为了控制粗细力度,方便最终的应用。标签深度一般控制在四级比较合适,到了第四级就是具体的标签实例。

    我们根据公司的业务首先划分了人口属性、行为属性、用户分类和商业属性四个大的分类,下面又分了上网习惯、学习惯、人群属性、消费能力、消费习惯等分类,最末级精确到用户的活跃等级、阅读来源、考试偏好等具体的标签。

    6.标签的维护

    每个标签都不会凭空产生的,也不会一成不变,更不会凭空消失。标签的维护需要生成规则,需要定义权重,需要更新策略。

    7.生成规则

    如第一部分所说,标签分为事实标签,模型标签和预测标签三大类。对于这三类的标签,生成规则的难度和复杂性也是逐级递增的。事实标签只需要考虑从什么地方提取即可,它即包含明确的标签定义,又包含无法穷举的标签集,比如:关注的病种。

    而模型标签需要进行数据的关联和逻辑关系的设计,通过一定的模型对数据进行计算得来。而预测标签相对就非常的复杂,无法从原始数据提取标签,标签的生成准确度就太依赖我们大数据分析和人工智能技术的应用。

    8.定义权重

    一个标签会在多个场景下出现,比如:一个疾病标签,它极可能在浏览过程中生成,也有可能在搜索场景下产生,但是对于这两个场景所对应的同一个标签,他们的权重是不同的。浏览相比搜索,权重要小得多,因为搜索的主动需求更大。

    9.更新策略

    上文我们从数据的时效性上对标签分为静态属性标签和动态属性标签,对于静态属性标签的处理相对比较简单,就不停的累加即可。但是对于动态属性标签,需要对过期标签进行降权甚至删除处理,比如:医生考试前和考试后,会影响“是否考生”这个标签的,这就需要制定更新策略。

    10.标签建设的技术架构

    标签体系的建设涉及很多环节,数据量也十分巨大,需要有一个健壮且高效的技术架构来支持数据的存储及计算,掌上医讯采用了sql数据库和no-sql数据库来满足结构化数据和非结构化数据的存储。

    使用hadoop的分布式存储技术及hive和hbase组件作为数据仓库,使用MapReduce和spark分布式计算来提高计算速度,使用kylin进行多维分析,通过BI工具和接口对外提供应用,使用sqoop和kettle进行数据的抽取及流程的调用。

    11.更多的应用场景

    用户标签建立已经基本应用在掌上医讯的内容智能推荐的学习场景中,但随着标签的完善以及智能化处理的提升,这套标签体系将有更广阔的应用场景。

    (1)智能化学习场景的构建

    通过用户学习需求的标签的分析进行用户分群,针对不同的用户群在APP的功能和内容上进行个性化展示,满足不同学习需求的用户个性化的学习服务。

    (2)精准营销推广的建立

    更细粒度的对用户进行筛选,同时能够精准预测可能存在的目标用户进行推广,从而扩大医生覆盖,提升推广的转化率。

    (3)KOL用户画像的描绘

    基于该标签模型,增加对外部数据的采集分析,更加完整的生成医生360度的用户画像,帮助企业寻找潜在的KOL用户,实现用户洞察,辅助市场决策。

    标签的建设是一个看似高大上,其实很繁琐、纠结的过程,需要对业务抽丝剥茧,还要应对运营需求的各种变化,不过对公司发展的影响也是深远的。

    End.

    作者:小牛学堂

    来源:简书

    本文均已和作者授权,如转载请与作者联系。

    展开全文
  • 如何设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打?怎么使用用户标签创建商业价值?在大数据时代,数据在呈现出海量化、多样化和价值化变化的同时,也改变了传统IT行业的市场竞争环境、营销策略和...
  • 编辑导语:如今这个大数据时代,我们经常会听到“用户画像”“标签体系”这样的词,用户画像更多是对一个人物的刻画,而标签体系则是偏管理和划分;本文作者分享了关于标签体系的建设,我们一起来看一下。我是要成为...
  • 受众定向标签体系

    2018-12-08 09:20:22
      在一些反映用户兴趣类的受众定向方法(如行为定向、上下文定向等)中,需要一个标签体系,将每个用户映射到其中的一个或几个标签上去。如何规划合理的标签体系对广告产品的运营影响非常大,因此,这是产品策略中...
  • 推荐系统之标签体系

    2021-01-23 14:01:13
    为什么要先介绍标签体系? 一个推荐系统效果好与坏最基本的保障、最基础的是什么?如果让我来回答,一定是标签体系。我这里说的标签主要是针对物料的,对于电商平台来说就是商品;对于音乐平台来说就是每一个首歌,...
  • 标签体系实施架构

    2020-05-20 14:16:16
    标签体系架构可以分为三个部分:数据加工层,数据服务层,数据应用层。每个层面面向用户对象不一样,处理事务有所不同。层级越往下,与业务的耦合度就越小。层级越往上,业务关联性就越强。 数据加工层 数据加工层...
  • 介绍科学构建用户标签体系,本文档版权归神策数据所有,大概内容如下: •为什么要做用户标签画像 • 如何构建完备的用户标签体系 • 标签的生产和创建 • 如何利用用户画像分析赋能业务落地 请合理使用及分享,谢谢...
  • 大数据标签体系建立

    万次阅读 2017-09-28 15:08:15
    我们要为大数据平台建立一套标签体系,首先要明确我们要建立什么,在我看来我们需要建立独立的三样东西:类目标签体系、用户画像和应用场景。 类目标签体系是以业务核心为中心建立的,业务核心就是你要做的这个...
  • 企业级360度全方位用户标签体系,全方位分析用户行为标签。
  • 如何建立成熟的标签体系,是本文的重点。目录:用户标签是什么?如何搭建标签体系?用户标签的作用?一、用户标签是什么用户标签是构成用户画像的核心因素,是将用户在平台内所产生的行为数据,分析提炼后生成具有...
  • 为什么要先介绍标签体系?一个推荐系统效果好与坏最基本的保障、最基础的是什么?如果让我来回答,一定是标签体系。我这里说的标签主要是针对物料的,对于电商平台来说就是商品;对于音乐平台来说就是...
  • 导读:目前基于用户画像的标签体系在各行各业开始得到应用,对于涉及范围广,专业知识深的互联网招聘领域来说,建立标签体系的难点是什么呢?应该如何建立标签体系?怎么验证标签体系的准确性?文章对这三个问题展开...
  • “本篇主要讲解精细化运营中最重要的步骤 —— 标签体系的搭建。直白地说,标签体系搭建的好坏,会对精细化运营的效果产生直接的影响。” 一、什么是精细化运营? 精细化运营是使用用户的行为和特征,结合大数据...
  • 一、为什么需要标签?随着互联网的兴起,每天有大量的内容以视频等形式被...通过标签体系的建设,一方面让数据变得可阅读、易理解,方便业务使用;另一方面通过标签类目体系将标签组织排布,以一种适用性更好的组织...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 2,504
精华内容 1,001
关键字:

标签体系