精华内容
下载资源
问答
  • 用户画像标签体系建设(简易版)

    千次阅读 2020-03-18 17:16:42
    用户画像标签体系建设(简易版) 一. 项目背景及概要 在互联网逐步步入大数据时代后,不可避免的给企业和用户行为带来一系列改变与重塑;其中最大的变化莫过于,用户的一切行为在企业面前是“可视化”的.随着大数据...

    一. 项目背景及概要

    在互联网逐步步入大数据时代后,不可避免的给企业和用户行为带来一系列改变与重塑;其中最大的变化莫过于,用户的一切行为在企业面前是“可视化”的.随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精细化运营及精准营销服务,进而深入挖掘潜在的商业价值.于是,用户画像的概念也就应运而生

    二. 项目目标

    全业务运营下,用户画像及应用基于PG(关系型数据库)和大数据平台采集分析,把用户特征标签封装成数据接口服务,实时推送到一线,使信息数据变成生产力,项目实现目标如下:
    一、用户画像模型封装
    (1)基于PG(关系型数据库)和大数据平台(hive、impala)
    包含基础标签与分析类知识标签,实现用户特征全貌刻画;
    (2)多种封装角度
    分用户类别、渠道内容、业务场景进行封装配置.
    二、接口数据实时推送
    实现用户画像数据实时更新至运营及营销统一视图(WeMeta、WeData、WeSearch等)中进行展现,并实时反馈运营及营销信息问题,保证数据应用的时效性.
    三、展现UI封装
    依托用户画像,将推荐信息配置应用端进行可视化展现,集中活动运营,实现千人千面的运营效果.

    三. Mysql表设计

    1. 业务方案配置表

    业务方案配置

    2. 方案关联权重配置明细表

    方案关联权重配置明细

    3. 权重关联用户标签表

    在这里插入图片描述

    四. Hive表设计

    在这里插入图片描述

    五. 标签统计

    在这里插入图片描述

    六. 用户画像产品化

    1.1 用户标签查询页面

    在这里插入图片描述

    1.2 用户标签查询代码(第一种 : 写入Hbase)

    在这里插入图片描述

    1.3 用户标签查询代码(第二种 : 写入ElasticSearch)
    object UserTagToEs {
    
      // ElasticSearch中的Index名称
      val ES_TYPE_NAME = "user_tag"
    
      // 配置主机名:端口号的正则表达式
      val ES_HOST_PORT_REGEX = "(.+):(\\d+)".r
    
    
      /**
        * Store Data In ElasticSearch
        *
        * @param data.  用户标签数据集
        * @param esConf. ElasticSearch的配置对象
        */
      private def storeUserTagDataInES(data: DataFrame)(implicit esConf: ESConfig): Unit = {
    
        // 需要操作的Index名称
        val indexName = esConf.index
    
        // 新建一个到ES的连接配置
        var settings: Settings = Settings.builder().put("cluster.name", esConf.clusterName).build()
    
        // 创建到ES的连接客户端
        val esClient = new PreBuiltTransportClient(settings)
    
        //对于设定的多个Node分别通过正则表达式进行模式匹配,并添加到客户端实例
        esConf.transportHosts.split(";")
          .foreach {
            case ES_HOST_PORT_REGEX(host: String, port: String) =>
              esClient.addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName(host), port.toInt))
          }
    
        // 检查如果Index存在,那么删除Index
        if (esClient.admin().indices().exists(new IndicesExistsRequest(indexName)).actionGet().isExists) {
          // 删除Index
          esClient.admin().indices().delete(new DeleteIndexRequest(indexName)).actionGet()
        }
        // 创建Index
        esClient.admin().indices().create(new CreateIndexRequest(indexName)).actionGet()
    
        // 声明写出时的ES配置信息
        val tagOptions = Map("es.nodes" -> esConf.httpHosts,
          "es.http.timeout" -> "100m",
          "es.mapping.id" -> "user_id")
    
        // 数据写出时的Type名称【表】
        val movieTypeName = s"$indexName/$ES_TYPE_NAME"
    
    
        // 将用户标签数据保存到ES
        data
          .write.options(tagOptions)
          .mode("overwrite")
          .format("org.elasticsearch.spark.sql")
          .save(movieTypeName)
    
      }
    
    
      def main(args: Array[String]): Unit = {
    
        System.setProperty("hadoop.home.dir", "D:\\hadoop-common-2.2.0-bin-master")
    
        //如果想让hive运行在spark上,一定要开启spark对hive的支持
        val hiveContext = SparkSession.builder()
          .enableHiveSupport()
          .appName("UserTagToEs")
          .master("local[*]")
          .getOrCreate()
    
        //创建全局配置
        val params = scala.collection.mutable.Map[String, Any]()
        params += "spark.cores" -> "local[*]"
        params += "es.httpHosts" -> "spark01:9200"
        params += "es.transportHosts" -> "spark01:9300"
        params += "es.index" -> "user_draw_tag"
        params += "es.cluster.name" -> "es-cluster"
    
        // 定义ElasticSearch的配置对象
        implicit val esConf = new ESConfig(params("es.httpHosts").asInstanceOf[String],
          params("es.transportHosts").asInstanceOf[String],
          params("es.index").asInstanceOf[String],
          params("es.cluster.name").asInstanceOf[String])
    
        //查询每个用户相关标签
        val resDF = hiveContext.sql(
          """
            | SELECT
            | t.user_id,
            | concat_ws(',',collect_set(tag_par)) AS tag_par
            | FROM
            | (
            | SELECT user_id,
            | concat_ws(':',tag_id,CAST(tag_value AS string)) AS tag_par
            | FROM
            | bigdata.hive_business_project_action_tag
            | WHERE dt = '2020-03-24'
            | ) t
            | GROUP BY t.user_id
          """.stripMargin)
    
        resDF.cache()
    
        storeUserTagDataInES(resDF);
    
        resDF.unpersist()
    
        hiveContext.close()
    
      }
    
    }
    
    2. 标签编辑页面

    在这里插入图片描述

    3. 人群划分

    在这里插入图片描述

    展开全文
  • 但是怎么设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打?怎么使用用户标签创建商业价值?这些都是产品设计层面需要解决的问题。掌上医讯一直以来都致力于打造医生的今日头条和智能化的学习平台,通过...

    如何在ZB级的海量数据中获取并筛选有价值的信息,是对IT企业的一大挑战。通过构建客户标签,支撑精准营销服务,是应对上述挑战的有效解决方案。

    但是怎么设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打?怎么使用用户标签创建商业价值?

    这些都是产品设计层面需要解决的问题。

    掌上医讯一直以来都致力于打造医生的今日头条和智能化的学习平台,通过大数据技术实现医生学习的智能化和个性化,而要构建这样一个学习平台,最基础的就是要建立用户的标签体系。

    经过长时间的学习、思考、借鉴和实践,现在已经有了自己的标签构建思路,并且也已经提取出了符合自身业务的标签。我们十分重视用户行为日志的收集,现在已经有了亿万级别的日志数据,正在搭建数据处理和标签计算平台,以下是我们整理的建设思想。

    1.标签系统的结构

    标签系统可以分为三个部分:数据加工层、数据服务层和数据应用层。

    每个层面向的用户对象不一样,处理事务有所不同。层级越往下,与业务的耦合度就越小。层级越往上,业务关联性就越强。

    2.数据加工层

    数据加工层收集、清洗和提取数据。掌上医讯有诸多的学习模块,同时又有网站、APP、小程序等多个产品形式,每个产品模块和产品端都会产生大量的业务数据和行为数据,这些数据极为相似又各不相同,为了搭建完善的用户标签体系,需要尽可能汇总最大范围的数据。收集了所有数据之后,需要经过清洗、去重、去无效、去异常等等。

    3.数据业务层

    数据加工层为业务层提供最基础的数据能力,提供数据原材料。业务层属于公共资源层,并不归属某个产品或业务线。它主要用来维护整个标签体系,集中在一个地方来进行管理。

    在这一层,运营人员和产品能够参与进来,提出业务要求:将原材料进行切割。

    主要完成以下核心任务:

    定义业务方需要的标签。

    创建标签实例。

    执行业务标签实例,提供相应数据。

    4.数据应用层

    应用层的任务是赋予产品和运营人员标签的工具能力,聚合业务数据,构建具体的数据应用场景。

    (1)标签的类型

    从数据提取维度来看,标签可分为:事实标签、模型标签和预测标签。

    (2)事实标签

    从生产系统获取数据,定性或定量描述用户的自然属性、产品属性、消费属性、资源属性等,以及根据工作人员经验积累的业务规则进行筛选、分析生产的标签,如是否活跃用户、是否是考生等。

    (3)模型标签

    对用户属性及行为等属性的抽象和聚类,通过剖析用户的基础数据为用户贴上相应的总结概括性标签及指数,标签代表用户的兴趣、偏好、需求等,指数代表用户的兴趣程度、需求程度、购买概率等。

    (4)预测标签

    基于用户的属性、行为、信令、位置和特征,挖掘用户潜在需求,针对这些潜在需求配合营销策略、规则进行打标,实现营销适时、适机、适景推送给用户。

    从数据的时效性来看,标签可分为:静态属性标签和动态属性标签。

    (5)静态属性标签

    长期甚至永远都不会发生改变。比如性别,出生日期,这些数据都是既定的事实,几乎不会改变。

    (6)动态属性标签

    存在有效期,需要定期地更新,保证标签的有效性。比如:用户的购买力,用户的活跃情况。

    5.标签的定义

    给用户打标签,建立用户画像,最终都是为了去应用,所以我们要站在应用场景上去定义用户的标签体系,每个标签都有最终的用途。比如:我们做考试培训服务,我们需要建立“是否考生”的标签。

    另外,不同的行业他们的用户特征也是有显著区别的,比如:医生用户相比普通用户来说,就多了像“科室”、“职称”、“所在医院等级”等特殊含义的标签。

    而标签是有层级关系的,既是为了管理,更好的理解,又是为了控制粗细力度,方便最终的应用。标签深度一般控制在四级比较合适,到了第四级就是具体的标签实例。

    我们根据公司的业务首先划分了人口属性、行为属性、用户分类和商业属性四个大的分类,下面又分了上网习惯、学习惯、人群属性、消费能力、消费习惯等分类,最末级精确到用户的活跃等级、阅读来源、考试偏好等具体的标签。

    6.标签的维护

    每个标签都不会凭空产生的,也不会一成不变,更不会凭空消失。标签的维护需要生成规则,需要定义权重,需要更新策略。

    7.生成规则

    如第一部分所说,标签分为事实标签,模型标签和预测标签三大类。对于这三类的标签,生成规则的难度和复杂性也是逐级递增的。事实标签只需要考虑从什么地方提取即可,它即包含明确的标签定义,又包含无法穷举的标签集,比如:关注的病种。

    而模型标签需要进行数据的关联和逻辑关系的设计,通过一定的模型对数据进行计算得来。而预测标签相对就非常的复杂,无法从原始数据提取标签,标签的生成准确度就太依赖我们大数据分析和人工智能技术的应用。

    8.定义权重

    一个标签会在多个场景下出现,比如:一个疾病标签,它极可能在浏览过程中生成,也有可能在搜索场景下产生,但是对于这两个场景所对应的同一个标签,他们的权重是不同的。浏览相比搜索,权重要小得多,因为搜索的主动需求更大。

    9.更新策略

    上文我们从数据的时效性上对标签分为静态属性标签和动态属性标签,对于静态属性标签的处理相对比较简单,就不停的累加即可。但是对于动态属性标签,需要对过期标签进行降权甚至删除处理,比如:医生考试前和考试后,会影响“是否考生”这个标签的,这就需要制定更新策略。

    10.标签建设的技术架构

    标签体系的建设涉及很多环节,数据量也十分巨大,需要有一个健壮且高效的技术架构来支持数据的存储及计算,掌上医讯采用了sql数据库和no-sql数据库来满足结构化数据和非结构化数据的存储。

    使用hadoop的分布式存储技术及hive和hbase组件作为数据仓库,使用MapReduce和spark分布式计算来提高计算速度,使用kylin进行多维分析,通过BI工具和接口对外提供应用,使用sqoop和kettle进行数据的抽取及流程的调用。

    11.更多的应用场景

    用户标签建立已经基本应用在掌上医讯的内容智能推荐的学习场景中,但随着标签的完善以及智能化处理的提升,这套标签体系将有更广阔的应用场景。

    (1)智能化学习场景的构建

    通过用户学习需求的标签的分析进行用户分群,针对不同的用户群在APP的功能和内容上进行个性化展示,满足不同学习需求的用户个性化的学习服务。

    (2)精准营销推广的建立

    更细粒度的对用户进行筛选,同时能够精准预测可能存在的目标用户进行推广,从而扩大医生覆盖,提升推广的转化率。

    (3)KOL用户画像的描绘

    基于该标签模型,增加对外部数据的采集分析,更加完整的生成医生360度的用户画像,帮助企业寻找潜在的KOL用户,实现用户洞察,辅助市场决策。

    标签的建设是一个看似高大上,其实很繁琐、纠结的过程,需要对业务抽丝剥茧,还要应对运营需求的各种变化,不过对公司发展的影响也是深远的。

    End.

    作者:小牛学堂

    来源:简书

    本文均已和作者授权,如转载请与作者联系。

    展开全文
  • 本文作者分享了关于标签体系建设,我们一起来看一下。我是要成为世界级大剑豪的男人——索隆。2017年,索隆离开了校园,跟随草帽小子出海,进入伟大航路,从事数据产品工作;他心中一直怀揣着一个成为世界级大剑豪...

    编辑导语:如今这个大数据时代,我们经常会听到“用户画像”“标签体系”这样的词,用户画像更多是对一个人物的刻画,而标签体系则是偏管理和划分;本文作者分享了关于标签体系的建设,我们一起来看一下。

    ee31b36f235f93284e77e03b373c0a6b.png

    我是要成为世界级大剑豪的男人——索隆。

    2017年,索隆离开了校园,跟随草帽小子出海,进入伟大航路,从事数据产品工作;他心中一直怀揣着一个成为世界级大剑豪的梦想,并为此不断的刻苦训练着。

    在数据浪潮的推动下,索隆所在的团队想要0-1构建标签体系;这对于之前毫无画像体系建设经验的索隆来说,无疑是一个重大的挑战;但索隆还是欣然的接受了这个挑战,毕竟构建标签体系还是个很有意思的事情。

    接下来的篇章会记录小白数据产品索隆,入职某一创业公司的工作点滴,看其在数据产品道路上摸爬滚打的点滴。

    精细化运营场景下需要对用户画像进行刻画,而要对一个人进行刻画,常见的方法就是描述出其属性,通过各种属性能够还原一个人的行为全貌,相当于一个人的个人简历。

    基本每个职场人都有求职找工作的经历,在找工作前需要做简历的投递,简历包含了个人基础信息、学校信息、工作经历、兴趣爱好、专业特长等,其作用在于能够帮助面试官更清晰的了解候选者的全貌特征。

    • 个人基本信息,包含性别、年龄、籍贯、居住地、期待求职岗位、期待薪资等;
    • 学校信息,包含毕业院校、时间、专业、专业课程等;
    • 工作经历,包含工作年限,从事的职业、公司、职业生涯中的关键行为等;
    • 兴趣爱好,包含爱打羽毛球、瑜伽、乒乓球、热爱摄影、旅游等;
    • 专业特长,包含数据分析、产品设计、项目管理等;

    简历的书写过程,就是对一个人物画像刻画的过程,人物刻画时所需的要素即为标签;通过这几十几百个标签,能够帮助我们更好的还原用户画像,从而针对用户进行精细化运营。

    作为一个数据中台产品,索隆对业务的了解甚微,而以前又从未做过标签的情况下,索隆梳理了自己的思路,最终选择业务、数据两手抓的方式。

    索隆花了1周的时间,分析当前的业务流程,核心业务流程上的关键节点,核心节点上所需的标签;并调研目前2大需求方部门,数据运营、电销的需求及应用场景,划分标签类别、标签字段、标签规则、应用场景等信息。

    又花了1周的时间,分析业界龙头阿里的数据体系,包含达摩盘、数据银行,了解标签的构建流程、构建规则、标签命名方式、描述、有效期、覆盖度分、热度分。

    37a81428a608afb327dc6ac4dfadda34.png

    经过较为全面的调研,索隆自信满满的梳理出了一版大而全的标签,包含基础信息、家庭信息、工作信息、兴趣偏好、用户行为路径等标签,约80余个,兴致勃勃的去找领导鹰眼进行评审。

    4d8173351ea5fd5cc243206319f7892f.png

    但会上却遭遇了领导鹰眼的灵魂拷问:

    索隆:鹰眼,我根据当前的业务需求及系统性需求制定了一版标签,主要分为基础信息、线上行为、线索、商机、签约、推荐6大标签类型,分别有如下标签…

    鹰眼:这些标签的主要业务目标是什么?

    索隆:主要在于拉新、促活、推荐。

    鹰眼:那当前业务上的最迫切的需求是什么?为什么?

    索隆:最迫切的应该是围绕着增长来做。

    鹰眼:那当前不同用户量级是多少?拉新目标是要提升几个点?

    索隆:推荐、商机的量级需要业务方再做补充,目前的拉新目标提升1%。

    鹰眼:现有每月新增的用户是多少,影响因素分别是什么?需要对不同用户实施哪些运营策略?覆盖的用户量级是多少?标签做出来后,运营的使用频率会是怎样?这些标签是否能够满足现有需求?如何监测拉新效果?标签实现逻辑是什么?

    索隆:我…

    于是索隆只能十分尴尬地收场,明明觉得自己已经分析准备得很充分了,没想到在旁人看来只做了冰山一角。

    这是很多新手数据产品都会遇到的问题,市面上可参考的画像产品较少,所以能搜集来的经验也会更加不足,再加上公司内也没有相关能指导的人,标签画像体系设计简直就是难上加难。

    那是不是这样就没办法继续下去了呢?

    答案也是否定的。

    纵观上述案例,领导大海所提出的问题其实十分聚焦,分两大层面:

    • 业务层面:先看目前最重要的目标是什么,目标的可行性,现有数据分析;再看为实现这些目标需要做哪些举措,之前是怎么做的,现在怎么做?对应着这些举措下需要什么数据支持?
    • 数据层面:先看数据采集层面有哪些数,数据分别从哪来?如何做好标签计算?标签上线后如何监测?标签下线规则?

    而这些均是数据产品工作流上会遇到的问题,那如何合理的规避一个个的坑,保障标签体系更加顺畅的建立呢?

    索隆在受到领导的灵魂拷问后,心情感到十分低落,但很快就开始复盘过程中遇到的问题以及对应的解决方案,迅速绝地反击;毕竟天下武功,唯快不破。

    下一篇,我们来看看索隆在摸爬滚打后,总结的标签体系建立的标准流程,以及在各个流程节点上的注意事项。

    作者:草帽小子;公众号:一个数据人的自留地,wx:luckily304

    本文由 @草帽小子 原创发布于人人都是产品经理。未经许可,禁止转载

    题图来自Unsplash,基于CC0协议

    展开全文
  • 如何设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打?怎么使用用户标签创建商业价值?在大数据时代,数据在呈现出海量化、多样化和价值化变化的同时,也改变了传统IT行业的市场竞争环境、营销策略和...

    如何设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打?怎么使用用户标签创建商业价值?

    在大数据时代,数据在呈现出海量化、多样化和价值化变化的同时,也改变了传统IT行业的市场竞争环境、营销策略和服务模式。

    如何在ZB级的海量数据中获取并筛选有价值的信息,是对IT企业的一大挑战。通过构建客户标签,支撑精准营销服务,是应对上述挑战的有效解决方案。

    但是怎么设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打?怎么使用用户标签创建商业价值?

    这些都是产品设计层面需要解决的问题。

    掌上医讯一直以来都致力于打造医生的今日头条和智能化的学习平台,通过大数据技术实现医生学习的智能化和个性化,而要构建这样一个学习平台,最基础的就是要建立用户的标签体系。

    经过长时间的学习、思考、借鉴和实践,现在已经有了自己的标签构建思路,并且也已经提取出了符合自身业务的标签。我们十分重视用户行为日志的收集,现在已经有了亿万级别的日志数据,正在搭建数据处理和标签计算平台,以下是我们整理的建设思想。

    标签系统的结构

    标签系统可以分为三个部分:数据加工层、数据服务层和数据应用层。

    每个层面向的用户对象不一样,处理事务有所不同。层级越往下,与业务的耦合度就越小。层级越往上,业务关联性就越强。

    数据加工层

    数据加工层收集、清洗和提取数据。掌上医讯有诸多的学习模块,同时又有网站、APP、小程序等多个产品形式,每个产品模块和产品端都会产生大量的业务数据和行为数据,这些数据极为相似又各不相同,为了搭建完善的用户标签体系,需要尽可能汇总最大范围的数据。收集了所有数据之后,需要经过清洗、去重、去无效、去异常等等。

    数据业务层

    数据加工层为业务层提供最基础的数据能力,提供数据原材料。业务层属于公共资源层,并不归属某个产品或业务线。它主要用来维护整个标签体系,集中在一个地方来进行管理。

    在这一层,运营人员和产品能够参与进来,提出业务要求:将原材料进行切割。

    主要完成以下核心任务:

    定义业务方需要的标签。

    创建标签实例。

    执行业务标签实例,提供相应数据。

    数据应用层

    应用层的任务是赋予产品和运营人员标签的工具能力,聚合业务数据,构建具体的数据应用场景。

    (1)标签的类型

    从数据提取维度来看,标签可分为:事实标签、模型标签和预测标签。

    (2)事实标签

    从生产系统获取数据,定性或定量描述用户的自然属性、产品属性、消费属性、资源属性等,以及根据工作人员经验积累的业务规则进行筛选、分析生产的标签,如是否活跃用户、是否是考生等。

    (3)模型标签

    对用户属性及行为等属性的抽象和聚类,通过剖析用户的基础数据为用户贴上相应的总结概括性标签及指数,标签代表用户的兴趣、偏好、需求等,指数代表用户的兴趣程度、需求程度、购买概率等。

    (4)预测标签

    基于用户的属性、行为、信令、位置和特征,挖掘用户潜在需求,针对这些潜在需求配合营销策略、规则进行打标,实现营销适时、适机、适景推送给用户。

    从数据的时效性来看,标签可分为:静态属性标签和动态属性标签。

    (5)静态属性标签

    长期甚至永远都不会发生改变。比如性别,出生日期,这些数据都是既定的事实,几乎不会改变。

    (6)动态属性标签

    存在有效期,需要定期地更新,保证标签的有效性。比如:用户的购买力,用户的活跃情况。

    标签的定义

    给用户打标签,建立用户画像,最终都是为了去应用,所以我们要站在应用场景上去定义用户的标签体系,每个标签都有最终的用途。比如:我们做考试培训服务,我们需要建立“是否考生”的标签。

    另外,不同的行业他们的用户特征也是有显著区别的,比如:医生用户相比普通用户来说,就多了像“科室”、“职称”、“所在医院等级”等特殊含义的标签。

    而标签是有层级关系的,既是为了管理,更好的理解,又是为了控制粗细力度,方便最终的应用。标签深度一般控制在四级比较合适,到了第四级就是具体的标签实例。

    我们根据公司的业务首先划分了人口属性、行为属性、用户分类和商业属性四个大的分类,下面又分了上网习惯、学习惯、人群属性、消费能力、消费习惯等分类,最末级精确到用户的活跃等级、阅读来源、考试偏好等具体的标签。

    标签的维护

    每个标签都不会凭空产生的,也不会一成不变,更不会凭空消失。标签的维护需要生成规则,需要定义权重,需要更新策略。

    生成规则

    如第一部分所说,标签分为事实标签,模型标签和预测标签三大类。对于这三类的标签,生成规则的难度和复杂性也是逐级递增的。事实标签只需要考虑从什么地方提取即可,它即包含明确的标签定义,又包含无法穷举的标签集,比如:关注的病种。

    而模型标签需要进行数据的关联和逻辑关系的设计,通过一定的模型对数据进行计算得来。而预测标签相对就非常的复杂,无法从原始数据提取标签,标签的生成准确度就太依赖我们大数据分析和人工智能技术的应用。

    定义权重

    一个标签会在多个场景下出现,比如:一个疾病标签,它极可能在浏览过程中生成,也有可能在搜索场景下产生,但是对于这两个场景所对应的同一个标签,他们的权重是不同的。浏览相比搜索,权重要小得多,因为搜索的主动需求更大。

    更新策略

    上文我们从数据的时效性上对标签分为静态属性标签和动态属性标签,对于静态属性标签的处理相对比较简单,就不停的累加即可。但是对于动态属性标签,需要对过期标签进行降权甚至删除处理,比如:医生考试前和考试后,会影响“是否考生”这个标签的,这就需要制定更新策略。

    标签建设的技术架构

    标签体系的建设涉及很多环节,数据量也十分巨大,需要有一个健壮且高效的技术架构来支持数据的存储及计算,掌上医讯采用了sql数据库和no-sql数据库来满足结构化数据和非结构化数据的存储。

    使用hadoop的分布式存储技术及hive和hbase组件作为数据仓库,使用MapReduce和spark分布式计算来提高计算速度,使用kylin进行多维分析,通过BI工具和接口对外提供应用,使用sqoop和kettle进行数据的抽取及流程的调用。

    更多的应用场景

    用户标签建立已经基本应用在掌上医讯的内容智能推荐的学习场景中,但随着标签的完善以及智能化处理的提升,这套标签体系将有更广阔的应用场景。

    (1)智能化学习场景的构建

    通过用户学习需求的标签的分析进行用户分群,针对不同的用户群在APP的功能和内容上进行个性化展示,满足不同学习需求的用户个性化的学习服务。

    (2)精准营销推广的建立

    更细粒度的对用户进行筛选,同时能够精准预测可能存在的目标用户进行推广,从而扩大医生覆盖,提升推广的转化率。

    (3)KOL用户画像的描绘

    基于该标签模型,增加对外部数据的采集分析,更加完整的生成医生360度的用户画像,帮助企业寻找潜在的KOL用户,实现用户洞察,辅助市场决策。

    标签的建设是一个看似高大上,其实很繁琐、纠结的过程,需要对业务抽丝剥茧,还要应对运营需求的各种变化,不过对公司发展的影响也是深远的。

    展开全文
  • 电商用户标签体系建设基础步骤

    千次阅读 2020-01-09 14:28:40
    构建用户标签体系主要根据用户在历史...建设的过程分为六个基本步骤:1、首先以业务视角梳理规划整个标签体系的架构,即上面所说的八个维度; 2、无规矩不成方圆,在进行实际开发之前,我们要定义包括数据(指标)规...
  • 如何在ZB级的海量数据中获取并筛选有价值的信息,是对IT企业的一大挑战,通过构建客户标签,支撑精准营销服务,是应对上述挑战的有效解决方案,但是怎么设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打...
  • 本文作者分享了关于标签体系建设,我们一起来看一下。我是要成为世界级大剑豪的男人——索隆。2017年,索隆离开了校园,跟随草帽小子出海,进入伟大航路,从事数据产品工作;他心中一直怀揣着一个成为世界级大剑豪...
  • 导读 POI是“Point of interest”的缩写,中文可以翻译为“兴趣点”。在地图上,一个POI可以是一栋房子、一个商铺、一个公交站、一个湖泊、一条道路等。在地图搜索场景,POI是...而所谓类别标签,就是在类别维度...
  • 1.导读POI是“point of interest”的缩写,中文可以翻译为“兴趣点”。在地图上,一个POI可以是一栋房子、一个商铺、一个公交站、一个湖泊、一条道路等。...而所谓类别标签,就是在类别维度对POI属性的一种概...
  • 如何在ZB级的海量数据中获取并筛选有价值的信息,是对IT企业的一大挑战,通过构建客户标签,支撑精准营销服务,是应对上述挑战的有效解决方案,但是怎么设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打...
  • 导读POI是“Point of interest”的缩写,中文可以翻译为“兴趣点”。在地图上,一个POI可以是一栋房子、一个商铺、一个公交站、一个湖泊、一条...而所谓类别标签,就是在类别维度对POI属性的一种概括,比如,屈臣...
  • 天云数据HUBBLE(HTAP) 数据库,成功支撑某银行建设个人用户画像大数据标签体系。借助于天云研发的HUBBLE 分布式数据库的扩展性,使得单一固定维度描述客户属性顺利地扩展到上千级别动态维度描述客户属性:传统...
  • 标签体系建设的短期目标是通过打造“渠道”“内容”“时间”的黄金组合优化用户前端旅程体验,提升单次营销活动效果。 长期目标是通过定制化的服务,优化前端用户旅程,延长用户生命周期,提升CLV。我们分别从信息...
  • 本文作者:子玺   袋鼠云数据中台解决方案专家。拥有近10年大数据从业经验,拥有PMP项目管理资格认证,精通数据类项目的开发实施和管理。...什么是标签? 当我们从互联网时代逐渐步入大数据时代...
  • 标签建设

    2020-05-27 10:49:19
    一、标签库定位 标签库以标签形式统一客户群数据的封装规范和...标签库的核心当然是标签体系,但每个企业打造的标签体系其实都不太一样,既有共性,也有个性。 共性主要体现在用户的一些基础属性,比如年龄、性别、

空空如也

空空如也

1 2 3 4 5 ... 7
收藏数 128
精华内容 51
关键字:

标签体系建设