精华内容
下载资源
问答
  • 人物画像

    万次阅读 2016-10-30 20:00:15
    talkingdata工程师分享人物画像的笔记;作为一个数据公司,通过提供sdk给各个行业来获取用户终端数据,地理信息,app信息等来推测一个用户画像,是一个非常具有价值的操作,可以给商家带来财富

    人物画像

    From TalkingData 王鹏

    1. 什么是画像
    2. 画像的用处
    3. 如何进行用户画像
    4. 画像应用中的难点

    1. 什么是画像

    ​ profile,从不同角度来表示一个人;角度可以是事实和抽象的,自然属性,性别,年龄;社会属性:职业、社交特征;财富:高收入人群,是否有固定资产;家庭情况:结婚,是否已经有孩子;购物习惯:网购 vs 逛商场;位置特征:哪个城市生活;或者是一些行为习惯。

    1. 人口属性:性别,年龄
    2. 资产状况:房产,收入
    3. 兴趣特征:阅读咨询,运动健康等
    4. 消费特征:网上、线下消费类别等特征
    5. 位置特征:常驻城市,职住距离等
    6. 设备属性:所使用终端的特性

    2. 画像的用处

    ​ 解决业务问题;拓展新用户;获得一个新订单;获取新用户,要知道自己产品定位的用户画像;用户画像是帮助企业明确目标客群的重要手段之一;将有类似画像特征的人群转化成自己的用户;

    ​ 例子��:打车公司:有需要且有车的用户 vs 有需要但没车的用户 结果发现 前者 的 广告触达率比较高;映射出: 习惯了车反而离不开车

    • 如何准确的了解现有用户

    • 如何在茫茫人海中通过广告营销获取类似画像特征的新用户。

      逻辑上有些相悖:了解现有用户的画像,需要的是少量、画像特征覆盖度全面的无倾斜的精准样本,这样更能精确的定位产品的用户。而通过画像结果做广告营销获取新用户,在一定程度上需要的是大量的相似样本;量的大小和精准度的不同决定了后续画像模型在应用设计中的不同。

    标签:表达人的基本属性,兴趣爱好,行为偏好等某一个维度的数据标示。一种相关性很强的关键字,可以简洁的描述和分类人群。不同的行业,不同的应用场景,同样的标签名称可能代表不同的含义,也决定了不同的模型设计和数据处理方式。

    ​ 例子:卖男装筛选“男性”,“网络购物” 这两个标签进行投放,效果并不理想;

    “性别”有多种维度

    • 真实性别
    • 网络购物特征男女
    • 性取向男女

    3. 如何进行用户画像

    取决于业务目标(需要什么样的画像标签)和有什么样的原材料(有什么类型的数据源),基于这样才能确定使用什么样的模型设计和数据计算处理方式。

    1. 征信场景,想知道这个人的真实性别:

      在没有全量真实数据的情况下,可以采取如下的方法来处理:选取少量真实样本,使用这些真实样本追加一些特征因子,使用looklike算法进行样本扩展,将该少数样本特征扩展到大量或者全量数据。当然,这些数据的准确率取决于样本的均衡程度和算法的质量。

    2. 网络购物的电商场景

      考虑将来该网络账户实体是否会购买男装的角度,需要的是“男装购买倾向”的标签,可以基于所有账户实体以往购买记录来计算处理该标签。

    3. 同性交友app定义的男性

      “男性同志”标签,考虑通过安装了类似同志交友的app人群或者以同志人群经常出现的聚集地进行计算处理。

    使用这些不同源的数据,计算处理业务需要的标签:

    1. 数据抽取:从不同数据源抽取要计算标签的数据原材料
    2. 数据标准化:针对抽取的数据将其清洗为标准格式,将其中的错误数据和无效数据剔除。
    3. 数据打通:不同来源的数据有不同的主键和属性,比如有设备的WiFi信息,又有设备的poi信息,就可以通过WiFi将设备终端和poi(point of information)建立起关联。
    4. 模型设计:针对不同的数据内容和业务目标设计不同的规则和算法进行模型的构建,并使用小样本数据进行模型的可靠性验证
    5. 标签计算:在模型可靠性验证的基础上,部署生产运营环境来进行标签计算。

    例子:大学生标签

    没有每个大学生的入学信息和证件信息,我们如何操作呢。

    1. 进行业务分析,发现大学生的行为特征:在大学校园内活动比较多,将全国2000多所高校的位置找到,根据移动终端设备的位置信息来筛选“大学生人群”;
    2. 使用一些特殊的app,比如考研类,四六级,课程表等这类特殊app,可以通过app进行“大学生”人群的筛选。

    如何不用算法,就只用规则,我们想找精确的“大学生”人群,可以将位置和app行为两个特征叠加使用;

    如果我们想要扩展样本进行大规模广告投放,可以考虑含位置、app行为任意一个特征的人群,同时还可以通过算法类似lookalike的扩展样本学习。

    用户画像和标签设计中的一些难点

    1. 如何定义画像主体?如何唯一标识一个实体?

      真实世界每个人都是一个实体,但是虚拟世界他可能就变身为多个,比如人可能有一个身份id, 但是可能有多个手机号,多个终端设备ID,那就对应了多个移动终端的使用行为,将这些ID的特征拼接起来才能代表完整的画像。一对多的情况。

      多对一的情况:ipad的使用。孩子用来玩游戏,父亲查邮件,母亲用来购物。只要通过标签能够筛选出来想寻找的受众群体就可以。

    2. 如何打通不同源的数据?

      pc端,移动端,tv端的行为信息,如何将这些信息关联起来,在于将这些终端的唯一标识ID打通。TalkingData的IDMapping能力已经实现了跨设备ID的关联映射。所以要解决不同源ID的打通只要接入一家类似TalkingData的数据即可。

    FAQ

    1. 常用算法

      Linear Regression 线性回归

      Logistic Regression 二分类

      multi-class logistic regression 多分类逻辑回归

      Fregata(Non-parametric Algorithms)

      Random Decision Tree 随机决策树

      Random Decision Hashing 随机决策哈希

    2. 评估画像的好坏

      小样本的真实验证

      在实际的case中迭代验证

      外部标签的交叉验证,比如“已婚”标签的,不可能是”18岁以下”人群。

    3. 标签的存储

      hdfs,vertica, hbase。标签的追溯,取决于你的标签的生命周期,有的标签就是最新的,有的是每周每月加工的,有的是时间衰减迭代的。

    4. 样本的准确性

      大数据本身不存在所谓的正确性,是用来验证人的先验知识/经验的一种工具,这个里面应该考虑的不止是准确性的问题,而是如何能更好的提高你认为的准确率的问题,大数据由于题量大,需要的是数量、时间等多维的迭代,维度的扩展。

    展开全文
  • 人物画像及“七步人物角色法”

    万次阅读 2017-10-16 11:55:28
    人物画像的主要目的是分析人物行为,最终为每个人物打上标签,以及该标签的权重 1.标签是对用户的社会属性、生活习惯、消费行为等进行进一步的抽象, 通过简单规则算法或者大数据技术对用户行为习惯的分析提取, ...

    人物画像的主要目的是分析人物行为,最终为每个人物打上标签,以及该标签的权重

       1.标签是对用户的社会属性、生活习惯、消费行为等进行进一步的抽象, 通过简单规则算法或者大数据技术对用户行为习惯的分析提取, 以及对用户简单直接的特征描述即用户标签, 标签的目的使我们简单、直观的了解用户的某些特征。
       2.权重代表指数,即目标在这以标签上的侧重值人物画像的核心在于给人物“打标签”,每一个标签通常是人为规定的特征标识,用高度精炼的特征描述一类人
    

    进行人物画像最重要的是数据,对于数据我们分为以下几类

     1.人物数据
        静态数据:人物相对固定的数据,例如身份证号,姓名,年龄,求学经历等
        动态数据:人物的行为操作的记录,出于对象主观意识进行的选择
     2.被选择对象数据:用于记录可供人物对象选择操作的对象(即主谓宾中的宾语)的特征的属性
        主观数据:被选择对象的固有属性
        客观数据:被选择对象的客观印象、分类等
     3.when/where数据
        用于记录何时、何地(或通过何种途径)获得的该数据,用于标识此条数据的重要程度
     4.人物厌恶数据
        用于记录人物对象明确表示厌恶或禁止的数据
    

    用户画像的步骤——“七步人物角色法”

    1. 发现并确认模型因子 典型用户集群的行为变量集合(例:活动[频率和工作量] 态度[如何看待 生活必须?提高效率?消遣娱乐打发时间?] 能力[受教育和培训程度 自我学习能力] 技能[在什么领域使用的产品 有哪些使用技巧和特殊技能])
    2. 访谈目标用户 将访谈对象和行为变量一一对应,定位到某个范围的精确点(20%重价格 20%重功能 60%重品牌 其中A用户就是这60%的大多数) 将用户进行四象限分类,不同类型的用户看重的产品侧重点和比例不同
    3. 识别行为模式在多个行为变量上看到相同的用户群体→同一类用户群体的显著行为模式若模式有效,那行为变量和用户角色就有逻辑关系/因果关系(爱听音乐的人会购买高质量耳机)
    4. 确认用户特征和目标 用户特征:从数据出发,综合考虑细节,描述潜在使用环境、使用场景和当前产品的不足、用户不满等(对一两个典型形象进行刻画,可视化人物角色,如姓名 年龄 特征)目标:初级目标——有用 体验目标 人生目标【生活目标 隐形目标[自我实现] 炫耀】
    5. 检查完整性和重复(检查人物和行为模式的对应关系 是否存在重要缺漏 是否缺少重要的典型人物 是否缺少重要的行为模式 确保人物角色和行为模式的独特性和差异性)
    6. 描述典型场景下用户的行为(表述模型:虚拟事件和用户的反应 介绍用户角色,简略勾画关注点、兴趣爱好以及工作生活中与产品的直接关系) 传达情感化信息 同理心感受用户  
    7. 指定用户类型(对所有用户角色进行优先级排序→首要设计对象)【典型用户、次要用户、补充用户、负面人物角色即非目标用户】

    【描述方法:关键词法 列表法 卡片法】
      1、 关键词法——将用户特质标签化,用关键词记录用户的信息、喜好、态度、行为等
      优:直观简单、便于归类统计、赋予关键词权重(大/小标签)→不同的人物角色合集
      缺:缺乏逻辑关联性,无法逻辑的表达出用户角色和行为的关系,易出现缺漏和重复,不能建立起行为和人物的关系。
      2、 列表法——最常用的描述方法,但不易在用户与用户之间进行横向比较,较难对用户角色排序,较难分清主要和次要角色
      3、 卡片法——将用户标签写出来,让团队成员进行横向/纵向排序
      项目需求迅速达成一致
      让团队形成UCD的思路和流程 将用户模型和用户画像引入产品设计的方方面面
      避免用户画像的以下错误:
      1. 典型用户≠用户细分 (给用户建模,更关注用户如何看待和使用产品、如何与产品互动,是一个较连续的过程)
      2. 典型用户≠平均用户(在社会科学中,人群特征按正态分布 经济统计学中的“二八定律” 20%的人占有80%的社会财富 取中位数!) 应关注典型用户或使用户典型
      3. 典型用户不是只有一个(类)【受欢迎的典型用户和不受欢迎的典型用户 与产品目标的相符度】
      4. 典型用户不是真实用户(重点关注一群用户需要什么、喜欢什么)
      5. 除了典型用户还有其他人物角色

    展开全文
  • 很多企业都有建设“用户画像”的需求。首先来介绍我们所理解的两种用户画像(User Persona 和 User Profile),以及如何构建用户画像(User Profile)的标签体系,并由此驱动产品智能。以下内容由更多干货分享请关注...

    很多企业都有建设“用户画像”的需求。首先来介绍我们所理解的两种用户画像(User Persona 和 User Profile),以及如何构建用户画像(User Profile)的标签体系,并由此驱动产品智能。以下内容由更多干货分享请关注以及用户行为专栏。

    User Persona

    第一种意义上的用户画像(User Persona),是产品设计、运营人员从用户群体中抽象出来的典型用户。例如,在用户调研阶段,产品经理经过调查问卷、客户访谈了解用户的共性与差异,汇总成不同的虚拟用户;在产品原型设计、开发阶段,产品经理围绕这些虚拟用户的需求、场景,研究设计产品用户体验与使用流程;当产品设计出现分歧时,产品经理能够借助用户画像(User Persona)跳出离散的需求,聚焦到目标用户,不是再讨论这个功能到底要不要保留,而是讨论用户可能需要这个功能,如何使用这个功能等等。

    例如某招聘类产品(https://www.clearvoice.com)在调研阶段构建的用户画像(User Persona):

    图 某招聘类产品的用户画像(User Persona)

    如图是这个产品对于自己的潜在的用户群体的一个直观的认识,包括这些用户的年龄、性别、婚姻状况、受教育程度、职业、收入等各个维度的一些预估。而后续这个产品就可以按照这些预估,来作为后续产品交互、流程等设计的一个重要依据。

    所以,总的来说,这类用户画像(User Persona)本质上是一个用来描述用户需求的方法论。它可以帮助不同角色在产品研发过程中,从用户的角度思考问题。在产品设计阶段和原型开发阶段,产品经理会较多地借助用户画像(User Persona)理解用户的需求,想象用户使用的场景。

    但通常情况下,随着产品上线后不断迭代,真实用户的用户越来越多,仅通过用户画像(User Persona)可能难以更加量化细致地评估用户需求,也很难通过数据来确定用户画像(User Persona)虚构的人物是不是真的目标群体。同时,真实用户群体也随时间推移变化,在设计阶段虚构的用户画像(User Persona)需要重新调研、设想。

    新浪微博就是一个典型的例子,最开始,微博主要的设计是为了满足一二线城市的白领的使用,此时的用户画像(User Persona)可能是这样的:一二线城市、二十岁到三十岁、较高教育程度、白领、收入在 6000 以上,在这时候,新浪微博所有的产品交互和流程设计可能都是据此进行的。但是,随着新浪微博的逐渐发展,它的用户群体已经发生了明显的“下沉”,越来越多三四线城市的“草根”用户开始使用。那么,对于这种情况,新浪微博的整个产品、功能、交互设计等,都应该有所调整。

    对于这种问题,用户画像(User Persona)有时候可能反应就会滞后,我们可能就需要采用另一种方案,也就是用户画像(User Profile)了。

    User Profile

    为了解决上文提到的一些问题,同时也是为了能够更加精细深入地了解用户,我们自然会希望通过产品积累的用户行为数据来为产品运营提供更好的支撑,甚至由此诞生一些新的功能,例如根据用户浏览记录向用户提供个性化服务。这就是我们着重介绍的第二种用户画像(User Profile),也即根据每个人在产品中的用户行为数据,产出描述用户的标签的集合。例如猜测这个用户是男是女,生活工作所在地,喜欢哪个明星,要买什么东西等。

    特别是随着“千人千面”等理念深入人心,许多企业希望能建立自己的用户画像体系。那么,在这种情况下,我们更应该明确两种用户画像的差异。与第一种用户画像(User Persona)不同的是,用户画像(User Profile)的建设更加关注:

    是否反应受众的真实需求:用户画像(User Profile)这个词的字面意义,是关注人口属性、生活状态、人生阶段等静态信息,但这些信息并不一定直接反应用户兴趣。产品更关注的往往是某用户“最近喜欢看哪类视频”、“准备买多少钱的手机”这样能够帮助产品运营的动态信息。

    时效性:用户的兴趣偏好随时都在发生变化,需要及时更新用户标签。极端情况下,甚至希望用户上一次浏览的情况,在他进行下一次浏览前就能体现到用户画像(User Profile)的更新上。

    覆盖度:用户画像(User Profile)既要勾勒出用户感兴趣的内容,也要记录用户不感兴趣的信息,尽量多地满足产品运营的需要。但同时,除了人口属性等明确的属性外,大多数用户画像的正确与否是没有意义的。如“最近喜欢看搞笑视频”这个标签,并不表示用户下一次一定观看搞笑视频,因此执着于提升标签的准确度,不如设计出多更清晰描述受众需求的标签,更多时候我们注重提升用户画像的覆盖度,同时提供更细粒度的画像。

    简单总结下,与用户画像(User Persona)主要来源于产品与运营人员对于客户的理解、调研与认知,用户画像(User Profile)则主要是基于真实积累的用户行为结合具体的业务场景产生的一系列标签,这些标签共同构成了对于一个用户的真实描述。

    那么,下面我们就看看如何来设计一套用户画像的标签体系。

    用户画像(User Profile)标签体系的建立

    所谓用户画像(以下均指 User Profile)中的标签体系,简单来说就是将用户划分到多少个不同的分类之中。当然,在这种情况下,一个用户是可以落到多个不同的分类上的。用户落入的这些分类都是什么,彼此之间有何联系,就构成了一个标签体系。

    一般来讲,有两种常见的思路设计用户画像的标签体系。

    一类是结构化的标签体系,这类标签可以直接从人口属性、物品信息等基本信息中直接得到,有明确的层级关系,如性别、省市、视频分类、商品分类等。下面是亚马逊(http://www.amazon.cn)的商品标签体系,用户画像的标签体系与此类似,可以结合具体的业务场景来确定。

    图 亚马逊的商品标签体系

    简单来说,结构化的标签体系通常较为简单,一般可以直接通过用户的行为映射得到。例如根据用户的购买记录,为用户构建物品对应的结构化标签。但结构化标签往往粒度较粗,无法充分衡量用户的兴趣,例如用户在新闻类 APP 中阅读了关于某明星的娱乐类新闻,其实并无法推断出他对所有娱乐类新闻感兴趣,他也不一定只对该明星情有独钟。

    另一种是非结构化标签体系,就是各个标签各自反应各自的用户兴趣,彼此之间并无层级关系。典型的非结构化的标签,如搜索广告系统中的关键词,或者文档主题模型(Topic Model)。例如新闻类 APP 中,我们往往会构建大规模的主题模型(主题数在千~万级别),不仅仅涵盖已经构建的结构化的标签体系,如娱乐(明星、搞笑)、体育(篮球、足球)等,往往还能更细致地表达如星座、食物、体育活动等语义上的分类,而且这些分类之间并没有明显的层级关系。

    标签体系的建设本身一要便于使用,二要有明显的区分度。结合具体的产品而言,在不同的场景下对这两点要求的核心是不同的。因为选择哪些标签并没有明确的依据,还是需要充分了解到底是什么因素在驱动用户使用产品。有效的标签体系,要能反应用户决定买什么、不买什么的逻辑与依据。例如电商产品中,以新闻频道的方法,为用户构建“财经”、“体育”、“旅游”……这样的标签,虽然并不难,但也没多大意义。

    实践案例

    我们曾经与国内某知名视频聚合网站共同搭建视频推荐服务。该网站每天聚合全网的视频,向用户提供热门视频、视频检索等服务。网站已经积累了大量的用户和行为数据,围绕新、老用户的运营模型在发生着变化。

    在开始具体的项目之前,我们首先要意识到,与传统的视频站点不同,短视频网站是有它自己的运营特点的,这些特点包括:

    播放随意性强:短视频播放虽然是个高频、周期性强的娱乐应用,但单次观影时间短,用户选择随意性大;

    热点轮换迅速:平台中不断加入新视频,每天的热门内容不断变化,网站需要发现用户潜在的兴趣点,向用户推荐新鲜内容;

    场景驱动:场景是特定的时间、地点和人物的组合下的特定的消费意图。不同的时间、地点,不同类型的用户的消费意图会有差异。例如白领乘地铁上班,会关注当日的新闻热点;周末晚上在家,用户更喜欢点击娱乐类搞笑视频。当场景辨识越细致,就越能了解用户的消费意图,推荐的满意度也就越高。

    随着视频资源的不断丰富和用户需求的多样化,如何准确地向客户推荐视频,是该产品用户画像的一个基本目标。我们十分看重推荐系统中推荐结果的可解释性,也让用户能感觉到每一条推荐视频的推荐理由。当然,我们构建用户画像也以观看场景和观看兴趣为主。

    我们考虑新用户和老用户两大类群体。新用户第一次进入 APP,在这一阶段的运营目标以留存为主,主要向用户推荐近期热门视频。除了常规的设备信息、地理信息外,我们对用户了解甚少,可以通过猜测下列问题“用户在哪里?”、“这个时段可能处于什么场景?”来构建用户画像,进行场景推荐。这两种标签的获取较为直接,通过用户手机的地理位置信息和当前时段就可以得到。

    而基于这两个标签,在不同场景下,我们向新用户推荐不同的视频,例如:

    工作日 7:00 - 10:00:

    用户可能搭乘公共交通工具前往公司,乘车时使用 3G/4G 流量上网,时间较为碎片化,并且容易受到打扰而中断观看。通常这个时段用户希望了解当天的时事、新闻。因此我们推荐短小精悍的热点新闻。

    工作日 12:30 - 14:00:用户可能在公司午休,我们推荐娱乐、搞笑类的视频,目的性较弱,随意寻找符合自己口味的内容,但有可能因为午睡或工作,观影时间碎片化。因此,我们推荐视频时长较短,诸如娱乐、搞笑类的视频,如

    X 奇艺的“笑 X 来了”等。

    周末 19:00 - 23:00:用户可能在家中休息,观看时间较为充足;使用

    WIFI,速度稳定;这个时段用户目的性通常较强,例如观看“XX 歌手”、“XX 男”等综艺节目的热门片段更新没有。因此我们可以推荐综艺节目、电影片花等,满足用户长时间放松的需求。

    通过场景推荐的方式,我们可以在不了解用户兴趣的情况下,针对不同场景标签下的新用户推荐不同热门视频,满足用户需求。

    而对于老用户,运营目标是提升用户体验,向用户推荐感兴趣的内容,以提高观影时长;结合场景推荐用户可能感兴趣的新鲜内容,以提高用户留存率。除常规信息、场景信息外,构建老用户的用户画像还会考虑:用户在不同时段的兴趣点,用户是否喜欢探索新鲜视频,对用户召回需求。下面我们分别对这三类进行描述:

    对于第一类“用户兴趣标签”,可以通过视频本身的分类信息构建结构化的兴趣标签。我们在实际处理中,将每个用户最近观看记录作为一个观影序列,通过 Item 2 Vec[1]产出视频的

    Embedding 矩阵,并用 Bag of Words 的思想以每个用户的最近观看记录描述用户兴趣,得到用户 Embedding,作为用户兴趣标签。通过用户兴趣标签,我们可以将用户兴趣融入前文描述的场景推荐中,例如在工作日的 7:00 - 10:00,我们根据用户兴趣,从热点新闻中筛选用户感兴趣的军事、财经等品类;在周末的 19:00 - 23:00,我们根据用户上周的观影记录,重复推荐相同的新一期的综艺类节目。

    对于第二类“用户新鲜度的需求标签”,我们通过衡量用户观影记录中,各影片之间的相似度得到。影片分类覆盖越多,或影片之间的向量距离越远,说明用户越喜欢探索新内容。对于喜欢探索不同类型的视频的用户,我们会更倾向于从用户未观看过的分类中,抽取新鲜热门视频加入推荐排序结果中。

    对于第三类用户召回方面的需求,其实也是一个非常现实的需求。神策分析可以通过多维分析的方式寻找用户流失的原因,同样的我们也通过统计方法预测用户流失风险。例如,对于视频网站的老用户,观影习惯和场景通常较为固定,当用户最近一段时间内的观看频次显著低于过往,甚至没有打开 APP 时,我们判定用户有流失风险,可以通过推送感兴趣的视频等手段,召回用户。

    现在,让我们总结一下,短视频是一个高频、随意性强的产品,用户的观看行为受时间、场地等场景因素影响较大,需要对用户在不同场景下的观看行为做深入了解,归纳不同场景下用户个体需求、群体需求的差异,针对不同场景制定相应的推荐策略,这也是我们选择场景作为短视频产品用户画像的突破口的原因。

    同时我们在构建视频推荐的用户画像时还面临如下挑战:

    数据稀疏性:个人的观看记录相对整体的覆盖度是十分低的,不同的个体间重合度也很低。我们需要从这些稀疏的数据中得到个体、群体的兴趣标签。

    用户兴趣变化快:用户的兴趣点随时间、热点变化,用户观看了几次关于某明星的短视频,并不代表第二天或未来用户会对他感兴趣。我们需要分别构建用户短期、长期的兴趣标签。

    场景识别难:目前我们的场景识别以时间段为主,未加入地理位置信息,而后者能显著提高细粒度场景识别的准确度。

    最后,总结一下文中提到的两种用户画像。User Persona 可以帮助我们形象的了解目标用户的行为特征,作为我们判断用户需求的依据;User Profile 从用户行为中构建各种标签,在用户生命周期中不断刻画用户意图,辅助产品运营。

    画像标签体系的建设是不断迭代的过程,例如视频产品中,新的视频、新的热门话题不断产生,不断地研究和调整也就必不可少。只有根据产品运营的目标,灵活调整标签体系,才能取得最好的效果。

    以上内容由

    神策数据创始人&CEO 桑文锋所著《数据驱动:从方法到实践》京东预售正式开启。本书由《精益数据分析》作者Alistair Croll、网站分析和互联网营销分析教父级专家宋星、互联网数据官创始人车品觉等亲笔作序。由红杉资本、线性资本、百度、今日头条、百联、纷享销客、饿了么、杏树林、造数科技十位高管力荐。

    展开全文
  • 人物画像,是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而得来的高度精炼的特征标识。 二、数据...

    刚上淘宝买了台空气净化器,结果后面打开的所有网页,都在给推送空气净化器的广告。这对刚接触大数据的人来说真是太有趣了,而人物画像在其中发挥的作用功不可没。

    一、什么是人物画像

    人物画像,是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而得来的高度精炼的特征标识。

    0?wx_fmt=gif&tp=webp&wxfrom=5&wx_lazy=1

    二、数据准备

    本次将以某人2016年的模拟数据为例(人物画像统计数据renwuhuaxiang00.csv和人物画像详细数据renwuhuaxiang01.csv),为大家展示如何绘制人物画像,并通过人物画像对用户进行精确定位、统计分析,从而为以后的精准营销等商业行为提供数据依托。

    在浏览器中输入OpenFEA官网地址(http://www.openfea.cn或http://www.open-fea.cn),在下载专区中找到在线试用环境:http://60.191.16.186:8050/fea/,进入OpenFEA界面。

    点击“134418_997n_3115904.png134314_GnXH_3115904.png”,打开装载数据窗口,选择装载类型为CSV,选中renwuhuaxiang00.csv和renwuhuaxiang01.csv文件,然后装载到OpenFEA中。

    134314_p8Qg_3115904.png134449_T49f_3115904.png

    加载人物画像概况数据

    134454_Gpf9_3115904.png134314_cplE_3115904.png

    加载人物画像详细数据

    134314_sR17_3115904.png134502_0KIh_3115904.png

    人物画像概况数据

    134508_gvuB_3115904.png

    人物画像详细数据

     

    人物画像,由主表数据和从表数据构成。主表数据展示标签概况信息;从表数据展示对应标签的详细信息,在鼠标移动到标签上时显示。

    主表对数据格式的要求如下:

    134624_btpv_3115904.png

    从表数据格式的要求如下:

    134644_7E3g_3115904.png

    三、可视化分析及设计过程

    当前数据还不符合人物画像绘制的要求,所以我们需要先对数据进行分析处理。

    1、新增列

    新增一列颜色,颜色值可任意指定,本次按照0-4的顺序来指定。

    134314_f78w_3115904.png134707_NBHc_3115904.png

    2、更改列类型

    将整型更改为字符串类型

    134720_N7m9_3115904.png

    3、字符串处理

    因为颜色的值只支持0-4,所以需要把5替换成0-4中的数字,本次替换为0

    134731_IjZI_3115904.png

    4、最终得到的人物画像概况数据

    134314_Fje9_3115904.png134741_pagX_3115904.png

    5、保存数据

    134750_HM32_3115904.png

    6、设置索引

    将人物画像详细数据的字段“索引”设置为索引列index

    134804_yqc4_3115904.png

    7、最终得到的人物画像详细数据

    134817_tBjT_3115904.png

    8、保存数据

    134314_ctdL_3115904.png134822_cwP1_3115904.png

    9、绘制图形

    134830_dEWZ_3115904.png134315_9l5L_3115904.png

    10、绘制成功

    0?wx_fmt=gif&tp=webp&wxfrom=5&wx_lazy=1

    从上图的人物画像不难看出,该人属于中产阶级,资产百万,是个旅游达人,消费水平很高,特别热衷于旅游,在衣着打扮上的花费也不低。

    该人还经常去健身房健身,很注重身体锻炼,而且还是微信的发烧友,一年当中打开微信的次数居然高达4000次(微商可以盯紧了,出手“大方”且钱多,速来^-^)。

    转载于:https://my.oschina.net/u/3115904/blog/828348

    展开全文
  • 这一期,我们补充来说明一下DBA的人物画像。   DBA的段位 真正厉害的DBA,他们犹如定海神针一样的作用。 (普通人眼中:DBA平常好像没啥事情干,浪费钱) 给你们讲一个扁鹊的故事,你们就知道其真正的作用。...
  • 人物模型和目标

    2016-08-23 06:45:03
    在自然科学和社会科学中,模型通过有效的抽象来代表复杂的现象。好的模型强调所代表结构的显著特色关系,弱化不太重要的细枝末节。由于我们是为用户而设计的,因此重要的一点就是,要了解这些方面并将其视觉化:用户...
  • 模型结构方面,在U-GAT-IT的基础上,我们在编码器之前和解码器之后各增加了2个hourglass模块,渐进地提升模型特征抽象和重建能力。 由于实验数据较为匮乏,为了降低训练难度,我们将数据处理成固定的模式。首先检测...
  • http://bbs.fanruan.com/course-33.html 转载于:https://www.cnblogs.com/guohu/p/11518397.html
  • 用户画像总结

    万次阅读 多人点赞 2018-03-28 14:45:51
    (文章内的图片来源于不同帖子,权当分享,侵删)一、 什么是用户画像 用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。通俗说就是给用户打标签,而标签是通过对用户...
  • 用户画像全面精析

    2018-10-22 09:32:20
     用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特征标识。通过打标签可以利用一些高度概括、...
  • 用户画像

    千次阅读 2016-02-29 15:09:15
    一、什么是用户画像? 男,31岁,已婚,收入1万以上,爱美食,团购达人,喜欢红酒配香烟。 这样一串描述即为用户画像的典型案例。如果用一句话来描述,即:用户信息标签化。 如果用一幅图来...
  • 用户画像简介

    2020-06-15 15:49:21
    根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。从电商的角度看,根据你在电商网站上所填的信息和你的行为,可以用一些标签把你描绘出来,描述你的标签就是用户画像。构建用户画像的...
  • 这一切都是精准化营销的常见套路。...以庞大的用户数据为依托,构建出一整套完善的用户画像,借助其标签化、信息化、可视化的属性,是企业实现个性化推荐、精准营销强有力的前提基础。 可见,深入了...
  • 项目实训-智能人物画像分析系统概述 1、项目简介 题目:智能人物画像分析系统 导师:陶可猛 导师单位 浩睿智源(山东)人工智能有限公司 2、项目背景 用户画像是根据用户基本属性、社会属性、生活习惯和消费行为等...
  • 用户画像整理

    千次阅读 2018-08-19 15:43:33
    用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。 用户信息标签化 用户画像是对现实世界中用户的建模,用户画像应该包含目标,方式,组织,标准,验证这5个方面。 ...
  • 描述大数据-用户画像DMP--小树老师更多好课大数据用户画像系统课程一、项目概述目前推广平台仅在投放端提供了有限的定向能力,广告主没有足够的流量抓手,无法满足大中型广告主的营销目标。画像系统提供基础人口属性...
  • python实现用户画像

    2020-01-24 22:21:17
    利用python相关技术搭建的用户画像web轻量级应用 利用python相关技术搭建的用户画像web轻量级应用
  • 如何构建用户画像

    2018-10-24 11:28:19
    这也使得用户画像模型具备实际意义。能够较好的满足业务需求。如,判断用户偏好。短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析 等预处理工作,这为利用机器提取标准化信息提供了便利。 人...
  • 模型结构方面,在U-GAT-IT的基础上,我们在编码器之前和解码器之后各增加了2个hourglass模块,渐进地提升模型特征抽象和重建能力。 由于实验数据较为匮乏,为了降低训练难度,我们将数据处理成固定的模式。首先检测...
  • 大数据之用户画像的原理、应用与实现。
  • 构建用户画像

    2020-05-21 16:57:29
    如何快速构建用户画像?...通过调研,根据用户的目标、行为和观点的差异,将他们区分为不同的类型,从每种类型中抽取典型特质,赋予名字、照片、场景等描述,构成了一个用户的人物原型。 二、分析用户画像

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,914
精华内容 765
关键字:

人物画像模型