精华内容
下载资源
问答
  • 人物画像

    万次阅读 2016-10-30 20:00:15
    取决于业务目标(需要什么的画像标签)和有什么的原材料(有什么类型的数据源),基于这样才能确定使用什么的模型设计和数据计算处理方式。 征信场景,想知道这个人的真实性别: 在没有全量真实数据的...

    人物画像

    From TalkingData 王鹏

    1. 什么是画像
    2. 画像的用处
    3. 如何进行用户画像
    4. 画像应用中的难点

    1. 什么是画像

    ​ profile,从不同角度来表示一个人;角度可以是事实和抽象的,自然属性,性别,年龄;社会属性:职业、社交特征;财富:高收入人群,是否有固定资产;家庭情况:结婚,是否已经有孩子;购物习惯:网购 vs 逛商场;位置特征:哪个城市生活;或者是一些行为习惯。

    1. 人口属性:性别,年龄
    2. 资产状况:房产,收入
    3. 兴趣特征:阅读咨询,运动健康等
    4. 消费特征:网上、线下消费类别等特征
    5. 位置特征:常驻城市,职住距离等
    6. 设备属性:所使用终端的特性

    2. 画像的用处

    ​ 解决业务问题;拓展新用户;获得一个新订单;获取新用户,要知道自己产品定位的用户画像;用户画像是帮助企业明确目标客群的重要手段之一;将有类似画像特征的人群转化成自己的用户;

    ​ 例子��:打车公司:有需要且有车的用户 vs 有需要但没车的用户 结果发现 前者 的 广告触达率比较高;映射出: 习惯了车反而离不开车

    • 如何准确的了解现有用户

    • 如何在茫茫人海中通过广告营销获取类似画像特征的新用户。

      逻辑上有些相悖:了解现有用户的画像,需要的是少量、画像特征覆盖度全面的无倾斜的精准样本,这样更能精确的定位产品的用户。而通过画像结果做广告营销获取新用户,在一定程度上需要的是大量的相似样本;量的大小和精准度的不同决定了后续画像模型在应用设计中的不同。

    标签:表达人的基本属性,兴趣爱好,行为偏好等某一个维度的数据标示。一种相关性很强的关键字,可以简洁的描述和分类人群。不同的行业,不同的应用场景,同样的标签名称可能代表不同的含义,也决定了不同的模型设计和数据处理方式。

    ​ 例子:卖男装筛选“男性”,“网络购物” 这两个标签进行投放,效果并不理想;

    “性别”有多种维度

    • 真实性别
    • 网络购物特征男女
    • 性取向男女

    3. 如何进行用户画像

    取决于业务目标(需要什么样的画像标签)和有什么样的原材料(有什么类型的数据源),基于这样才能确定使用什么样的模型设计和数据计算处理方式。

    1. 征信场景,想知道这个人的真实性别:

      在没有全量真实数据的情况下,可以采取如下的方法来处理:选取少量真实样本,使用这些真实样本追加一些特征因子,使用looklike算法进行样本扩展,将该少数样本特征扩展到大量或者全量数据。当然,这些数据的准确率取决于样本的均衡程度和算法的质量。

    2. 网络购物的电商场景

      考虑将来该网络账户实体是否会购买男装的角度,需要的是“男装购买倾向”的标签,可以基于所有账户实体以往购买记录来计算处理该标签。

    3. 同性交友app定义的男性

      “男性同志”标签,考虑通过安装了类似同志交友的app人群或者以同志人群经常出现的聚集地进行计算处理。

    使用这些不同源的数据,计算处理业务需要的标签:

    1. 数据抽取:从不同数据源抽取要计算标签的数据原材料
    2. 数据标准化:针对抽取的数据将其清洗为标准格式,将其中的错误数据和无效数据剔除。
    3. 数据打通:不同来源的数据有不同的主键和属性,比如有设备的WiFi信息,又有设备的poi信息,就可以通过WiFi将设备终端和poi(point of information)建立起关联。
    4. 模型设计:针对不同的数据内容和业务目标设计不同的规则和算法进行模型的构建,并使用小样本数据进行模型的可靠性验证
    5. 标签计算:在模型可靠性验证的基础上,部署生产运营环境来进行标签计算。

    例子:大学生标签

    没有每个大学生的入学信息和证件信息,我们如何操作呢。

    1. 进行业务分析,发现大学生的行为特征:在大学校园内活动比较多,将全国2000多所高校的位置找到,根据移动终端设备的位置信息来筛选“大学生人群”;
    2. 使用一些特殊的app,比如考研类,四六级,课程表等这类特殊app,可以通过app进行“大学生”人群的筛选。

    如何不用算法,就只用规则,我们想找精确的“大学生”人群,可以将位置和app行为两个特征叠加使用;

    如果我们想要扩展样本进行大规模广告投放,可以考虑含位置、app行为任意一个特征的人群,同时还可以通过算法类似lookalike的扩展样本学习。

    用户画像和标签设计中的一些难点

    1. 如何定义画像主体?如何唯一标识一个实体?

      真实世界每个人都是一个实体,但是虚拟世界他可能就变身为多个,比如人可能有一个身份id, 但是可能有多个手机号,多个终端设备ID,那就对应了多个移动终端的使用行为,将这些ID的特征拼接起来才能代表完整的画像。一对多的情况。

      多对一的情况:ipad的使用。孩子用来玩游戏,父亲查邮件,母亲用来购物。只要通过标签能够筛选出来想寻找的受众群体就可以。

    2. 如何打通不同源的数据?

      pc端,移动端,tv端的行为信息,如何将这些信息关联起来,在于将这些终端的唯一标识ID打通。TalkingData的IDMapping能力已经实现了跨设备ID的关联映射。所以要解决不同源ID的打通只要接入一家类似TalkingData的数据即可。

    FAQ

    1. 常用算法

      Linear Regression 线性回归

      Logistic Regression 二分类

      multi-class logistic regression 多分类逻辑回归

      Fregata(Non-parametric Algorithms)

      Random Decision Tree 随机决策树

      Random Decision Hashing 随机决策哈希

    2. 评估画像的好坏

      小样本的真实验证

      在实际的case中迭代验证

      外部标签的交叉验证,比如“已婚”标签的,不可能是”18岁以下”人群。

    3. 标签的存储

      hdfs,vertica, hbase。标签的追溯,取决于你的标签的生命周期,有的标签就是最新的,有的是每周每月加工的,有的是时间衰减迭代的。

    4. 样本的准确性

      大数据本身不存在所谓的正确性,是用来验证人的先验知识/经验的一种工具,这个里面应该考虑的不止是准确性的问题,而是如何能更好的提高你认为的准确率的问题,大数据由于题量大,需要的是数量、时间等多维的迭代,维度的扩展。

    展开全文
  • 甚至还可以判断出你孩子大概的年龄,贴上“有 5-10 岁的孩子”这样更为具体的标签,而这些所有给你贴的标签统在一次,就成了你的用户画像,因此,也可以说用户画像就是判断一个人是什么的人。 除去“标签化”,...

    什么是用户画像?

    Alan Cooper (交互设计之父)最早提出了 persona 的概念:“Personas are a concrete representation of target users.”Persona 是真实用户的虚拟代表,是建立在一系列真实数据(Marketing data,Usability data)之上的目标用户模型。

    简而言之,用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。
    举例来说,如果你经常购买一些玩偶玩具,那么电商网站即可根据玩具购买的情况替你打上标签“有孩子”,甚至还可以判断出你孩子大概的年龄,贴上“有 5-10 岁的孩子”这样更为具体的标签,而这些所有给你贴的标签统在一次,就成了你的用户画像,因此,也可以说用户画像就是判断一个人是什么样的人。
    除去“标签化”,用户画像还具有的特点是“低交叉率”,当两组画像除了权重较小的标签外其余标签几乎一致,那就可以将二者合并,弱化低权重标签的差异。

    用户画像的作用

    罗振宇在《时间的朋友》跨年演讲上举了这样一个例子:当一个坏商家掌握了你的购买数据,他就可以根据你平常购买商品的偏好来决定是给你发正品还是假货以提高利润。且不说是否存在这情况,但这也说明了利用用户画像可以做到“精准销售”,当然了,这是极其错误的用法。

    其作用大体不离以下几个方面:
    1. 精准营销,分析产品潜在用户,针对特定群体利用短信邮件等方式进行营销;
    2. 用户统计,比如中国大学购买书籍人数 TOP10,全国分城市奶爸指数;
    3. 数据挖掘,构建智能推荐系统,利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌,利用聚类算法分析,喜欢红酒的人年龄段分布情况;
    4. 进行效果评估,完善产品运营,提升服务质量,其实这也就相当于市场调研、用户调研,迅速下定位服务群体,提供高水平的服务;
    5. 对服务或产品进行私人定制,即个性化的服务某类群体甚至每一位用户(个人认为这是目前的发展趋势,未来的消费主流)。比如,某公司想推出一款面向 5-10 岁儿童的玩具,通过用户画像进行分析,发现形象=“喜羊羊”、价格区间=“中等”的偏好比重最大,那么就给新产品提供类非常客观有效的决策依据。
    6. 业务经营分析以及竞争分析,影响企业发展战略。

    构建流程

    用户画像构建流程

    数据收集

    数据收集大致分为网络行为数据、服务内行为数据、用户内容偏好数据、用户交易数据这四类。
    1. 网络行为数据:活跃人数、页面浏览量、访问时长、激活率、外部触点、社交数据等
    2. 服务内行为数据:浏览路径、页面停留时间、访问深度、唯一页面浏览次数等
    3. 用户内容便好数据:浏览/收藏内容、评论内容、互动内容、生活形态偏好、品牌偏好等
    4. 用户交易数据(交易类服务):贡献率、客单价、连带率、回头率、流失率等

    当然,收集到的数据不会是 100% 准确的,都具有不确定性,这就需要在后面的阶段中建模来再判断,比如某用户在性别一栏填的男,但通过其行为偏好可判断其性别为“女”的概率为 80%。
    还得一提的是,储存用户行为数据时最好同时储存下发生该行为的场景,以便更好地进行数据分析。

    行为建模

    该阶段是对上阶段收集到数据的处理,进行行为建模,以抽象出用户的标签,这个阶段注重的应是大概率事件,通过数学算法模型尽可能地排除用户的偶然行为。

    这时也要用到机器学习,对用户的行为、偏好进行猜测,好比一个 y=kx+b 的算法,X 代表已知信息,Y 是用户偏好,通过不断的精确 k 和 b 来精确 Y。

    在这个阶段,需要用到很多模型来给用户贴标签。

    用户汽车模型
    根据用户对“汽车”话题的关注或购买相关产品的情况来判断用户是否有车、是否准备买车
    用户忠诚度模型
    通过判断+聚类算法判断用户的忠诚度
    身高体型模型
    根据用户购买服装鞋帽等用品判断
    文艺青年模型
    根据用户发言、评论等行为判断用户是否为文艺青年
    用户价值模型
    判断用户对于网站的价值,对于提高用户留存率非常有用(电商网站一般使用 RFM 实现)

    还有消费能力、违约概率、流失概率等等诸多模型。

    用户画像基本成型

    该阶段可以说是二阶段的一个深入,要把用户的基本属性(年龄、性别、地域)、购买能力、行为特征、兴趣爱好、心理特征、社交网络大致地标签化。

    为什么说是基本成型?因为用户画像永远也无法 100% 地描述一个人,只能做到不断地去逼近一个人,因此,用户画像既应根据变化的基础数据不断修正,又要根据已知数据来抽象出新的标签使用户画像越来越立体。

    关于“标签化”,一般采用多级标签、多级分类,比如第一级标签是基本信息(姓名、性别),第二级是消费习惯、用户行为;第一级分类有人口属性,人口属性又有基本信息、地理位置等二级分类,地理位置又分工作地址和家庭地址的三级分类。

    数据可视化分析

    这是把用户画像真正利用起来的一步,在此步骤中一般是针对群体的分析,比如可以根据用户价值来细分出核心用户、评估某一群体的潜在价值空间,以作出针对性的运营。
    如图:

    原文链接

    展开全文
  • 大数据的应用——用户画像

    千次阅读 2016-10-27 21:45:28
    这完全取决于业务目标(需要什么的画像标签)和有什么的原材料(有什么类型的数据源),基于这两才能确定使用什么的模型设计和数据计算处理方式。就做菜一样,要做一顿美味的晚餐,必须知道客户是想吃中餐...

    什么是画像?

    什么是画像呢?可能大家看到过一些外文资料或者演讲中出现过profile一词,其实和画像是一个概念,都是从不同的维度来表达一个人,这些维度可以是事实的,可以是抽象的;可以是自然属性,比如性别、年龄;可以是社会属性,比如职业、社交特征;可以是财富状况,比如是否高收入人群,是否有固定资产;可以是家庭情况,比如是否已经结婚,是否有孩子;可以是购物习惯,比如喜欢网购还是喜欢逛商场;可以是位置特征,比如在哪个城市生活;可以是其他行为习惯。总之,所有大家能想到的描述一个人的特征的都可以算作是画像的范畴,画像其实就是想方设法用数据来描述人的特征。

    画像的用处?

    大家之所以要进行用户画像,就是为了解决业务问题,或者为了拓展一个新用户,或者为了获得一个新订单。想要获得新用户,首先必须知道自己产品定位的用户画像(也就是用户长什么样子,有什么行为特征),而很多产品设计的时候可能由于定位不清晰,对用户的了解不够,导致最后产品上线后效果与预期大相径庭。
    这里举一个例子,A银行的电子支付团队计划与Uber公司合作,在春节后以短信推送优惠劵的方式进行营销,选择了多类人群进行投放,其中有“有打车需求且有车”和“有打车需求且无车”两类人群,本以为“有需求且无车”人群的广告触达的营销效果会更好,结果却完全相反,“有需求且有车”人群的广告触达的比例反而最高。这可能映射出无论是开车还是打车,习惯了车反而离不开车。用数据来画像正是帮助企业了解用户和定位产品的最直接的方法。
    综上我们可以看到要向更好的解决业务问题,首先必须明确业务目标,而用户画像是帮助企业明确目标客群的重要手段之一。当企业了解了自己的用户都长什么样子以后,接下来的任务就是如何将有类似画像特征人群的潜在用户变成自己的用户,也就是在营销上获新客的过程。所以,从大的框架来看,用户画像承载了两个业务目标:

    • 如何准确的了解现有用户;
    • 如何在茫茫人海中通过广告营销获取类似画像特征的新用户。

    如果仔细琢磨这两个目标,其实在根源上逻辑是有些相悖的。了解现有用户的画像,需要的是少量、画像特征覆盖度全面的无倾斜的精准样本,这样能更精确的定位产品的用户。而通过画像结果做广告营销获取新用户,在一定程度上需要的是大量的相似样本。量的大小和精准度的不同决定了后续画像模型在应用设计中的不同。
    提到用户画像就不得不提到一个词“标签”。标签是表达人的基本属性、行为倾向、兴趣偏好等某一个维度的数据标识,它是一种相关性很强的关键字,可以简洁的描述和分类人群。标签的定义来源于业务目标,基于不同的行业,不同的应用场景,同样的标签名称可能代表了不同的含义,也决定了不同的模型设计和数据处理方式。举个例子,如果一款卖男装的app想在近期做营销,只筛选“男性”和“网络购物”这两个标签进行投放,可能效果并不一定理想。因为“性别(男/女)”可能有多种维度,真实性别男女是一种维度,网络购物特征男女是一种维度,性取向男女可能又是另外一种维度。因为网络的发展,你甚至都不知道网络的另一端是不是一个人,更何况是男女呢。想要正确的设计标签模型和计算处理数据,必须了解画像标签应用的场景和目标。

    如何进行人物画像?

    这完全取决于业务目标(需要什么样的画像标签)和有什么样的原材料(有什么类型的数据源),基于这两样才能确定使用什么样的模型设计和数据计算处理方式。就像做菜一样,要做一顿美味的晚餐,必须知道客户是想吃中餐还是西餐,配菜都有哪些鱼蛋肉和蔬菜,然后才能确定牛肉是红烧还是煎炸。
    仍然以性别(男/女)为例,尝试演绎一下刚才的三个场景。
    如果业务是征信场景,想知道的是这个人的真实性别(男/女),在没有全量真实数据的前提下可以采取如下的方法来处理,可以选取少量真实样本,使用这些真实样本追加一些特征因子,使用lookalike算法进行样本扩展,将该少数样本特征扩展到大量或者全量数据。当然,这些数据的准确度取决于样本的均衡程度和算法的质量。
    如果业务是网络购物的电商场景,我们先不尝试判断真实购买男装的是否是男性(很多已婚人士是妻子负责网购丈夫的装备),仅仅考虑将来该网络账户实体是否会购买男装的角度考虑,需要的是“男装购买倾向”的标签,可以直接基于所有账户实体以往购买记录来计算处理该标签。
    如果是业务场景是blued(一款同志交友app)定义的男性又是另外一个特殊群体,基于客户想拓展新客,这里定义的特殊男性群体或许可以定义为“男性同志”标签,而实现该标签可以考虑通过安装了类似同志交友的app人群或者以同志人群经常出现的聚集地进行计算处理。
    所以说针对不同的行业,不同的应用场景,需要使用不同的数据源进行不同的标签设计和计算。

    • 人口属性:包含性别、年龄等人的基本特征;
    • 资产情况:车辆、房产、收入等资产特征;
    • 兴趣特征:阅读资讯、运动健康等兴趣偏好;
    • 消费特征:网上/线下消费类别品牌等特征;
    • 位置特征:常驻城市、职住距离等;
    • 设备属性:所使用终端的特性等。

    要支持以上这些标签的设计和计算,需要多种维度的数据源:

    • 从产生维度来看:可以包含PC端的数据、移动终端的数据、线下的数据;
    • 从数据拥有者来看:可以包含一方客户自己的数据、外部官方渠道的数据、市场采集的数据;
    • 从数据类型来看:有社交数据、交易数据、位置数据、运营商数据等。

    使用这些不同源的数据,我们如何计算处理业务需要的标签呢?一般都会经过如下几步:

    • 数据抽取:从不同数据源抽取要计算标签的数据原材料。
    • 数据标准化:针对抽取的数据将其清洗为标准格式,将其中的错误数据和无效数据剔除。
    • 数据打通:不同来源的数据有不同的主键和属性,如何将这些数据关联起来是数据打通的关键,比如有设备的wifi信息,又有设备的poi信息,就可以通过wifi将设备终端和POI建立起关联。
    • 模型设计:针对不同的数据内容和业务目标设计不同的规则和算法进行模型的构建,并使用小样本数据来验证模型的可靠性。
    • 标签计算:在模型可靠性验证的基础上,部署生产运营环境来进行标签计算。

    一般标签计算无外乎以上过程,以“大学生”标签为例,假如我们需要针对移动终端人群设计一个大学生标签,而我们并没有每个大学生的入学信息和证件信息,我们该如何操作呢。首先进行业务分析,发现大学生的行为特征,一般大学生都会在大学校园内活动比较多,我们可以将全国2000多所高校的位置找到,根据移动终端设备的位置信息来筛选“大学生”人群;另外大学生可能还会使用一些特殊的app比如考研类、四六级、超级课程表等这些特殊app,我们可以通过app进行“大学生”人群的筛选。如果不用算法,就只用规则,我们想找精确的“大学生”人群,可以将位置和app行为两个特征叠加使用;如果我们想要扩展样本进行大规模广告投放,可以考虑含有位置、app行为任意一个特征的人群,同时还可以通过算法进行lookalike的扩展样本学习。注:以上表达的都是数据和标签处理的逻辑过程,实际业务中的数据处理要视具体情况而定。

    画像常用算法?


    这里写图片描述

    用户画像和标签设计/计算中的一些难点

    • 如何定义画像主体?也可以理解为如何唯一标识一个实体?

      • 可以理解真实世界每个人都是一个实体,但是虚拟世界他可能就变身为多个,比如人可能有一个身份ID,但是可能有多个手机,就对应了多个手机号,多个设备终端ID,那就对应多个移动终端的使用行为;这多个终端ID分别代表了这个实体的不同特征,只有将这个实体拼接起来才能代表完整的画像。一个人可能有多个qq号,如果从qq行为的角度分析,同样的逻辑。这是终端实体多对一的体现。反过来也会有一对多的情况,比如就一个家庭用的ipad,孩子用ipad来玩游戏,父亲用ipad来查收邮件,母亲用ipad来购物,这一个ipad代表了多个实体的行为特征,并且无法分拆。所以要想唯一完整的定义一个实体其实很难。所以在业务领域中追求标签的完整性有时候是一个很难达到的目标,反过来应该更多的关注标签的代表性,无论是一对多还是多对一,只要能通过标签筛选出来想寻找的受众群体就可以,即便是家庭公用的ipad,有游戏标签也表明了家庭中有成员有该方面的兴趣偏好。
    • 如何打通不同源的数据?

      • pc端的行为信息、移动终端的行为信息和TV端的行为信息,如何将这些信息关联起来?核心问题在于如何将这些终端的唯一标识ID打通。TalkingData的数据体系已经建立了以TDID为核心ID的关联图谱,TalkingData的IDmapping能力已经实现了跨设备ID的关联映射。所以要解决不同源ID的打通只要接入一家类似TalkingData的数据即可。而TalkingData的数据ID体系可以实现如下能力。
    展开全文
  • 当然这里面的大部分标签都是静态的,也就是在一定的时间范围内,几乎是不会变化的,比如性别、年龄、学历、职业、收入、居住地、兴趣爱好等等,而浏览习惯、用户行为等等信息则会在不同时间都产生不同的分布。...

    一、什么是用户画像

    关于用户画像的定义,不得不提的就是 Alan Cooper 提出的 persona 概念:

    建立在一系列真实数据之上的目标用户模型。通过用户调研去了解用户,根据他们的目标、行为和观点的差异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名字、照片、一些人口统计学要素、场景等描述,就形成了一个人物原型。

    其实用户画像就是为了方便我们具体地、标签化地、有针对性地描述用户特征,并以此作为市场分析、商业决策、精准营销的依据。

    通常,我们对用户进行标签化之后会得到一些精准的描述,比如:
    25岁左右的男性,本科学历,互联网工程师,长期定居一、二线城市,经常关注数码产品,喜欢玩游戏。

    这就是一个超级简单的用户画像,当然这个可以表示一个用户,也可以用来描述一个群体。像这样的标签我们可以有很多类型:

    性别
    年龄
    学历
    职业
    收入
    居住地
    兴趣爱好
    浏览习惯
    交际圈子
    ……

    当然这里面的大部分标签都是静态的,也就是在一定的时间范围内,几乎是不会变化的,比如性别、年龄、学历、职业、收入、居住地、兴趣爱好等等,而像浏览习惯、用户行为等等信息则会在不同时间都产生不同的分布。

    静态的标签很多时候是通过用户的注册信息直接获得的,比如我们一般在注册用户信息、填写个人资料的时候都会填写性别、出生年月、学历、职业之类的信息。

    而动态标签是一般是基于用户真实的产品使用行为,对于一款产品,一个用户(一类用户)使用的频率是怎么样的,他在使用哪些功能,时间是多少……从这些行为记录信息中,我们可以得到一些非标签化,但非常具体且很有用的数据。



    二、用户画像有什么作用

    在互联网的早期,用户画像就是记录一些用户的基本信息,多数都是通过用户自己输入的静态数据。因为数据量和技术的限制,也没有那么多高大上的用法。

    数据分析

    数据量大了之后,对于平台来说,如何去有效地定义用户,高效地对用户进行描述就成了一个问题。然后大家发现,打标签是最有效的方式,打标签的重要目的之一是为了让人能够理解并且方便计算机处理,如,可以做分类统计:来自一、二、三线城市的用户分别有多少?喜欢篮球的有多少?单身有多少?有了这些标签,就可以做一些基本的数据分析了。

    产品定位

    再设计商业项目或者新产品之前,我们都会对用户和市场做一个系统的分析。我们的产品/服务面向的用户是哪一个群体,年龄范围是什么?有无性别区分?收入水平是什么样的?对我们产品涉及的领域的消费观念是怎么样?前期不论是粗犷的定位还是精细化地调研,其实都是在手动做这些打标签、建立用户画像的动作。

    精准推广/用户拉新

    通过打标签的这种形式,能够让平台对用户有基本的了解,知道哪部分人是自己的主流用户。比如技能学习平台,主流用户是大学高年级学生以及初入职场的年轻人;比如运动内容平台的主流用户可能是16-30岁之间,一、二线城市的男性……有了这些用户画像之后,平台可以精准地去寻找渠道,使广告效益最大化。

    个性化服务

    用户产生的数据越来越多,平台提供的内容、服务也越来越多,如何针对不同用户提供不同的内容,降低用户筛选内容、服务的成本?这就是做数据挖掘工作:喜欢运动的男性通常会购买哪些商品?经常关注数码产品的人可以推荐哪些内容?A用户和B用户的标签非常相似,A购买的哪些商品是可以推荐给B的?这就有点我们经常说的精细化运营和推荐系统的味道了。

    大数据处理,离不开计算机的运算,标签(用户画像)提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解” 人。当计算机具备这样的能力后,无论是搜索引擎、推荐引擎、广告投放等各种应用领域,都将能进一步提升精准度,提高信息获取的效率。



    三、如何建立用户画像

    1.数据源的准备与分析

    对于现在的互联网产品来说,基本上都是有现成的用户数据,那其实需要做的事情就是将这些数据进行结构化和清洗,去除噪音和不规整的数据,为后续的建模做好准备。

    那如果是产品为成型或者用户量特别少怎么办呢?这个没有特别好的办法,数据仍然是一个重要的武器。当然有一些公开的数据,或者可以付费获取的行业用户数据也是可以利用的资源。也可以进行一些实际的用户调研(可以外包),获取用户调研的数据。

    如上所述,数据源可以划分为静态数据和动态数据,这里需要提一点的是,为了用户画像更好地建立,在建立用户信息的时候就要规划好,也可以尝试利用一些激励机制来刺激用户完善信息。当然动态数据的埋点也要做好,页面访问、浏览行为、消费行为、点击行为等数据尽量完善,这样在需要的时候可以获得足够的数据。


    2.用户分类

    通过对用户静态数据的分析,可以进行基本的用户分类,比如男、女用户,城市分布、年龄段划分、用户来源划分、收入水平划分、职业化分等。

    静态数据获取后,需要对人群进行因子和聚类分析,不同的目的分类依据不同:如对于产品设计来说,按照使用动机或使用行为划分是最为常见的方式,而对于营销类媒体来说,依据消费形态来区分人群是最为直接的分类方式。


    3.用户标签的定义与权重

    有了静态和动态的数据之后,我们就要为每个用户打上标签,以及该标签的权重。
    标签,表征了内容,用户对该产品或者服务有兴趣、偏好、需求等等。
    权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度。
    最后我们得到的最终标签可能是:

    小明:游戏 0.8;运动 0.6;音乐 0.5;读书 0.3……
    小王:游戏 0.3;运动 0.3;音乐 0.8;读书 0.5……
    聚聚:游戏 0.1;运动 0.5;音乐 0.6;读书0.8……

    权重如何来定义呢?其实这个需要一定的经验,如果你对用户或者行业大致情况比较了解,那么可以通过经验来进行定义。当然也可以请领域的专家来帮忙进行。

    当然这个权重可能就不是一成不变的,每个用户的阶段性变化以及整个用户市场的变化都是有可能对权重的定义产生影响,这个可以在后期不断优化。

    根据特征值对群体进行定义,有助于一目了然掌握该群体的特性,如“时尚潮人”,“运动达人”可以快速的联想到针对这类人,同时有利于具象化地去寻找这类潜在用户。


    4.数据建模

    完成前面3个步骤,其实已经可以做很多落地的事情了,笔记用户行为分析,广告的精准投放,产品服务的更新迭代,简单的内容推荐等等。

    但是这个离精准推荐、精细化运营还有一些距离。如何根据用户行为,来自动为用户添加标签、设置权重,如何通过用户行为对不同用户进行相似性衡量,如何通过相似性度量进行针对性的推荐,这些可能是用户数据量达到一定规模之后需要考虑的事情。

    目前比较常用的协同过滤的推荐思想,就是在对用户的行为数据进行定量化分析和相似性度量之后,自出的自动化决策。

    当然并不是只有推荐系统,精准化的分析和决策、个性化的管理、甚至自动化的运营都是建立在这个基础之上。


    当然,用户画像的事情,如何做,还是要根据自己的产品,和行业的经验进行针对性地搭建,并在此基础上根据运营情况迭代和优化,并没有一个可以适用于任何产品的通用框架。当然别人的经验是可以借鉴的,这也可以少走很多弯路,之前在DC学院看到过一个比较系统讲解用户画像(包括如何筛选数据源,定义、寻找特征,通过聚类和分类的算法进行预测和具体如何去实施)的小课,强烈推荐:基于用户画像的精准营销

     
    展开全文
  • 我先引用梵高的一句话:“我想强调的是,同一个人有多样的自画像。与其追求照相般的相似性,不如深入地发掘相似处”。下图是是当时梵高比较得意时的画像,戴了礼帽,穿了西服,但那时耳朵已经割掉了。我觉得作为一个...
  • 达芬奇自画像 《蒙娜丽莎》 他深入研究了当时几乎无人涉足的透视法、解剖学。 达芬奇笔记 这还远远不够。 他在作画前,还会使用科学的方法洞察人物。 15世纪,达芬奇笔下的画像栩栩如生,主要在于他...
  • 用户画像-全部步骤

    千次阅读 2016-07-16 18:33:32
    很多朋友说是来推销SPSS的,可能是因为我当时的困惑就在于收集完了上面的数据之后我到底怎么定量出来,没有人告诉我是什么步骤,我省略了上面的一些工作,直接说了我当时最困惑的地方。对给大家带来的困扰,表示...
  • 在这个阶段,你需要通过产品后台所反馈的数据(显性、隐形等,后文会介绍)进行整理,得出一个详细的用户画像,这里不在初创期那样做泛调查,抓宏观。而是需要改变策略,从细节抓起,从每一次和用户的交互中寻找...
  •  用户画像的前提是一系列真实数据之上的目标群体的用户模型,即我们可以根据用户的属性及行为特征,抽象出相对应的标签,拟合成的虚拟的象,主要即包含基本属性、社会属性、行为属性及心理属性。特别要注意的一点...
  • 人物的鞋子怎样?萝莉的鞋子怎样?学习绘画难吗?怎样才能学好绘画?想必这些都是绘画初学者们常常在想的问题吧,就是不知道怎么才能绘画好人物的鞋子,比如说萝莉的鞋子,可爱人物的鞋子等等 那么今日收集整理...
  • 一号店用户画像系统实践

    千次阅读 2017-01-10 11:12:54
    电子商务是互联网应用中发展期最早且模式最为成熟的商业模式,其用户和业务所带来的数据规模不断扩大,如何从大数据获取更大的价值?...在开场之前,我想先引用梵高的一句话:“我想强调的是,同一个人有多样的自
  • 网格顶点动画(变形动画)是针对于物体的形状...所以变形动画还是别用到过于复杂的模型之上,毕竟到头来吃力的只会是你的CPU,不过一些简单的模型倒不用担心,什么旗帜飘扬什么的,不用打开3DMAX(前提是得会用...
  • 小伙伴们了解的怎么了?如果还没有了解过Animation的小伙伴可以看看这篇博客 android动画介绍--Animation 实现loading动画效果 安卓内置的四种动画虽然说可以用AnimationSet进行组合操作,但是这些组合往往在特定...
  • 场景引擎:个性化的核心,判断用户处于哪个购物环节,有什么的购物目标; 规则引擎:业务的核心,结合用户、场景、算法输出数据和业务KPI,决定为用户推荐哪些内容; 算法引擎:计算用户之间的相似度、商品...
  • 还有画像二字,也是很懵逼的,画像,什么一个僵尸吗。选完题目之后,后面就组队,不得不说我们的团队还是配合的相当的不错,师姐,师兄,师妹,个个都很给力,通过我们的团队合作,可以说是相当的完美了。...
  • 【数据猿导读】“精准营销”依托大数据的发展,分析用户的消费习惯,给用户的消费行为打上专属标签,根据标签内容出用户画像,继而有针对性的进行精准推送,最终实现品牌/平台的精准化营销作者 | 斑马传媒官网 | ...
  • 难得放假了,除了弹吉他以外,也一下。 绘画的过程也发上来给大家看看: 接下来说说绘画的工具。 我是使用iPadPro2 10.5英寸+Apple Pencil来画画的。 一开始我打算使用Surface Go来画画的,我想,之前我...
  • 你的企业需要做出什么的变化?你准备如何重新定义你的公司? 重新打造自己: 你需要成为怎样的人?要重塑自己并在数字化+智能化时代保有领先地位,你必须如何去做? AI-CPS OS 是数字化智能化创新...
  • 怎么用Java实现将一张图片转成字符?? 输入:一张图片 输出:一个txt文档,由字符构成,看起来很那张照片的字符。 基本思想:根据照片的灰度采用不同的字符出来,形成一个灰度表。 ...
  •  给谁画像,什么,为什么这个,画像的分类和预期结果是怎么的,这些问题都不是系统完全自动产生的。当然,在大数据足够多的程度下,可形成客户的关键信息画像,但是现在应用更为广泛的是人工+系统结合的...
  • 从优势和卖点出发,我们接下来思考两:产品能帮助用户解决什么困难?如何让用户情感上面找到共鸣?还是说减肥产品: 客户忧虑:太胖了对身体不健康,很多减肥产品有副作用,怕反弹,怕上当受骗… 情感共鸣:女性想...
  • 自定义 View 之雅虎新闻视差动画

    万次阅读 2019-07-02 18:28:58
     根据上面我的那张图,我们看到大圆一周共有 6 个小圆,我们拿一个圆为例子, 绿色小圆的圆心 P 就是我们所要求的坐标。因为我们的 6 个小圆对应的角度都是均分的,所以我们也就知道了 a 的角度,通过三角...
  • 我们先看看这个小程序是什么,打开微信小程序搜索页面,搜索“猜小歌”,打开这个小程序,点击开始作画。小程序会先出题,告诉你什么,20秒倒计时,你完内容,然后谷歌AI去...
  • javascript实现图片左右移动动画

    千次阅读 2017-10-10 19:46:42
    图片的左右移动,具备荡秋千一的动画效果,图片自己可重新定义,移动速度和距离也可在代码内设定,挺简单的Js生成动画的特效代码,仅供参考。 html> html> head lang="en"> meta charset="UTF-8"> title>...
  • SVG路径动画解密

    千次阅读 2015-06-24 10:49:57
    SVG路径动画效果现在貌似越来越多网站都使用了,给我的感觉就是一段时间的流行而已,刚一出来大家都感觉很炫酷,时间久了也就审美疲劳啦!如果还不知道什么是SVG路径动画的童鞋,快来看一个demo吧:...
  • 标签体系有了之后,再基于既有作品的标签体系去看当前流行什么,再通过数据维度去看什么人群属性的人喜欢具备什么标签的题材,什么的作品留存好,什么的作品转化高,再往下拆就拆到刚才说封面,文案,什么的...
  • 你不用担心不会做动画,这里制作的都是极简单的动画,就编程学习一样,都从hello world开始,学习制作动画也作这个开始。其实只要几下按钮,就可创建一个动画出来,非常方便。 在创建之前先记住下面几个快捷键...
  • 人物的侧身怎么?侧边怎么?多角度的人物怎么?人物姿势怎么?学习绘画难吗?怎样才能学习好绘画?想必这些都是绘画初学者们经常在想的问题吧,就是不知道如何才能学习好绘画,然后绘画出自己想要绘画的东西...
  • jQuery动画入门--顺序执行

    千次阅读 2015-08-20 10:14:39
    最近一年多一直在做前端的东西,由于老板在追求一些年轻动感的效果,让页面元素不能...这两个方法就Ajax的XMLHttpRequest对象一样的隐蔽,不为常人所知。这两个方法在动画处理的时候很有用,我们经常会写一些这样的
  • 使用EA类图

    万次阅读 多人点赞 2017-06-06 20:04:14
    怎么,好没,下面继续今天的话题。 属性窗口的打开方法: 双击类图中的对应类框图,选择【General】以后,点击【Operation】按钮。  2.从模型树中选择对应的类节点,打开上下文菜单...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 106,799
精华内容 42,719
关键字:

像样点的画怎么画