精华内容
下载资源
问答
  • 06某用户画像案例这里通过一个实践案例来将大家更好地带入实际开发画像、应用画像标签的场景中。 本节主要介绍案例背景及相关的元数据,以及开发标签中可以设计的表结构样式。 在本案例的开发工作中,基于spark计算...

    o55g08d9dv.jpg广告关闭

    腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元!

    9670k7gh0o.png

    06某用户画像案例这里通过一个实践案例来将大家更好地带入实际开发画像、应用画像标签的场景中。 本节主要介绍案例背景及相关的元数据,以及开发标签中可以设计的表结构样式。 在本案例的开发工作中,基于spark计算引擎,主要涉及的语言包括hiveql、python、scala、shell等。 1. 案例背景介绍某图书电商网站拥有超过...

    最近我们对我们平台的用户进行了一个用户标签提取,这中间的主要流程如下图3-1所示:? 图3-1一、梳理做用户画像需要的数据 用户画像是基于业务数据而进行的,如果前期没有考虑好这一点,那么在真正实操时会发现做分析需要的数据存在不同的业务表里面,甚至有些数据根本没有保存。 所以,在做用户画像之前最需要做的事...

    导读 本文主要包括两部分内容,第一部分会对零零散散进行了两个多月的用户画像评测做个简要回顾和总结,第二部分会对测试中用到的python大数据处理神器pandas做个整体介绍。 part1用户画像评测回顾与总结1、为什么做用户画像评测? 将时钟拨回到2018年初,大家迫切想打破以往资讯推荐无章可循的局面,而今日的推荐...

    dexfcryeq3.jpeg

    ▌假设问题stack overflow(后面简称so)想要针对自己的用户推送一篇广告,假设针对所有用户推送,那so的用户画像到底是什么样子的? so想要在其他平台上...在蝴蝶图中可以看出,python可以说是当下最热的语言了,go和swift语言也紧随其后,可以说很好的反应了当下的趋势,看来为了掌握数据分析的技术学习python...

    ljr5sjctai.jpeg

    本文转载自数据管道最近入手了一个用户画像的项目,这里面真的“坑”满多的,你肯定很想问,不就是用户画像嘛,会这么烦吗? 现在可能就需要拆分成几个问题来做这个项目。 用户画像是什么? 用户画像,又称人群画像,是根据用户人口统计学信息(自身属性)、社交关系、偏好习惯和消费行为等信息而抽象出来的标签化...

    在《什么的是用户画像》一文中,我们已经知道用户画像对于企业的巨大意义,当然也有着非常大实时难度。 那么在用户画像的系统架构中都有哪些难度和重点要考虑的问题呢? 挑战 大数据 随着互联网的崛起和智能手机的兴起,以及物联网带来的各种可穿戴设备,我们能获取的每一个用户的数据量是非常巨大的,而用户量本身更...

    image.jpg

    “羊毛党”的行为距离欺诈只有一步之遥,他们的存在严重破环了活动的目的,侵占了活动的资源,使得正常的用户享受不到活动的直接好处。 今天主要分享下腾讯自己是如何通过大数据、用户画像、建模来防止被刷、恶意撞库的。 黑产现状介绍 “羊毛党”一般先利用自动机注册大量的目标网站的账号,当目标网站搞促销、优惠...

    i1zvxnu73x.png

    未完待续~参考文献《用户画像:方法论与工程化解决方案》更多实时数据分析相关博文与科技资讯,欢迎关注 “实时流式计算” 详细ambari官网安装文档pdf请在...(debian ubuntu)scp, curl, unzip, tar,wget和gcc*openssl(v1.01,内部版本16或更高版本)python(带python-devel *)ambari主机应至少具有1 gb ram...

    klca7j80vn.png

    如今已然是大数据时代,数据正在驱动着业务开发,驱动着运营手段,有了数据的支撑可以对用户进行用户画像,个性化定制,数据可以指明方案设计和决策优化方向,所以互联网产品的开发都是离不开对数据的收集和分析,数据收集的一种是方式是通过上报api进行自身平台用户交互情况的捕获,还有一种手段是通过开发爬虫程序...

    画像也存在mongodb中 qq截图20180719095235.png二、整体思路由于tesla集群无法直接操作mongodb,需要将tdw里面的用户画像数据,通过洛子系统导出至hdfs,再与mongodb中原有群画像进行合并。 1530842653_24_w336_h417.png 三、算法流程 image.png四、核心代码#! usrbinpython2.7# -*- coding:utf8 -*-import decimal...

    ub87i2krd6.png

    在以前,大多媒体会针对自身用户做一个分类,但是有了大数据后,企业及消费者行为带来一系列改变与重塑,通过用户画像可以更加拟人化的描述用户特点。 用户画像,即用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌,可以看作是企业...

    一般是windows系统才提供现成的可执行文件包系统自带的安装方式:linux系统或mac系统的软件管理器自带了某些库的安装方式猜你想看? 神操作:教你用python识别恶意软件 用户画像标签体系包括哪些维度? 有哪些应用场景? (附完整导图) 创建字节跳动之前,张一鸣读过哪些硬核技术书? 手把手教你做用户画像:3种标签...

    wttkkvx46p.jpeg

    而娱乐型机器人也具有其重要价值,比如建立人、机之间的信任,让机器能够更好地为用户画像等等。 目前的技术还不能将两者很好地融合在一起,因此在聊天机器人的领域,依然需要场景化的设计。 一个无聊的案例这个案例很适合无聊的时候玩玩,在你面前的是两个聊天机器人,你可以自己输入一个话题,然后打开沉默,默默的...

    并通过数据分析,先后为腾讯视频、易车、58同城、蚂蚁金服、京东分析用户画像和传播话题,为品牌活动做传播决策。? 还有好福利,极客时间2019年限量版周历...python中文社区作为一个去中心化的全球技术社区,以成为全球20万python中文开发者的精神部落为愿景,目前覆盖各大主流媒体和协作平台,与阿里、腾讯...

    ·大数据热门应用——关联分析、用户画像、推荐算法、文本挖掘、人工神经网络等最实用、最需要了解的应用的原理与实现; ·大数据主流框架一一介绍了主流的大数据框架(hadoop、spark和cassandra); ·系统架构与调优一一从速度与稳定性方面给出调优的一般性“内功心法”; ·大数据价值与变现一一从运营指标、ab测试...

    就业方向四 数据分析&挖掘(数据分析&数据挖掘工程师)熟悉主流的数据挖掘建模算法,如数据分析、分类预测、用户画像等; 掌握数据分析模型的固化及部署...作为一名技术人,如果2019年你还没有学会python,那必须立刻抓紧开始学习了:去扫一眼最新的招聘网站信息,几乎没有什么岗位不要求python能力了...

    rbiqd44iom.png

    本文就将详细介绍如何用python实现智能推荐算法,主要将分为两个部分:详细原理介绍python代码实战02常见的推荐系统与算法常见的推荐系统分类有:基于应用领域: 电子商务社交好友推荐等基于设计思想:基于协同过滤的推荐等基于使用数据: 基于用户标签的推荐等 ? “ 京腾 ” 合作构建用户画像标签图常见的推荐算法有:?...

    1zpna80ejt.png

    真达 【导读】今天教大家如何用python写一个电信用户流失预测模型。 公众号后台,回复关键字“电信”获取完整数据。 之前我们用python写了员工流失预测模型,这次我们试试python预测电信用户的流失。 01 商业理解流失客户是指那些曾经使用过产品或服务,由于对产品失去兴趣等种种原因,不再使用产品或服务的顾客...

    我们的需求非常类似于从大量短文本中获取关键词(融合社会标签和时间属性)进行用户画像。 这一切的基础就是特征词提取技术了,本文主要围绕关键词提取这个主题进行介绍(英文)。 不同版本python混用(官方用法)python2 和python3 是一个神一般的存在,如何让他们共存呢,直到我用了pycharm我才知道为啥这么多人...

    n6rkwo3z5k.png

    并且进一步获取到完整的html代码如下:数据分析 北京·朝阳区·鸟巢 50-80k·14薪 3-5年本科 曹先生数据挖掘 立即沟通数据分析 京东集团 · 数据挖掘: 曹先生 感兴趣 扫一扫,随时与boss开聊 职位描述 职位描述1、 分析研究用户画像,通过对海量数据的分析挖掘,提取用户特征、行为轨迹; 2、 参与算法研发工作...

    展开全文
  • 用户画像简介• 用户画像,即用户信息标签化,通过收集用户社会属性、消费习惯、偏好特征等各个维度数据,进而对用户或者产品特征属性的刻画,并对这些特征分析统计挖掘潜在价值信息,从而抽象出一个用户的信息...

    一 用户画像简介

    • 用户画像,即用户信息标签化,通过收集用户社会属性、消费习惯、偏好特征等各个维度数据,进而对用户或者产品特征属性的刻画,并对这些特征分析统计挖掘潜在价值信息,从而抽象出一个用户的信息全貌;

    • 可看做是企业应用大数据的根基,是定向广告投放与个性化推荐的前置条件,为数据驱动运营奠定了基础。如何从海量数据中挖掘出有价值的信息已经愈发重要。

    watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3poYW5nX3pfbWluZw==,size_16,color_FFFFFF,t_70

    二 用户画像的主要模块

    以用户端的表单填写、消费、浏览、搜索等相关操作行为数据作为输入,通过数据建模、开发、产品化,帮助企业认知、了解用户、客观了解自己的产品,输出到用户端进而提供个性化的产品、服务和营销方案做好一套能真正赋能于业务,产生落地价值的用户画像绕不开下面的8个主要模块。

    watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3poYW5nX3pfbWluZw==,size_16,color_FFFFFF,t_70

    三 用户画像的标签类型

    用户画像建模其实就是对用户进行打标签,从对用户打标签的方式来看,一般分为三种类型:1、基于统计类的标签;

    2、基于规则类的标签、

    3、基于挖掘类的标签。

    下面我们介绍这三种类型标签的区别:

    1.统计类标签:

    这类标签是最为基础也最为常见的标签类型,例如对于某个用户来说,他的性别、年龄、城市、星座、近7日活跃时长、近7日活跃天数、近7日活跃次数等字段可以从用户注册数据、用户访问、消费类数据中统计得出。该类标签构成了用户画像的基础;

    2.规则类标签:

    该类标签基于用户行为及确定的规则产生。例如对平台上“消费活跃”用户这一口径的定义为近30天交易次数>=2。在实际开发画像的过程中,由于运营人员对业务更为熟悉、而数据人员对数据的结构、分布、特征更为熟悉,因此规则类标签的规则确定由运营人员和数据人员共同协商确定;(同时需要借助数据调研)

    3.机器学习挖掘类标签:

    该类标签通过数据挖掘产生,应用在对用户的某些属性或某些行为进行预测判断。例如根据一个用户的行为习惯判断该用户是男性还是女性,根据一个用户的消费习惯判断其对某商品的偏好程度。该类标签需要通过算法挖掘产生。

    在项目工程实践中,一般统计类和规则类的标签即可以满足应用需求,开发中占有较大比例。机器学习挖掘类标签多用于预测场景,如判断用户性别是男是女,判断用户购买商品偏好、判断用户流失意向等。一般地机器学习标签开发周期较长,耗费开发成本较大,因此其开发所占比例较小。

    四 画像规划和数据架构——开发流程

    20190220164858806.png

    第一阶段:目标解读

    在建立用户画像前,首先需要明确用户画像服务于企业的对象,根据业务方需求,未来产品建设目标和用户画像分析之后预期效果;

    第二阶段:任务分解与需求调研

    经过第一阶段的需求调研和目标解读,我们已经明确了用户画像的服务对象与应用场景,接下来需要针对服务对象的需求侧重点,结合产品现有业务体系和“数据字典”规约实体和标签之间的关联关系,明确分析纬度;

    第三阶段:需求场景讨论与明确

    在本阶段,数据运营人员需要根据前面与需求方的沟通结果,输出《产品用户画像需求文档》,在该文档中明确画像应用场景、最终开发出的标签内容与应用方式 ,并就该份文档与需求方反复沟通确认无误。

    第四阶段:应用场景与数据口径确认

    经过第三个阶段明确了需求场景与最终实现的标签纬度、标签类型后,数据运营人员需要结合业务与数据仓库中已有的相关表,明确与各业务场景相关的数据口径。在该阶段中,数据运营方需要输出《产品用户画像实施文档》,该文档需要明确应用场景、标签开发的模型、涉及到的数据库与表,应用实施流程;

    第五阶段:特征选取与模型数据落表

    本阶段中数据分析挖掘人员需要根据前面明确的需求场景进行业务建模,写好HQL逻辑,将相应的模型逻辑写入临时表中,抽取数据校验是否符合业务场景需求。

    第六阶段:线下模型数据验收与测试

    数据仓库团队的人员将相关数据落表后,设置定时调度任务,进行定期增量更新数据。数据运营人员需要验收数仓加工的HQL逻辑是否符合需求,根据业务需求抽取查看表中数据范围是否在合理范围内,如果发现问题及时反馈给数据仓库人员调整代码逻辑和行为权重的数值。

    第七阶段:线上模型发布与效果追踪

    经过第六阶段,数据通过验收之后,就可以将数据接口给到搜索、或技术团队部署上线了。上线后通过对用户点击转化行为的持续追踪,调整优化模型及相关权重配置。

    五 画像规划和数据架构——数仓架构

    watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3poYW5nX3pfbWluZw==,size_16,color_FFFFFF,t_70

    六 数据指标体系

    需要开发的画像标签从大类上可划分为用户人口属性标签、用户行为标签、风险控制维度标签,进一步细分的话可在这两个画像基础上开发出用户偏好画像和群体属性、群体偏好画像等。

    6.1 属性类标签

    属性类指标按常见一级、二级标签划分可以划分出很多,这里只给出一些示例…

    watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3poYW5nX3pfbWluZw==,size_16,color_FFFFFF,t_70

    watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3poYW5nX3pfbWluZw==,size_16,color_FFFFFF,t_70

    6.2 行为类标签

    行为类指标按常见一级、二级标签划分可以划分出很多,需根据具体业务决定,

    用户行为标签画像

    watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3poYW5nX3pfbWluZw==,size_16,color_FFFFFF,t_70

    用户偏好画像

    watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3poYW5nX3pfbWluZw==,size_16,color_FFFFFF,t_70

    用户登录活跃信息

    watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3poYW5nX3pfbWluZw==,size_16,color_FFFFFF,t_70

    6.3 风险控制类标签

    风控类指标按常见一级、二级标签划分可以划分出很多

    风险控制类标签有多应用场景:

    • 客服人员根据一些用户是否高退货、高投诉、高价值等特征标签,采用不同的话术;

    • 售后运营人员根据用户是否高退货、恶意刷单、连续拒签收等标签采用不同的运营措施

    watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3poYW5nX3pfbWluZw==,size_16,color_FFFFFF,t_70

    展开全文
  • 描述大数据-用户画像DMP--小树老师更多好课大数据用户画像系统课程一、项目概述目前推广平台仅在投放端提供了有限的定向能力,广告主没有足够的流量抓手,无法满足大中型广告主的营销目标。画像系统提供基础人口属性...

    描述

    大数据-用户画像DMP

    --小树老师

    更多好课

    大数据用户画像系统课程一、项目概述目前推广平台仅在投放端提供了有限的定向能力,广告主没有足够的流量抓手,无法满足大中型广告主的营销目标。画像系统提供基础人口属性、消费行为、兴趣偏好、地理位置等众多数据标签,商户具备人群圈定、人群洞察、人群解析的能力,实现精准化、个性化的营销需求。

    课程介绍

    功能目标用户画像平台提供商家全方位洞察用户的能力,提供如下功能:标签体系构建,当前包含5大类:人口属性、消费能力、行业偏好、用户轨迹、场景偏好标签查询,查询单个标签覆盖用户量用户画像查询,查询某个用户的标签列表

    课程目标

    人群创建,通过组合标签圈定用户人群洞察,提供人群UV预估、标签人群分布人群同步,如同步给广告投放平台,进行精准营销;同步给短信营销人群扩展·自定义人群人群报表,查看人群的投放效果性能目标10亿用户、万级标签:标签/画像查询,毫秒响应人群洞察,毫秒~秒级响应人群同步,小时级生效人群扩展,T + 1天生效自定义人群,小时级生效

    课程目标

    二、系统开发要求涉及的技术要点:spark 、elasticsearch、hadoop 、hive 、LR GBDT等机器学习算法开发工具:idea、eclipse开发环境:spark2.2、hadoop2.7、hive1.2、hbase、redis开发语言:scala、java、python、shell、sql

    课程技术

    三、课程一览1、用户画像概述什么是用户画像,为什么要用户画像,画像的场景应用业内,facebook,阿里巴巴(达摩盘),腾讯(广点通)分析打造自己的内部达摩盘,基本功能跟达摩盘一致2、画像指标整理1.基础属性。人的基础属性标签,包括地域、年龄、性别等。2.兴趣偏好。这部分是投放端已有的定向能力,后期可规划更细的基于宝贝、店铺或行业的搜索选择,特定兴趣的定向功能。3.行为轨迹。基于兴趣偏好更细的行为(包括浏览、点击、成交、收藏、复购等),及不同时间段的行为交叉(包括1天、7天、30天的行为)。4.消费能力。基于平台的支付交易,购物行为、交易额计算高中低,及类目上的高消费偏好。5.好友关系。基于平台的关系链数据,推荐偏好该宝贝、店铺、行业的好友用户。6.自定义人群。支持上传自定义人群包,lookalike扩展包的大小。

    课程目录

    3、画像标签体系建设和开发1)基本属性地域、年龄、性别、学历、职业2)兴趣偏好品牌、店铺、一级类目、场景、行业3)消费能力能力等级开发4)特征人群划分一些特定的人群,高活跃,低活跃,有车一族,奶爸一家5)LBS属性长居住地6)用户轨迹交易、浏览,收藏等

    课程目录

    4、画像系统架构功能:画像多维度分析、画像指标下钻分析、投放效果追踪分析技术:基于es 、spark、hadoop 建设画像计算,以及数据存储和计算模块:用户人群包(交集并集)、追踪分析、人群画像、人群对比模块开发5、画像系统应用案例用户精准营销用户商品推荐

    课程目录

    名称解释标签:用户特征的抽象,用以描述具有某一相同特征的用户群体,依赖于平台海量的用户数据。如性别标签 ‘男’,表示平台的男性用户群体;标签有很多种分类方式,从挖掘的方式上可分为规则标签、模型标签私域标签:表示特定店铺的用户标签,如‘7天内购买过小米旗舰店手机’;私域标签只能给指定的商家使用公域标签:平台商家共享的标签;如性别标签、地域标签、平台消费能力标签、类目消费能力标签等用户画像:一套完整的标签体系,可以对用户全方位的刻画,形成用户画像人群包:通过标签的逻辑组合(与、或、排除)圈定的一批用户构成一个人群包,人群包可直接用于广告投放自定义人群包:大的商家可通过上传店铺访客的号码包(如手机号、商品ID、店铺ID)圈定一批用户构成商家自定义人群包;自定义人群包是再营销的重要手段,圈定的用户通常属于高价值用户人群扩展(Lookalike):当人群包覆盖的用户数量(UV)不足时,可通过人群扩展,初始圈定的用户作为种子用户,DMP会根据系数扩展出一批相似用户,扩展人群可用于广告投放人群洞察:针对用户圈定的人群,提供人群数量预估,人群画像查看的功能

    术语解释

    1、掌握画像标签开发技巧2、掌握数据挖掘技巧3、了解业内画像和DMP系统的架构和开发4、大数据结合业务场景落地

    课程目标

    展开全文
  • 一、什么是用户画像?男,31岁,已婚,收入1万以上,爱美食,团购达人,喜欢红酒配香烟。这样一串描述即为用户画像的典型案例。如果用一句话来描述,即:用户信息标签化。如果用一幅图来展现,即:二、为什么需要用户...

    一、什么是用户画像?

    男,31岁,已婚,收入1万以上,爱美食,团购达人,喜欢红酒配香烟。

    这样一串描述即为用户画像的典型案例。如果用一句话来描述,即:用户信息标签化。

    如果用一幅图来展现,即:

    wKiom1kCtZ3g8n3iAABUE0QjnaQ321.jpg-wh_651x-s_3591023378.jpg

    二、为什么需要用户画像

    用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理,如:

    可以做分类统计:喜欢红酒的用户有多少?喜欢红酒的人群中,男、女比例是多少?

    可以做数据挖掘工作:利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌?利用聚类算法分析,喜欢红酒的人年龄段分布情况?

    大数据处理,离不开计算机的运算,标签提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解” 人。当计算机具备这样的能力后,无论是搜索引擎、推荐引擎、广告投放等各种应用领域,都将能进一步提升精准度,提高信息获取的效率。

    三、如何构建用户画像

    一个标签通常是人为规定的高度精炼的特征标识,如年龄段标签:25~35岁,地域标签:北京,标签呈现出两个重要特征:语义化,人能很方便地理解每个标签含义。这也使得用户画像模型具备实际意义。能够较好的满足业务需求。如,判断用户偏好。短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。

    人制定标签规则,并能够通过标签快速读出其中的信息,机器方便做标签提取、聚合分析。所以,用户画像,即:用户标签,向我们展示了一种朴素、简洁的方法用于描述用户信息。

    3.1数据源分析

    构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。

    对于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式。如,世界上分为两种人,一种是学英语的人,一种是不学英语的人;客户分三类,高价值客户,中价值客户,低价值客户;产品生命周期分为,投入期、成长期、成熟期、衰退期…所有的子分类将构成了类目空间的全部集合。

    这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。

    本文将用户数据划分为静态信息数据、动态信息数据两大类。

    wKiom1kCtdCRuKGTAABLS36_3SE959.jpg

    静态信息数据

    用户相对稳定的信息,如图所示,主要包括人口属性、商业属性等方面数据。这类信息,自成标签,如果企业有真实信息则无需过多建模预测,更多的是数据清洗工作,因此这方面信息的数据建模不是本篇文章重点。

    动态信息数据

    用户不断变化的行为信息,如果存在上帝,每一个人的行为都在时刻被上帝那双无形的眼睛监控着,广义上讲,一个用户打开网页,买了一个杯子;与该用户傍晚溜了趟狗,白天取了一次钱,打了一个哈欠等等一样都是上帝眼中的用户行为。当行为集中到互联网,乃至电商,用户行为就会聚焦很多,如上图所示:浏览凡客首页、浏览休闲鞋单品页、搜索帆布鞋、发表关于鞋品质的微博、赞“双十一大促给力”的微博消息。等等均可看作互联网用户行为。

    本篇文章以互联网电商用户,为主要分析对象,暂不考虑线下用户行为数据(分析方法雷同,只是数据获取途径,用户识别方式有些差异)。

    在互联网上,用户行为,可以看作用户动态信息的唯一数据来源。如何对用户行为数据构建数据模型,分析出用户标签,将是本文着重介绍的内容。

    3.2目标分析

    用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。如,红酒 0.8、李宁 0.6。

    标签,表征了内容,用户对该内容有兴趣、偏好、需求等等。

    权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度,可以简单的理解为可信度,概率。

    3.3数据建模方法

    下面内容将详细介绍,如何根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。

    什么用户:关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。

    wKiom1kCtvCDEcp7AACfUDGZ6Ig251.jpg

    以上列举了互联网主要的用户标识方法,获取方式由易到难。视企业的用户粘性,可以获取的标识信息有所差异。

    什么时间:时间包括两个重要信息,时间戳+时间长度。时间戳,为了标识用户行为的时间点,如,1395121950(精度到秒),1395121950.083612(精度到微秒),通常采用精度到秒的时间戳即可。因为微秒的时间戳精度并不可靠。浏览器时间精度,准确度最多也只能到毫秒。时间长度,为了标识用户在某一页面的停留时间。

    什么地点:用户接触点,Touch Point。对于每个用户接触点。潜在包含了两层信息:网址 + 内容。网址:每一个url链接(页面/屏幕),即定位了一个互联网页面地址,或者某个产品的特定页面。可以是PC上某电商网站的页面url,也可以是手机上的微博,微信等应用某个功能页面,某款产品应用的特定画面。如,长城红酒单品页,微信订阅号页面,某游戏的过关页。

    内容:每个url网址(页面/屏幕)中的内容。可以是单品的相关信息:类别、品牌、描述、属性、网站信息等等。如,红酒,长城,干红,对于每个互联网接触点,其中网址决定了权重;内容决定了标签。

    注:接触点可以是网址,也可以是某个产品的特定功能界面。如,同样一瓶矿泉水,超市卖1元,火车上卖3元,景区卖5元。商品的售卖价值,不在于成本,更在于售卖地点。标签均是矿泉水,但接触点的不同体现出了权重差异。这里的权重可以理解为用户对于矿泉水的需求程度不同。即,愿意支付的价值不同。

    标签 权重

    矿泉水 1 // 超市

    矿泉水 3 // 火车

    矿泉水 5 // 景区

    类似的,用户在京东商城浏览红酒信息,与在品尚红酒网浏览红酒信息,表现出对红酒喜好度也是有差异的。这里的关注点是不同的网址,存在权重差异,权重模型的构建,需要根据各自的业务需求构建。

    所以,网址本身表征了用户的标签偏好权重。网址对应的内容体现了标签信息。

    什么事:用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏 等等。

    不同的行为类型,对于接触点的内容产生的标签信息,具有不同的权重。如,购买权重计为5,浏览计为1

    红酒 1 // 浏览红酒

    红酒 5 // 购买红酒

    综合上述分析,用户画像的数据模型,可以概括为下面的公式:用户标识 + 时间 + 行为类型 + 接触点(网址+内容),某用户因为在什么时间、地点、做了什么事。所以会打上**标签。

    用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子r,行为类型、网址决定了权重,内容决定了标签,进一步转换为公式:标签权重=衰减因子×行为权重×网址子权重

    如:用户A,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。

    标签:红酒,长城

    时间:因为是昨天的行为,假设衰减因子为:r=0.95

    行为类型:浏览行为记为权重1

    地点:品尚红酒单品页的网址子权重记为 0.9(相比京东红酒单品页的0.7)

    假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。则用户偏好标签是:红酒,权重是0.95*0.7 * 1=0.665,即,用户A:红酒 0.665、长城 0.665。

    上述模型权重值的选取只是举例参考,具体的权重值需要根据业务需求二次建模,这里强调的是如何从整体思考,去构建用户画像模型,进而能够逐步细化模型。

    四、总结

    本文并未涉及具体算法,更多的是阐述了一种分析思想,在计划构建用户画像时,能够给您提供一个系统性、框架性的思维指导。

    核心在于对用户接触点的理解,接触点内容直接决定了标签信息。内容地址、行为类型、时间衰减,决定了权重模型是关键,权重值本身的二次建模则是水到渠成的进阶。模型举例偏重电商,但其实,可以根据产品的不同,重新定义接触点。

    比如影视产品,我看了一部电影《英雄本色》,可能产生的标签是:周润发 0.6、枪战 0.5、港台 0.3。

    最后,接触点本身并不一定有内容,也可以泛化理解为某种阈值,某个行为超过多少次,达到多长时间等。

    比如游戏产品,典型接触点可能会是,关键任务,关键指数(分数)等等。如,积分超过1万分,则标记为钻石级用户。钻石用户 1.0。

    百分点现已全面应用用户画像技术于推荐引擎中,在对某电商客户,针对活动页新访客的应用中,依靠用户画像产生的个性化效果,对比热销榜,推荐效果有显著提升:推荐栏点击率提升27%, 订单转化率提升34%。

    本文作者:郭志金

    来源:51CTO

    展开全文
  • 用户画像案例分析,详细讲解各行业应用技巧,包括《大数据用户画像的方法及营销实践》、《电商平台下用户画像的设计与分析》等文章
  • 作者:简书@浪费了昨天最近用Python写了一个简书用户的爬虫,单机耗时30小时抓取了简书30万用户的数据(设置了适当的下载延迟,所以耗时较长。当然了,主要是避免简书服务器造成不必要的压力)。简书用户用户量我...
  • 一、项目背景京东电商平台最近小家电类目的订单数量、产品浏览量和搜索数量等均有所下降,相关部门计划对小家电类目进行一次促销活动...本篇分析报告主要从以上角度展开勾勒小家电消费群体的用户画像,并根据用户特...
  • 很多企业都有建设“用户画像”的需求。首先来介绍我们所理解的两种用户画像(User Persona 和 User Profile),以及如何构建用户画像(User Profile)的标签体系,并由此驱动产品智能。以下内容由更多干货分享请关注...
  • import pandas;from pandas import read_csv;data = read_csv('D:\\PDM\\4.4\\data.csv',encoding='utf8')data = data.dropna()data.shapedummyColumns = ['Gender', 'Home Ownership','Internet Connection', 'Mari...
  • 移动互联网时代,精细化运营逐渐成为企业发展的重要竞争力,“用户画像”的概念也应运而生。用户画像是指,在大数据时代,企业通过对海量数据信息进行清洗、聚类、分析,将数据抽象成标签,再利用这些标签将用户形象...
  • 大数据时代,实现精准营销并非无规律可循,关键三部曲,其中用户画像是核心:第一步:知己,意味着知道自己产品的定位是什么,产品卖点是什么等等。构建产品标签+内容标签。第二步:知彼,简单的说就是清楚竞争对手...
  • 1st Place Solution for 2016CCF StateGrid UserProfile任务介绍在复赛中,参赛者需要以电力用户的95598工单数据、电量电费营销数据等为基础,综合分析电费敏感客户特征,建立客户电费敏感度模型,对电费敏感用户的...
  • CDA数据分析师 出品作者:真达、Mika数据:真达【导读】今天教大家如何用Python写一个电信用户流失预测模型。之前我们用Python写了员工流失预测模型,这次我们试试Python预测电信用户的流失。01、商业理解流失客户是...
  • 2019独角兽企业重金招聘Python工程师标准>>> ...
  • python实现用户画像

    2020-07-13 19:31:23
    利用python相关技术搭建的用户画像web轻量级应用 利用python相关技术搭建的用户画像web轻量级应用
  • Python 生成用户画像.pdf Python 生成用户画像.pdf Python 生成用户画像.pdf
  • 利用Python搭建用户画像系统

    万次阅读 多人点赞 2017-08-30 16:32:50
    本文将对用户画像的相关知识进行进行简单的介绍,并利用Python去实现一个简单的用户画像系统。 1.什么是用户画像 用户画像可以理解成是海量数据的标签,根据用户的目标、行为和观点的差异,将他们区分为不同的类型...
  • Kmeans聚类算法 python sklearn 用户画像

    千次阅读 2017-08-17 20:54:12
    1、基本概念; 聚类分析简称聚类(clustering),是一个把数据集划分成子集的过程,每一个子集是一个簇(cluster),使得簇中的样本彼此相似,但与其他簇中的样本不相似。...在工作中遇到用户画像、群组划分问题
  • Python 微博画像分析

    千次阅读 2017-08-29 22:01:35
    在写这篇文章之前,我对Python的涉猎并不多,很多基础知识都是现学现用,中间也出现了很多问题,最终也都一一解决,也是颇为不易。 在看这篇文章前,我的MAC还只有系统自带的Python2.7环境,而这篇文章要求的运
  • 电商用户画像python实战

    千次阅读 热门讨论 2020-04-11 20:48:53
    我认为的用户画像2.某电商用户画像分析2.1 分析目的2.2 数据说明2.3 分析思路2.4 分析过程2.4.1 用户基本属性分析2.4.1.1 数据清洗2.4.1.2 男女占比分析2.4.1.3 年龄段占比分析2.4.1.4 地区/省份/城市用户TOP10分布...
  • 利用Python构建P2P用户画像

    千次阅读 2019-04-25 14:21:22
    本文通过Python分析拍拍贷互联网金融数据训练营中提供的数据集,构建用户画像。 一.提出问题 根据给定的数据构建包含性别,学历,是否首标,年龄分布的用户画像。 二.数据处理 将数据导入后,依次进行重复值,缺失值...
  • Excel实现Python数据分析项目数据和源码-用户画像
  • Python数据分析学习笔记05:用户画像

    千次阅读 2019-10-16 09:51:51
    Python数据分析学习笔记05:用户画像 一、用户画像 用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度...
  • 项目描述:本项目对2020年某家公司...语言及工具:Python 3 , jupyter notebook 1.导入所需库和数据 import pandas as pd import numpy as np import matplotlib.pyplot as plt import re import warnings warnings
  • 一、数据准备 主要用到两个数据文件: action.txt , document.txt 。...用户编码 文档编码 行为 日期IP地址 下表为 document.txt ,数据格式: docid channelname source keyword:score ,即: 文档编码 类别(大...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 7,189
精华内容 2,875
关键字:

python用户画像

python 订阅