精华内容
下载资源
问答
  • 电商后台之【商品管理系统】
    千次阅读
    2020-06-29 10:34:29

    前面介绍了根据商品流转所涉及的系统模块,供应商与合同的管理已经总结过,所以本篇继续写一下商品管理模块。

    关于商品管理系统的总结介绍在网能够搜索出好多,这里也结合了接触过的系统,借鉴了一些资料,根据个人的理解整理出来,希望能够按计划形成一个完整的供应链系列文章,目的是通过梳理总结让自己原来懵懂的内容清晰,希望有缘看到此篇文章的人给出建议,共同学习进步。

    我心自有光明月,千古团圆永无缺。山河大地拥清辉,赏心何必中秋节。

    一、SPU与SKU

    这个属于老生常谈,但还是温习一下这两个概念。

    • SPU:标准化产品单元(Standard Product Unit),是商品信息聚合的最小单位,是一组可复用标准化信息的集合,我的理解它主要也是为了前端显示为目的;
    • SKU:最小的库存单位(StockKeeping Unit),可以以件,盒,箱,千克等为单位存储,商品的进货、销售、售价、库存等最终都是以SKU为准的。

    一个SPU可以包含多个SKU,SKU是一般是根据SPU的销售属性组合(笛卡尔乘积);

    如华为Mate30手机是一个产品,但是它有白色、金色、黑色三种颜色可选,根据规格属性又有64G、128G、256G存储,这时就共会产生9个SKU(3种颜色*3种内存规格)。

    有的电商系统中是不设置SPU的,仅有SKU,这样做的目的是增加商品的曝光率,让用户更直接的看到其商品,缺点就是像服装、鞋类等商品不同尺码的也显示,让用户看起来不舒服(感觉满屏都是同样的商品);

    具体如何启用SPU可以根据实际场景进行设计,下图是一个简单的spu、sku、分类及属性的关联。

    二、商品管理系统组成

    商品系统一般要包含以上几部分信息,通过商品状态的变化完成在整个供应链系统中的周转;电商系统中所有的操作都是围绕商品进行的或是为商品服务的,这样理解也不为过。

    商品搜索和商品紧密关联,但是一般是通过商品信息、商品属性设置关键词单独建立和部署的且与前端系统关联更为密切,这里就不过多介绍了。

    1. 分类管理

    商品分类是系统中非常重要的部分,它分为前端分类与后端分类。

    后端分类是基础,进销存业务都是和分类紧密关联的,从商品进货到商品库存,再到商品销售,最后到财务核算很多都是以后端分类为维度进行的;同时商品的很多属性信息也是建立在商品分类上的。

    前端分类是为了前端销售而建立的,它是以后端分类为基础,是为了在前端有效展示商品、用户快的搜索,查找商品而建立的一套分类。

    有的系统只有一套分类,虽然业务也能正常的进行,但这样作对于网站运营同事来说可能极不方便,现在的电商网站都是前后端分类分离,前端分类负责商品展示用户体验的,后端分类用于内部ERP系统而建立的。

    前端分类与后端分类层级,目前最常见的都是建立三级,分类内容:分类ID、分类名称及分类编码。

    前后端分类关联约束:

    1. 一个前台品类可关联多个后台的一级、二级和三级品类;
    2. 后台品类仅可以关联在前台的三级品类;
    3. 一个后台品类仅可以关联一个前台品类。

    对于分类的维护等功能,可以采用树状的层级式,也可以采用三级联系的方式(原型就略了大家都明白)。

    此部分工作是先建后端分类,再建前端分类,然后设置分类映射关系(具体可以按实际业务进行规则设置)

    2. 分类调整

    前端分类涉及到商品的展示、搜索,主要是应对频繁的变化的,所以会经常有些调整,以达到更好的用户体验,同时也是为了减少因为前端而影响到后端系统分类。

    后端分类从供应链、财务方面考虑不建议调整,但是由于公司的组织调整、国家相关税法调整等,不可避免的会进行分类的调整,调整的内容分为两部分:

    (1)分类的归属调整,原来属于“酒水->白酒”下的三级分类“浓香型”调整到“酒水->黄酒”下。

    这种调整对于SKUSPU无影响,但是对于相关的统计报表(历史数据如果没有记录冗余分类信息)等会有显示的影响。

    (2)分类上的重要信息变化,如税率变化;旧分类体系不适合新建立分类,这时所有的商品都要采用新的分类结构,同时前端分类也要进行调整。这部分对于系统影响是非常大的,涉及历史数据、当前系统(前后端)。

    应对办法:

    1. 在系统设计时增加必要的冗余字段,以应对分类调整对历史数据的影响(业务单据、统计报表);
    2. 增加快照信息,即每月都有分类数据的快照表,在相关业务单据、报表等都关联自己所属的快照表,这样程序逻辑要复杂些,不建议这样做。

    3. 属性管理

    商品属性也是基础信息,一般分为基本属性、关键属性和销售属性。

    每个商品属性又对应有不同的属性值,辟如属性“尺码”,它就有“S、M、L、XL、XXL”等属性值。

    对于这部分我也找了一些资料,个人感觉在系统设计上来讲,属性可以建立两个表,即“商品属性”和“属性项”字典表(如果画ER图它们的关系是1对多)。

    我们还要明确商品属性是建立在SPU上,还是SKU上,还是在分类上?在上图中我列出的关系中,分类、产品与商品都有属性,这容易误导,这里解释一下。

    1. “商品属性”与“属性项”是字典信息即基础信息,这个信息创建时不是孤立的,它是要选中后台分类的“三级分类”后才能创建的;
    2. SPU创建时也是要选择商品分类的(后台分类),所以这时就确定了SPU所有的商品属性;每个商品属性都有属性项,需要进行选择其属性项(值);
    3. SKU也可以通过商品分类来确定它拥有的商品属性,每个SKU都有对应的属性项。

    注:上面的ER图上在产品上没有增加“SPU的属性项关系”

    4. 品牌管理

    品牌是用以识别某个产品或服务,并使之与竞争对手的产品或服务区别的商业名称或标识;它在系统中也是一种基础信息与属性类似,但因为属性可以自定义灵活度比较高,所以品自牌与之区分,单独管理。

    它主要包括品牌名称、英文名称、品牌Logo以及品牌网站、品牌说明等信息;SPU在建立时确定其品牌,同时在搜索系统建立引及关键词,方便用户进行搜索。

    5. 产地管理

    产地作为一个重要的属性,单独进行管理可能更好的补充完善商品信息,在目前电子商务发展的今天,大家在购买商品时更加关注于品牌与产地(国内、国外及国内各省市);如秋季上市的大闸蟹,大家首先要判断是不是江苏阳澄湖的。

    同时产地同样也属于搜索的关键字段,在前端销售的网站、APP或小程序上可以产地频道或搜索入口。产地的主要字段如编号,中文名称,英文名称,国家编码,洲/国家,是否显示等,在创建SPU时进行设置。

    6. 商品信息

    商品的分类、属性基础信息(关键属性、销售属性)已经确定了,下面可以建立SPU与SKU了。

    前端已经介绍了SPU与SKU的相关定义及关系,下面主要说一下商品除了分类、属性、品牌与产地外的其它相关信息。

    由于SKU是根据SPU的销售属性不同而生成的,所以SKU的很多信息都是继承于SPU(除库存、价格等);

    SPU与SKU编码规则:产品SPU可以采用8位码(6位分类码+2位随机码),商品SKU可以采用SPU码+2位递增码。

    (1)下图是SPU与SKU的基本信息供参考:

    (2)如果商品是称重销售的,还应该增加称重编码字段

    编码规则:商品条码+称重编码+重量(具体的可以根据对接的电子秤进行设计)

    (3)商品归属供应商

    是否存在一品多商的情况,即一个商品可以从多家供应商进货(国条码相同,如矿泉水)。

    对于只有一个供应商供货的商品,对于采购进货、补货或先销后采的模式都非常容易,但现实的场景中一个商品肯定会存在多个供应商供货的情况,这时无论在供应链的进销存管理中,还是在财务结算中都需要确定每一笔出入库的商品归属供应商。

    在商品管理系统中需要先维护其所属的供应商(商家商品一般不会存在一品多商),如果有多个供应商需要设置主供应商。

    (4)父子商品

    父子商品与供应商中的父子账号、框架合同与子合同的关系类似,即一个父商品可以衍生出多个子商品,每个子商品中包括2个或2个以上父商品。

    举个例子:燕京啤酒每一罐是一个父商品(规格330ml,国条码60033022),但在超市中既可以按罐买,也可以按提(6个为一提)或按箱买。

    如果有人购买,你可能想,输入数量就可以了嘛,没有什么难的。没错这是一种解决方式,而且多数时我们都这样购买。

    但有另一种场景即商家为了促销(9.9元/提,单个买2.5元/罐)如何处理?仍然可以采用设置促销活动,也可以采用建立子商品方式进行。

    这个其实就是一个商品组合,生成一个新的商品编码(仓库要根据物料单进行作业)。对于父子商品我一直也是有些异议,但是从系统的全流程上考虑,它不仅涉及销售还涉及到仓库的作业,所以大家可以权衡确定是否采用这种方式。

    (5)其它辅助信息

    • 角标的设置:商品的标签信息(适用人群、养生等),用于搜索;这部分同样也可以通过属性来实现。
    • 商品质检信息:检验方式、检验严格度、检验规则、检验方案、抽检数量、抽检比例
    • 商品进出口信息:英文名称、英文规格、进口关税税率、进口消费税税率、进口增值税科率

    7. 商品图片

    图片是商品管理系统中的重要部分,在APP、网站上浏览一件商品时,我们最直接的判断商品的好坏是通过商品图片来辨识的。

    商品分为列表页(进入商城主页或频道页或通过搜索后显示的商品列表显示的多个商品)与详情页(点击某一个商品后进入到详细介绍的页面)。

    列表页中的商品图片一般显示主图,详情页中的图片分为商品主图与其它图片(也可以设置为主图)。

    1. 对于图片,需要限制大小,同时要要求上传的图片质量;
    2. 图片服务器的存储容量要进行监控,同时图片要保存在CDN上,以保证商品图片的加载速度;
    3. 商品维护完基本信息后,需要进行商品图片维护,没有图片的商品是不允许上架的;
    4. 图片状态:商品需要设置一个图片状态字段,新品时为“待上传”,如果已经上传图片后状态为“待审核”,审核的状态有“审核通过、审核不通过”。

    8. 商品资质管理

    在供应商管理部分介绍过资质管理的部分,同样对于有些商品的销售也需要提供必要的资质证书才可以进货或销售。

    1. 商品资质一般包括:商品标签、商标注册证、授权书、入境商品检验证明等;在创建商品基本信息时可以选择需要的资质模板;
    2. 根据资质模板所需要的资质由供应商或运营编辑部同事进行资质文件的上传,然后进行审核即可生效;
    3. 如果商品的资质未上传或审核不通过,则在商品由新品转为正常可销售商品时会有系统提示。

    9. 商品库存管理

    1. 在商品系统中分类、属性、品牌、商品信息、资质都创建完成后,商品即可以进行采购了,有商品库存下一步就可以进行销售了;
    2. 商品库存管理不仅在商品管理系统中,在整个供应商系统中及财务系统中都关注库存的数量与金额;
    3. 创建商品信息时,需要设置商品的安全库存,以便进行及时的商品补货;
    4. 对于商品的库存一般分为正品库存与残次品库存,正品库存又可以分为正常库存与赠品库存;
    5. 正品库存可以上架销售、残次品库存可以报损、退货返厂或内销;
    6. 库存又分为总库存和分仓库存,如果有门店则又有门店库存,所以对于商品库存的管理是非常重要的,它不仅要记录数量的变理同时要记录成本的变化;
    7. 在商品管理系统主要还是库存报表的展示,对于变化是依赖于系统中的各业务单据的,库存管理模块主要功能如下图。

    对于库存成本部分,可以看一下《FMS第十一篇:财务存货管理 关注公众号:倔强的大萝卜》。

    三、商品相关服务

    • 商品信息服务接口:用于提供查询商品基本信息的接口。
    • 商品图片服务接口:用于前端各渠道显示商品图片和图片上传的接口。
    • 商品库存查询接口:这个是商品管理系统部分非常重要的接口,它与商品销售区域模板结合提供商品是否可售,此部分要求极高,响应时间如果过长会影响到用户体验。
    • 商品库存更新接口:下单时更新库存占有,出库时减库存、减库存占有,入库时增加库存。
    • 商品缓存服务:将商品的相关信息更新到缓存服务器,以便快速响应查询及浏览。

    与商品相关的服务需要统一管理,商品库存查询服务是最关键的,要进行压力测试以达到高可用(缓存、负载、必要时服务降级等技术这些我都不懂惭愧,只能说说);

    对于库存数据的更新需要记录详细的关键日志,以便出问题能够分析并跟踪处理。

    四、商品创建过程

    前面描述了商品涉及的相关信息,新建一个商品具体需要哪些操作,下图是一个简单的过程仅供参考。

    可以根据描述的设计系统功能和一个个操作界面,商品管理部分涉及到商品部与运营、质检部共同协作。

    审批的流程也会贯穿整个过程,个人觉得在系统操作功能上尽可能提供详细的明确的信息提示-“说人话”,以便用户更容易上手操作。

    针对上图再补充一下:

    1. 新建商品/导入新品时,只是商品的基本信息,不涉及图片、资质等,所以此时还没有生成产品编码(如果有SPU)或商品编码;
    2. 如果有SPU,我们需要新建SPU与SKU,审核后在设置SPU的销售属性时,会根据销售属性进行SKU的生成,有些共用的属性是继承自SPU的,当生成了SKU后,维护SKU的价格、供应商等信息;
    3. 对于实际设计商品系统时,要综合考虑区分SPU与SKU,简单的流程达到生产效果即可,太复杂了不仅我们乱,使用都也会乱。

    总结

    本篇可能与网上关于商品管理介绍有很多重叠的,看过之后可能也会觉得又是罗列了大的框框,个人觉得每个公司的业务场景是不同的,需要根据主要模块进行详细设计,需要借助业务、产品、运营、研发等所有人的智慧,有了整体的框架与概念后,再去细化相信能够设计出一个通用的商品系统,共同努力,最后感谢大家的阅读!

    更多相关内容
  • 自己整理的淘宝商品全部类目,包含了四级类目,信息为各类目的名称,类目id,类目层级 更新于2020年11月,该文件为sql文件
  • 电商系统之商品类目及商品属性史

    千次阅读 2021-05-07 03:04:11
    商品是电商的核心,之前的文章电商系统中商品模型与类目体系设计介绍过电商系统中如何设计商品模型及商品周边领域概念,要想深入了解一个具体领域业务,最好的方式是了解它的前世今生,今天简单了解下商...

    商品是电商的核心,之前的文章电商系统中商品模型与类目体系设计介绍过电商系统中如何设计商品模型及商品周边领域概念,要想深入了解一个具体领域业务,最好的方式是了解它的前世今生,今天简单了解下商品类目的发展史。

    一个电商网站上线之初,商品种类和商品数量都很少,简单的管理功能就满足了,但是随着商品数量的越来越多,管理需求也越来越大,可以想到的简单管理能力就是分类,商品更多就变成了多级分类。

    分类经过抽象可以分为三部分:前台类目、后台类目、店铺类目。

    前台类目便于用户筛选自己的商品,或者平台根据促销活动按照某种方式组合一些商品到某些类目下,可以叫做销售类目或营销类目。

    后台类目是商家便于管理自己的商品,将商品挂载到这些类目下。

    店铺类目是便于商家对商品进行管理和归类,用户进入店铺内便于搜索和查找商品。

    相比来说前台类目更灵活,因为他可能根据平台不同的活动周期或营销需求做不同的组合,后台类目更稳定一些,主要是便于商家、运营操作。店铺类目是店长基于自己商品情况在店铺内部进行的商品再组织。前后台类目之间建立好映射关系。

    后台类目

    商家在发布商品时,先选择商品对应的后台类目,商品需要挂载在叶子类目上,然后填写商品的基本属性和销售属性信息,属性信息一般为了复用会挂载在类目上,不同类目下挂载的属性可能不一样。

    由于这些类目信息及属性信息是平台复用的,所以对于类目的日常管理,如:增删改、基础属性挂载、销售属性挂载、品牌挂载、继承关系整理等。由于后台类目是前台类目的基础,挂载在子类目上的属性后期一般不轻易修改删除,所以需要运营同学操作时考虑尽量周全。

    接下来说下类目设计。

    一般类目是树状结构,三到四层即可,太深了不便于管理,最底层的类目叫叶子类目,商家发布的商品一般挂载到叶子类目上。

    类目元信息包括:类目名称、类目父类目、类目是否禁用属性等。

    前面说了后台类目是前台类目的基础,所以建立的后台类目一般不允许删除,不然已经绑定了此类目的商品怎么办?关联了的类目属性怎么办?建立了映射的前台类目怎么办?

    实在不删不行的话,就需要发邮件,走通知,让之前绑定此类目的商品重新上架了,风险自控。

    类目归根结底是给运营和商家使用的,怎么方便怎么来,做好扩展性,尽量稳定不来回修改删除,商品是挂到子类目上的。

    前台类目

    前台类目是方便用户找到心仪的商品,或配合平台做活动增加某些商品的曝光度等目的。

    前台类目更多是对后台类目的绑定和直接复用,当然为配合营销活动,也会出现前台类目直接挂在sku的情况。

    总的来说前台类目主要服务于两个目的:

    1.  多样化的运营需求:后台类目比较死板,前台类目可以更灵活的服务于不同场景下的运营需求,将相关商品绑定到指定前台类目下。

    2. 丰富后台类目的灵活性:后台类目一般比较死板,适合标准化管理,而且很多时候供应端和需求端是不同的部门,康威定律,跨组织协调成本比较高,分离之后前后台类目自己团队单独管理,互不影响,效率更高。

    前台类目一般是对后台类目的映射,那这个映射怎么实现的呢?

    前台类目和后台类目之间可以一一映射,也可以多对一映射。

    一对一映射:前台类目直接映射一个后台类目:

    多对一映射:多个具有相同属性的后台类目通过聚合的方式映射到一个前台类目上,某种程度上是属性和类目的映射关系:

    或是将一些没有属性关联的后台类目,以场景角度聚合起来,形成一个前台类目:

    另一种映射是对于搜索关键词的映射,或者设置成搜索框的热词:

    还有就是活动落地页的类目映射,在电商平台经常做一些营销活动,放一个大的落地页或者是banner,用户点击之后跳转到某一个前台类目下,提高某些商品的流量和曝光度。

    前台类目映射可以按照商品属性、店铺ID、商品ID等维度映射。

    店铺类目

    店铺类目是商家自己创建的,以自己的需求做商品归类和规则制定,便于用户进入店铺之后精准找到想要的产品。

    前台类目和店铺类目有一定的相似性,可以按照不同业务场景将商品分门别类归纳起来,满足运营需求。先创建类目名称,绑定商品。

    类目只是树形商品管理的能力,一旦商品数量巨大,简单的靠类目进行商品管理是很难实现的。

    所以就引入了属性的概念,依靠属性可以解决商品管理分类越来越细、用户搜索个性化等需求了。商品属性抽象来说,是对商品维度信息的描述字段,体现了商品的基本信息。

    比如”面料“、”颜色“、”风格“、”领子“都是对裙子这个商品的基本信息描述,也就是属性,而对应的”蕾丝“、”青蓝“、”宴会“、”圆领“就是属性对应的属性值了。

    属性一般由属性名称和属性值组成:

    有了属性之后,用户可以通过商品属性快速了解商品基本信息。

    与类目相比,属性更灵活,它以散点方式表现商品信息,而类目是类目树的方式。品牌、季节、风格、颜色、型号都可以视为属性,每一个属性都对应多个属性值,属性也可以包含子属性,这样对于商品的管理与展现也就更灵活了。

    由于属性过于灵活,如果不对属性进行很好的管控的话,未来围绕于属性的管理将会很困难,为了更好的管理属性可以对属性进行分类。

    属性可以分为:关键属性、销售属性、非关键属性、特殊属性等。

    关键属性


    值得是那些可以唯一确定商品的属性,可以是一个属性或一群属性集合以确定一个商品或商品集合。比如手机中的品牌和型号可以视为关键属性,因为通过两个属性可以唯一确定商品集合(SPU)。总之关键属性是为了用户可以确定性的找到某个商品。

    销售属性


    通常是某个商品的规格,一个或多个销售属性可以确定一个SKU。比如关键属性(品牌)(型号)确定了SPU,而销售属性(黑色)(8G+256G)就确定了SKU。用户只有选择到了销售属性维度确定了SKU才可以知道对应的库存和价格,所以很多人用SKU以确定某个具体商品的库存。

    非关键属性


    听名字这就是一个扩展冗余的属性,有的也叫做通用属性,其实就是关键属性、销售属性之外的其他属性。一般在商品配置时带*号的是必填的一般是关键属性,不带*号的是非关键属性,不是必填的。非关键属性的目的是完善商品信息的完整性。

    特殊属性


    一般是用于特殊场景下的商品描述,比如带有腐蚀性的商品需要特殊包装,而”具有腐蚀性“这个标签就是一个特殊属性。在商品物流打包环节会进行特殊处理。

    了解了类目及属性之后,怎么将他们和商品联系起来呢?

    属性和类目关系

    之前提到了商品会挂载到子类目上(类目层级一般3-4级),由于商品数量远大于类目数量,所以我们不可能单独为每个商品绑定属性,所以一般是把属性绑定到类目上,发布商品的时候,根据分类选择对应的属性,这样将商品再挂载到子类目上的时候,这个商品就具有了这个类目树下的所有属性了。

    属性层级关系

    由于类目是由父子继承关系的,每一层类目可以挂在不同维度抽象的属性,这样在最叶子类目上就可以看到自己类目树上所有属性的继承情况了。主要目的是为了减少商家上单商品的工作量,当商家上单一个商品的时候,只需要选择商品挂载的叶子类目,系统就会自动加载出叶子类目继承树上所有的属性了。

    属性值输入类型

    由于属性非常多,有的是可枚举的,有的是难枚举的,比如季节类的是可以枚举的,商品配置时用下拉框就可以了,比如产地如果全球的话是难枚举的,输入框即可。

    属性是为了描述商品的,如果平台类目越来越庞杂,属性的数量势必也会数量巨大,为提高对于属性的控制管理,或避免重复创建属性,需要建立属性库。

    上图可以发现,设置一个属性包括:属性名称、属性值类型、是否必填等信息:

    属性值:尽可能是可枚举类型,前台可以提供商家扩展功能,或排序功能。

    值类型:商家在操作商品属性添加时候,可以进行不同类型属性值的赋值。

    是否搜索:属性如果可以用于搜索,可以让用户更直接的找到商品,基础属性(如标题、品牌、品类)等一般会参与搜索,其他属性视需求而定。

    为了对同一类的属性进行管理,可以引入属性模板(也叫属性组),同一类特征的多个属性归属于一个属性模板,在属性添加时可以选择加入的目标属性模板,有了属性模板之后就可以批量挂载属性了。

    在发布商品时,类目可以获取整个属性模板下面的所有属性,比如存储、基本参数、显示、包装清单等都是一个独立的属性模板。

    商品属性是对商品的详细描述和信息的完善,属性值填写的是否准确很大程度上决定了在搜索与匹配的流量是否精准,提高商品的转换率。

    电商场景下很多的搜索场景、个性化推送、推荐、找类似都是基于属性实现的。

    至此详细对于商品类目及商品属性这两个核心概念有了一定的认知,其实在电商系统下,如果可以很好的消化了商品领域下的系统设计,其他领域的系统设计对你来说将会更简单,因为不管是三高场景还是业务复杂度治理,商品领域都是一个非常完善且具有标准化挑战的领域方向。

    展开全文
  • 商品销售数据分析报告

    千次阅读 2021-11-16 20:52:20
    展示出各根类别商品里面销量前三类别的商品,同步对比看看各类商品里面的具体销量情况: >>从上表可以看出各根类商品销量TOP3的商品类别,用户需求较高销量较大,市场对该根类产品反响较好,属于重点主推对象,...

    数据分析报告结论:

    1.从用户整体销售的角度分析,市场销售部门应保证销量TOP3的28、50014815、50008168的商品的货源充足,对于销量方面表现不佳的38、122650008、50022520类商品应该进行具体优化处理。为提高销量,需要加强营销提高购买人数,同时不断改进商品促进人均购买量的提升,对于需求量大的商品要去结合婴儿用户的年龄对应的需求点、婴儿的性别特征以及商品本身类型的特质等因素进行考量。

    2.从商品销售趋势分析,不同类型的商品具有季节性的趋势,类型为28以及50014815的商品在第四季度销量较高第一季度较低,类型为50008168的商品在第三季度相对较高第一季度较低,由此销售部门可以根据该规律对相关类型的商品进行季节性调整,满足市场需求。建议运营部门结合当时宝妈们的关注点和市场营销情况,可将50008168类的商品作为2015年双十一的主推产品。

    3.从用户群体分析,建议运营部门对于男婴可以主推50008168类商品,女婴主推50014815类型商品,28类的爆款可以放到第二梯队进行营销。市场销售部门对于男女婴都偏好的50014815、50008168以及28类型商品保证充足的货源。

    4.从用户年龄层分布情况分析,运营部门应多倾向于对 0~1岁婴儿用户营销50014815类型的商品,对于2~3岁婴儿用户营销50008168类型的商品。推广渠道按照年龄划分,若0~1岁婴儿的需求量比较大,线下可以考虑产科医院,月子中心进行推广。线上推广可以结合母婴类APP在不同模块和功能点处进行针对性推广。同时根据以上结论定点精准推送,针对需求的多少去针对性推送广告以此来减免广告费用,提高广告效率。

    说明:本次分析主要时使用Excel进行数据分析并可视化展示。

    本文的组织结构如下:

    一、分析背景

    二、分析目的

    三、理解数据

    四、明确问题

    五、分析思路

    六、清洗数据

    七、数据分析

    八、总结和建议

    一、分析背景

    阿里母婴(Ali_Mum_Baby)产品数据是一个数据集,数据集由 Taobao.com 和 Tmall.com 提供,它包含淘宝或天猫提供的超过 900 万儿童的生日和性别等信息,共享信息以获得更好的销售建议或搜索结果。

    二、理解数据

    2.1 数据来源

    本数据集来自于阿里云天池,由 Taobao.com 和 Tmall.com 提供的母婴商品的用户行为数据。

    数据集-阿里云天池 (aliyun.com)https://tianchi.aliyun.com/dataset/dataDetail?dataId=45

    2.2 字段理解

    表一:婴儿信息

    字段含义数据类型
    user_id 用户ID数值型
    birthday 婴儿出生日期数值型
    gender 性别:"0"表示女性,"1"表示男性,"2"表示未知文本型

     >> 经查表一“婴儿信息”总共有953个数据;

     表二:购物信息

    字段含义数据类型
    user_id用户ID数值型
    auction_id商品ID数值型
    cat_id 商品类别数值型
    cat1 商品根类别数值型
    property 商品属性文本型
    buy_mount 购买数量数值型
    day 购买时间

    数值型

    >> 经查表二“购物信息”总共有29971个数据。

    三、分析目的

    数据分析的最终目标是得出结论并指导业务运营,数据分析是从业务出发且服务于业务的。当拿到业务部门提出的问题或者我们自己有什么疑问需要通过数据分析来解答时,首先将这些业务问题转换成数据问题,同时结合业务知识全面理解数据集中数据的含义,明确问题,统一指标口径,通过数据分析手段找出有效的数据指标、发现业务规律,得出理性客观的事实结论来指导业务经营。下面通过分析实际案例来完成Excel的数据分析过程。

    本文将基于电商母婴用户的行为数据进行数据分析,探索用户消费行为概况和特点,寻找高价值客户,为精准营销与精细化运营提供数据支撑,从而帮助平台和商家实现营收增长。

    四、明确问题

    1. 哪种商品的销量最好?用户对哪些商品的需求高?如何提高商品销量?

    2. 商品销量趋势是怎样的?销量趋势具有时间规律吗?

    3. 销量高的商品是否存在用户年龄及性别差异?

    五、分析思路

    采用假设分析方法,多维度分析方法,对比分析方法对商品的销量情况,商品销量趋势,用户偏好行为进行分析。

    1.商品销售维度分析,用户的潜在兴趣点需求点;

    2.时间维度分析:商品销量随时间的变化趋势;

    3.用户群体维度分析:用户的性别及年龄差异;

     

    六、数据清洗

    注意:在开始清洗数据之前,最好先备份好原始数据集,以防后面有需要查询原始数据的需求。

     清洗数据按以下流程进行:

    6.1 选择子集

    将从收集到的数据集中筛选出跟业务分析有关的列(字段),将不相关的列进行隐藏。在本数据集中不需要使用到表二“购物信息”中的商品属性字段,所以暂时将其隐藏。在这里我们需要注意的是对于不需要的字段进行隐藏即可,最好不要直接删除数据以保证数据的完整性。

    6.2 列名重命名

    为方便后续理解数据真正的业务含义,将表述不清晰的列名进行重新命名。在这里将两表中所有列的英文列名进行重命名为中文列名

    6.3 删除重复值

    重复值会干扰数据的准确性,删除重复值确保数据是唯一的;

    对表一“婴儿信息”的用户ID字段进行删除重复值操作,未发现重复值;对表二“购物信息”的所有列同时都重复的进行删除操作,仍未发现重复值,说明两表均无重复值。

    注意:用户是有可能在同一个时间点进行重复购物的,所以重复购买数据不需要进行删除。

    6.4 缺失值处理

    缺失值:缺失值影响数据的准确性

    对表一和表二的各列进行缺失值查找,有三种方法查看缺失值:

    1.直接看各列的计数值是否相同;

    2.对各列筛选操作查看各列有没有空值;

    3.采用定位条件进行空值定位;经查均未发现有缺失值,所以暂时不需要进行缺失值处理。

    6.5 一致化处理

    一致化处理:对每个数据列里没有统一格式的值进行处理,便于后续的数据分析工作;

    对表一“婴儿信息”的出生日期及表二“购物信息”的购买时间进行一致化处理,这里采用分列的方法将时间从数值型转化为日期型,以便于后续进行的与时间相关的分析工作;

    将表一“婴儿信息”的性别字段通过IF函数从数字替换成文字;

    IF函数公式:=IF(C2=0,"女",IF(C2=1,"男","未知"))

    6.6 数据排序

    将表一“婴儿信息”的出生日期进行排序,可以发现出生日期最大的是1984年,但是下一个就直接跳到2002年,随后每一年都有婴儿出生,其中出生日期最小的是2015年,所以初步判定1984年出生的用户数据应该是异常值,留给后面的具体分析时进行处理;

     将表二“购物信息”中的销售数量进行降序排序,如下图所示,可以发现在2014年11月13日购买数量最多的用户购买了10000数量商品,也是唯一的用户,可能某个商家进行大批量购买,那将是很有价值的用户;但也有可能是异常值,在业务中可与销售部门的同事进行确认该数值的准确性。

    6.7 异常值处理

    表一“婴儿信息”中在总共953个人里面有26个人性别未知,属于异常值且因性别未知的人数占比2.7%,故进行删除处理同时也不会对整体数据产生影响;

    对表二“购物信息”的每一列进行筛选操作,由于购买数量最大10000的数据干扰性比较大,所以在这里对于该数据值按异常值进行删除处理;

    将两表关联组合成新表:利用Vlookup函数通过“用户ID”字段将表一“婴儿信息”和表二“购物信息”关联并新建一个新表为表三,命名为“婴儿商品信息”表,因表一表二的数据量差别较大,所以组合表三必然产生了空值,重新对表三进行缺失值处理,将表三的“出生日期”和“性别”为空值的数据进行删除,根据“购买日期”和“出生日期”字段新添加一个新的“年龄”字段,利用DATEDIF函数或者YEAR函数直接计算,注意DATEDIF函数由于无法显示负值所以得单独对负值进行处理。按年进行计算,得出年龄,由于存在负值年龄,应该是婴儿出生前就购买了商品,所以对负值年龄进行保留。再对年龄进行降序排序操作,排序后数据如下图,发现年龄最大的唯一用户已经28岁了,可以确认是异常值,所以对该数据进行删除处理。也有显示-1和-2岁的数据,可以认为是为婴儿的出生做准备的而提前购买或者是给亲戚小孩购买的产品的数据,所以对这些数据进行保留 。

     经过以上数据清洗步骤,数据集都已经全部清洗完毕,现在三个表的数据都是比较干净的数据,为后续的数据分析工作打下基础。

    七、分析数据

    7.1商品整体销售分析

    通过以上处理,三个表均已获得比较干净的数据,那么就可以对这些处理过的数据根据业务或者需分析的问题基于三表的数据进行数据分析,这里采用Excel数据透视表及其可视化的形式进行展示,采用多维度分析方法、对比分析方法,假设检验等分析方法进行分析,并得出结论。

    哪种商品的销量最好?用户对哪些商品的需求高?如何提高商品销量?

    首先从商品的整体销量情况分析,查看不同类别商品的整体销量情况;

     >>可以看出前三商品根类别编号分别为28、50014815、50008168的商品销量都比较高,不同根类别对比比较发现,不同根类别的销量对比相当悬殊。

    将商品根类别继续展开,展示出各根类别商品里面销量前三类别的商品,同步对比看看各类商品里面的具体销量情况:

     >>从上表可以看出各根类商品销量TOP3的商品类别,用户需求较高销量较大,市场对该根类产品反响较好,属于重点主推对象,所以这些商品的货源要保证充足,在2015年可以继续保持原有的营销策略,着重把关商品品质服务质量等环节,将其打造成“畅销产品”。在销量的角度,同理,对于销量方面表现不佳的38、122650008、50022520类商品应该进行具体优化。

    结合商品销售量那么该如何提高商品的销量?

    指标拆解:销售总量=购买人数*人均购买量

     >>从不同类别商品的购买人数上看,销量TOP3类型的商品同样也是购买人数的TOP3。

    >>商品总销量第一的28类商品的人均购买量4.1件商品最大,购买人数却不是最大,50008168的人均购买量1.5,购买人数最多,销量第二,注意到38类商品的购买人数最少,人均销量却有第二,销售总量也不多。结合购买人数和人均销售量,可以知道若想提高商品销量则需要加强营销提高购买人数,同时改进商品促进人均购买量的提升。

    7.2商品销售趋势分析

    商品销量趋势是怎样的?销量趋势具有时间规律吗?

    7.2.1商品销量整体趋势分析

    将商品按时间维度进行展开分析,首先将时间按年份展开看看商品的销售变化趋势情况。

    >> 商品销量趋势在2014年前是不断增长的,2014年的销量达到顶峰,2015年的销量直线下降,那么为何2015年却下降了呢?为查找趋势直线下降的原因再将商品销量趋势按季度时间进行展开。

    >>展开后发现2015年销量下降是因为2015年仅有1-2月份的销售数据,2015年的数据不全。并且发现销售趋势有季节性地变化,从2013年和2014年的季度趋势来看,从第一季度开始销量上升然后在第四季度达到顶峰后商品销量降低。

    为何销量在第四季度达到一年中的销量顶峰呢?

    提出假设:第四季度较高是因为有双十一促销的影响,第一季度是因为春节过年时期。

    为验证假设,将商品销量趋势按月份展开,看看具体是哪个月份的商品销量最好。

    >>可以看出十一月份销量最高,春节期间一二月份的销量最低,五月份和七月份九月份偶有销量小高峰。

    由于2012年和2015年只有局部数据而2013年和2014年数据比较完整,所以对这两年1-2月份及11月份的的商品销量数据进行展开分析,验证假设是否正确。

     >>经查2013年2月10日和2014年1月31日是春节,由图表可知过年期间的销量较低,这段时间应该是商家放假,而且客户的购买需求也母婴那么大,而且按大家的过年的习惯,需要购买的商品早就在年前提前购买好,而且这还是母婴商品,更会提前备好以防不时之需。

    >>11月份的销量在双十一确实突然上涨,2014年的11月13日销量突然猛涨,在数据清洗的数据排序中就已经发现该异常值,当天是唯一的一个用户,由于数据较大,直接掩盖了11月份的其他时间的销量变化,11月份销量可视化图表的表达不够清晰,所以将该异常值暂时剔除看看其他时间的数据情况。

    >>经以上分析得出结论假设成立。 双十一期间的购买量暴涨,跟双十一促销有很大的关系,以及在 11月19日及11月29日的销量也相对较高,特别是2014年的11月份的销量变化隔几天偶有销量小高峰,说明在十一月份的营销做得较好。

    7.2.2不同类型商品销量趋势

    将不同类别的商品按年份及季度的时间趋势进行展开,查看不同商品的不同时间段的销量变化。

    >>商品销量TOP3类型的商品在每年都稳点在TOP3且每年都在稳定增长,由于2015年数据只有前两个月份的数据,所以整体在2014年达到顶峰。从季度的趋势看,不同类型的商品具有季节性的趋势,类型为28以及50014815的商品在第四季度销量较高第一季度较低,类型为50008168的商品在第三季度相对较高第一季度较低,由此销售部门可以根据该规律对相关类型的商品进行季节性调整,满足市场需求。

    7.3用户群体分析

    销量高的商品是否存在用户年龄及性别差异?

    1.用户群体的性别占比

    女婴占比53%,男婴占比47%,男女比例相对接近,女婴相对比男婴受众多,营销时可倾向于对女婴进行宣传。  

     2.用户不同性别的购买人数对比 

     女婴用户的购买量占比63%,男婴的占比例仅仅37%,女婴比男婴购买量占比达1.7倍,结合男女婴儿占比,可以看出女婴的人均购买量比男婴多,从性别角度来看,女婴用户是的高价值客户,市场运营部门可提升对于女婴用户的营销策略。

    3.不同年龄层人数分布

     4.不同年龄层的销量分布

     5.不同年龄层的用户占比情况

     >>结合不同年龄层分析的整体来看,主要的消费群体是0、1、2、3岁的婴儿,该年龄层的用户群体也是高价值客户。特别是0~1岁婴儿的数量占比已达51%,0~2岁占比达66%,所以应当重点关注刚出生不久0~1岁的婴儿用户群体。

    3.用户群体偏好分析

    由于婴儿用户数据上的年龄跨度较大,5岁的儿童原则上已经不属于婴儿了,所以这里结合婴儿的年龄层分布筛选小于0~3岁的高价值婴儿用户的数据进行用户的偏好分析,分析不同性别不同年龄层婴儿用户群体的商品偏好。

    >>从购买量上看,同销量分布一样,男女婴都偏好50014815、50008168以及28类型的商品。男婴特别偏好50008168类商品,女婴更偏好50014815类商品,根据28法则百分之八十的利润都是由百分之二十的商品创造的。建议运营部门对于男婴可以主推50008168类商品,女婴主推50014815类型商品,28类的爆款可以放到第二梯队进行营销。

    从不同年龄层的购买量上看, 0~1岁婴儿用户偏好50014815类型的商品,2~3岁婴儿用户偏好50008168类型的商品。

    >>结合以上,运营部门应多倾向于对 0~1岁婴儿用户营销50014815类型的商品,对于2~3岁婴儿用户营销50008168类型的商品,市场销售部门对于男女婴都偏好的50014815、50008168以及28类型商品保证充足的货源。

    八、总结和建议

    1.从用户整体销售的角度分析,用户对于28、50014815、50008168的类型的商品比较感兴趣,购买量较大,市场销售部门应保证销量TOP3的28、50014815、50008168的商品的货源充足,对于销量方面表现不佳的38、122650008、50022520类商品应该进行具体优化处理。为提高销量,需要加强营销提高购买人数,同时不断改进商品促进人均购买量的提升,对于需求量大的商品要去结合婴儿用户的年龄对应的需求点、婴儿的性别特征以及商品本身类型的特质等因素进行考量。

    2.从商品销售趋势分析,不同类型的商品具有季节性的趋势,类型为28以及50014815的商品在第四季度销量较高第一季度较低,类型为50008168的商品在第三季度相对较高第一季度较低,由此销售部门可以根据该规律对相关类型的商品进行季节性调整,满足市场需求。建议运营部门结合当时宝妈们的关注点和市场营销情况,可将50008168类的商品作为2015年双十一的主推产品。

    3.从用户群体分析,结合用户整体销售情况一样,男女婴都偏好50014815、50008168以及28类型的商品。男婴特别偏好50008168类商品,女婴更偏好50014815类商品。建议运营部门对于男婴可以主推50008168类商品,女婴主推50014815类型商品,28类的爆款可以放到第二梯队进行营销。市场销售部门对于男女婴都偏好的50014815、50008168以及28类型商品保证充足的货源。

    4.从用户年龄层分布情况分析,运营部门应多倾向于对 0~1岁婴儿用户营销50014815类型的商品,对于2~3岁婴儿用户营销50008168类型的商品。推广渠道按照年龄划分,若0~1岁婴儿的需求量比较大,线下可以考虑产科医院,月子中心进行推广。线上推广可以结合母婴类APP在不同模块和功能点处进行针对性推广。同时根据以上结论定点精准推送,针对需求的多少去针对性推送广告以此来减免广告费用,提高广告效率。

    展开全文
  • 互联网业务数据分析报告及用户分层模型一、商品画像体系1、什么是商品画像体系2、商品画像体系的数据来源3、商品画像体系的应用(1)曝光价格分析(2)商品review评分分布分析(3)商品排名分布趋势(4)商品标题...

    一、商品画像体系

    1、什么是商品画像体系

    商品画像可以简单理解成是海量数据的标签,根据商品不同属性的差异,将它们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名称、价格、类别等描述。
    用户画像是将用户数据标签化,即通过给用户打标签得到用户画像,帮助理解自己的用户;商品画像是对于全市场、全竞争对手的所有商品进行全面分析。二者之间的分析方法也是存在差异的,例如词频分析更多常见于商品画像分析中。

    2、商品画像体系的数据来源

    平台数据来源(以亚马逊为例)——前台抓取
    搜索前台搜索dress,前台展示的所有数据均可抓取(爬虫程序、爬虫采集器、第三方数据分析工具如helium10),能抓取的具体数据:曝光商品数量、商品曝光详细信息(商品图片、价格、评分、评分数、优惠信息等)、商品详情页数据(列表、主图、品牌、标题、详细价格、尺码、五点描述、关联商品推荐、变体数量信息、商品价格段位、商品排名信息、商品详情页和网址中的商品ASIN信息、Q&A)

    3、商品画像体系的应用

    (1)曝光价格分析

    • 数据维度说明
      在这里插入图片描述
    • 数据清洗及有效数据筛选
      删除评分数为-1的异常数据
    • 商品曝光价格分布分析
      在这里插入图片描述
      在以dress为关键词的搜索结果下,便宜的商品占比较小,→进入市场时,价格不要定在[4.99,14.79]间,价格在(14.79,24.59]的商品较多,比较合理,(24.59,34.39]区间的商品最多,价格偏高但仍然数量众多,说明商品质量够好并想冲击高客单价市场,可以尝试这个定价区间。作为市场调研方,价格尽量选择数量最靠前的两个。
    • 商品曝光价格趋势分析
      曝光价格累计平均数:按序列计算曝光价格的累计平均数
      在这里插入图片描述
      如果作为一个有效商品链接,必须要努力将商品冲到前10页,排在前面的才能提高曝光。

    (2)商品review评分分布分析

    在这里插入图片描述
    评分在[0,0.2]间的数量最多——2749件商品(刚上架无销量)几乎没有评价;
    评分在(3.8,4]、……(4.8,5]区间的评分数量不呈正态分布,(4.8,5]数量很多的一个原因可能是有的商品只有1-2个评价且为好评,另一个原因可能是评价数量少+刷评的后果。
    在这里插入图片描述
    通过优化应当维持评分在3.8往上。
    在这里插入图片描述
    评分数取决于历史销量×留评率,从宏观上来看,意味着历史销量的分布,在dress这个类目中,历史销量总体而言符合长尾分布,但也有一些差异,头部位置有数量低的,尾部位置也有数量高的,表明dress是竞争性比较强的一个类目
    在这里插入图片描述
    头部效应不明显,但不意味可以随意进入这个市场,排名前100的竞争也很激烈……
    在这里插入图片描述
    一般而言,因为新品(无销量无review)的出现整体趋势是往下降的;
    在这里插入图片描述
    前20名商品的评分累计平均数波动比较剧烈,整体评分还是比较高,而往后几十名商品突降,然后上升后再趋稳。
    解释:头部商品存在明显的营销、刷评、推广等,将短时间内将评分提高(评分数量不多的商品可以通过短时间的刷屏等手段提高评分);排在19-100的商品质量还算不错,但评分数量较多,刷评这种手段无法提高评分;中尾部可以通过控评提高评分。

    (3)商品排名分布趋势

    对“Clothing, Shoes & Jewelry”的排名进行分析,由于其排名范围过大(几~几百万),图表可读性较差,于是取对数。
    在这里插入图片描述
    大部分商品销量不高,较高的销量需要将产品再类目中排名稳定在月两万名以内(对应对数值10)

    (4)商品标题词频分析

    a.静态分析——柱状图、词云图

    将标题中不同词汇出现的频率进行搜索排序以及出现频率的关联性分析。
    搜索排序前100的商品词频分析中top20的词汇如下:
    在这里插入图片描述

    • 出现频率最高的关键词为dress,因为dress本身属于产品词+类目词+流量词,搜索关键词也是dress,出现频率高的原因是理所当然的;
    • 排第二的是women’s,一般而言买裙子的人群是女士,但少部分商品链接没有加这个词;
    • 排第三的词汇是sleeve,出现的频率是42,搜索排序前100的商品有一半左右的商品卖点包括袖子,否则不会写到标题中;
    • 排第四的词汇是party,是一个场景词,频率37次,说明很多裙子适合party穿,通常是休闲裙;
    • 排第五的是maxi长裙;排第六的是一个冷门词;排第七的是一个v领,流行设计;排第八的是long,有两种搭配(long dress,long sleeve),如果想要更精准的分析,可以将关键词组合进行分析;第九、第十的print和floral都是印花的意思;排第十一的词汇short与long同理;排第十二的elegant优雅……
      可以通过商品标题的词频分析可以找到热销款在标题编辑上的规律/特殊性,如sleeve、party、maxi,如果商品可以使用这些词则可以使用。但如何使用则需要关键词优化(买家需求+卖家竞争两个角度考虑),确定合适的关键词搭配。
      在这里插入图片描述
      宏观的词频分析,即对搜索抓取得到的19152个商品标题进行词频分析。
      在这里插入图片描述
    • 排第一的仍然是dress,但与前100商品的词频分析结果不同,dress出现的频率与商品数不同,说明有些商品没有使用dress,但不意味着其他商品链接只出现一次dress——前100的词频分析中dress占比为8.61%,而这里的比例提高到了9.53%,并且出现的频率本身下降了,说明top100的商品标题更加精简(不是简单,而是恰到好处),因为dress出现的数量更多的同时在标题里的比例并不是很高,说明top100的商品用了一些其他关键词来替代了dress这个名词,因此导致top100的词频分析中dress的出现频率高而比例低;但在宏观分析中,dress出现的频率低而比例高,原因有两个,一是存在部分商家重复使用了dress这个,二是存在商家的商品标题设置得过于简单,甚至SKU不恰当,没有详细描述好商品卖点。
    • 在宏观排序中,出现了排第五的介词with,没有实质意义,这样的词应当出现在五点描述中,但不应该出现在标题中(不符合用户的搜索习惯),说明包含大量运营经验能力不足的卖家(top100词频分析中就没有这种无意义的词语),体现了中小型卖家与头部卖家的差异。
      在这里插入图片描述
      通过柱状图对比,排序前100商品的词频分析top20间频率差距没有那么大,而宏观分析中频率差距更大,长尾效应更加明显。
      在这里插入图片描述
    • 根据搜索排序前100与前19152的商品词频分析中TOP20词汇的出现比例柱状图,milumia这个词在排序前100商品中比例较大,而在前19152商品中比例极小,说明milumia这个词很有可能是一个品牌专用词。
    • 大部分清洗下,头部卖家和新生卖家的差距很大,除了dress和women’s、long、casual几个词外,大部分头部卖家的关键词比例更高,说明其有一套自己的运营策略。
      因此,通过商品标题的词频分析,可以发现当前的关键词策略是否符合整体市场趋势。

    b.动态分析——倒序动态排列

    在这里插入图片描述
    右下角代表排序的波动,有些词随着排列的增加排序逐渐靠前,可以观察到类目市场的卖点迭代更新趋势:刚上架的商品其搜索排序肯定很低(销量评论都很低),由倒序动态排列可以发现这样的一个新品/卖点对应的某个词汇出现的频率会比较高,比如这里的long,随着搜索排序从后往前的增加其搜索频率的增长速度比较快,原因是long可以对应long dress和long sleeve,只有在冷的时候才会穿,而抓到这个词语的时候是在夏天,很多商家就会将秋冬比较畅销的商品先逐渐上架,对应动态排列图上就可以看见部分相关联的卖点词汇增长速度加快——下一个卖点,市场上已经有卖家在这么操作了。

    c.动态分析——正序动态排列

    在这里插入图片描述
    在排名前100搜索商品的排序中,long这个词语一开始并没有一个很高的排名,但随着rank数逐步增多,使用long的卖家数量逐渐增多,符合认知。
    正序排列主要看头部卖家的运营策略,动态排序主要是看市场的变化。

    二、商品画像体系

    1、产品关联度分析

    关联分析是发现交易数据库中不同商品(项)之间的联系,主要应用于电商网站推荐、线下零售门店商品摆放等场景中。
    关联规则:

    • 支持度(support):数据集中包含某几个特定项的概率。比如在1000次的商品交易中同时出现了A和B的次数是50次,那么此关联的支持度为5%。
    • 置信度(confidence):在数据集中已经出现A时,B发生的概率,置信度的计算公式是 :A与B同时出现的概率/A出现的概率。
    • 提升度(lift):就是在购买A产品这个条件下购买B产品的可能性与没有这个条件下购买B产品的可能性之比(置信度/无条件概率)。即P(B|A)/P(B)
      一般而言,提升度如果小于1,则该推荐规则不应该被使用。

    2、购物篮分析

    业界一般将单个客户一次购买商品的总和称为一个购物篮,购物篮分析就是针对商品的相关性分析。因为最初这种关联分析主要是在超市应用广泛,所以也称为“购物篮分析”。
    购物篮分析要点:

    • 找到正确的物品组合
    • 找到用户对应不同组合的购买时间
    • 找到用户对应不同组合的购买顺序
      Apriori算法(先验算法):
      在这里插入图片描述
      Apriori是先验算法,假设子集S出现了k次,那么任何包含S的其它子集只会小于或等于k次。反之如果S不满足最小的支持度,则任何包含S的子集也不会满足,这时包含S的子集就可以忽略计算了。因此,Apriori属于一种剪枝算法。
      案例:
      在这里插入图片描述

    (1)步骤一:计算不同商品的交易频次

    在这里插入图片描述

    (2)步骤二:根据最低支持度筛选商品

    一共6个订单,设置最低支持度为50%,意味着最低出现3次以上,筛选后:
    在这里插入图片描述

    (3)步骤三:计算不同组合的交易频次

    在这里插入图片描述
    在这里插入图片描述

    (4)步骤四:根据最低支持度筛选组合(最低支持度为50%)

    在这里插入图片描述

    (5)步骤五:计算不同组合的交易频次(三种商品)

    在这里插入图片描述

    (6)根据最低支持度筛选组合(最低支持度为50%)

    在这里插入图片描述

    3、购物篮分析的应用

    在这里插入图片描述
    选中商品列,插入数据透视表,可以得到所有商品的交易数量。
    销量排行前20的商品销售情况:
    在这里插入图片描述
    将各商品的交易数量除以所有商品的交易数量之和,可以得到各商品的数量及销量占比:
    在这里插入图片描述
    这就得到了单一维度商品的支持度,设置最低支持度……
    python处理过程:
    输入商品零售数据→Apriori算法处理→是否满足条件:支持度≥最小支持度(2%),置信度≥最小置信度(35%)→输出关联规则→程序运行结束

    from numpy import *
     
    def loadDataSet():
        return [['a', 'c', 'e'], ['b', 'd'], ['b', 'c'], ['a', 'b', 'c', 'd'], ['a', 'b'], ['b', 'c'], ['a', 'b'], ['a', 'b', 'c', 'e'], ['a', 'b', 'c'], ['a', 'c', 'e']]
     
    def createC1(dataSet):
        C1 = []
        for transaction in dataSet:
            for item in transaction:
                if not [item] in C1:
                    C1.append([item])
        C1.sort()
        # 映射为frozenset唯一性的,可使用其构造字典
        return list(map(frozenset, C1))     
        
    # 从候选K项集到频繁K项集(支持度计算)
    def scanD(D, Ck, minSupport):
        ssCnt = {}
        for tid in D:   # 遍历数据集
            for can in Ck:  # 遍历候选项
                if can.issubset(tid):  # 判断候选项中是否含数据集的各项
                    if not can in ssCnt:
                        ssCnt[can] = 1  # 不含设为1
                    else:
                        ssCnt[can] += 1  # 有则计数加1
        numItems = float(len(D))  # 数据集大小
        retList = []  # L1初始化
        supportData = {}  # 记录候选项中各个数据的支持度
        for key in ssCnt:
            support = ssCnt[key] / numItems  # 计算支持度
            if support >= minSupport:
                retList.insert(0, key)  # 满足条件加入L1中
                supportData[key] = support  
        return retList, supportData
     
    def calSupport(D, Ck, min_support):
        dict_sup = {}
        for i in D:
            for j in Ck:
                if j.issubset(i):
                    if not j in dict_sup:
                        dict_sup[j] = 1
                    else:
                        dict_sup[j] += 1
        sumCount = float(len(D))
        supportData = {}
        relist = []
        for i in dict_sup:
            temp_sup = dict_sup[i] / sumCount
            if temp_sup >= min_support:
                relist.append(i)
    # 此处可设置返回全部的支持度数据(或者频繁项集的支持度数据)
                supportData[i] = temp_sup
        return relist, supportData
     
    # 改进剪枝算法
    def aprioriGen(Lk, k):
        retList = []
        lenLk = len(Lk)
        for i in range(lenLk):
            for j in range(i + 1, lenLk):  # 两两组合遍历
                L1 = list(Lk[i])[:k - 2]
                L2 = list(Lk[j])[:k - 2]
                L1.sort()
                L2.sort()
                if L1 == L2:  # 前k-1项相等,则可相乘,这样可防止重复项出现
                    # 进行剪枝(a1为k项集中的一个元素,b为它的所有k-1项子集)
                    a = Lk[i] | Lk[j]  # a为frozenset()集合
                    a1 = list(a)
                    b = []
                    # 遍历取出每一个元素,转换为set,依次从a1中剔除该元素,并加入到b中
                    for q in range(len(a1)):
                        t = [a1[q]]
                        tt = frozenset(set(a1) - set(t))
                        b.append(tt)
                    t = 0
                    for w in b:
                        # 当b(即所有k-1项子集)都是Lk(频繁的)的子集,则保留,否则删除。
                        if w in Lk:
                            t += 1
                    if t == len(b):
                        retList.append(b[0] | b[1])
        return retList
    
    def apriori(dataSet, minSupport=0.2):
    # 前3条语句是对计算查找单个元素中的频繁项集
        C1 = createC1(dataSet)
        D = list(map(set, dataSet))  # 使用list()转换为列表
        L1, supportData = calSupport(D, C1, minSupport)
        L = [L1]  # 加列表框,使得1项集为一个单独元素
        k = 2
        while (len(L[k - 2]) > 0):  # 是否还有候选集
            Ck = aprioriGen(L[k - 2], k)
            Lk, supK = scanD(D, Ck, minSupport)  # scan DB to get Lk
            supportData.update(supK)  # 把supk的键值对添加到supportData里
            L.append(Lk)  # L最后一个值为空集
            k += 1
        del L[-1]  # 删除最后一个空集
        return L, supportData  # L为频繁项集,为一个列表,1,2,3项集分别为一个元素
    
    # 生成集合的所有子集
    def getSubset(fromList, toList):
        for i in range(len(fromList)):
            t = [fromList[i]]
            tt = frozenset(set(fromList) - set(t))
            if not tt in toList:
                toList.append(tt)
                tt = list(tt)
                if len(tt) > 1:
                    getSubset(tt, toList)
     
    def calcConf(freqSet, H, supportData, ruleList, minConf=0.7):
        for conseq in H:  #遍历H中的所有项集并计算它们的可信度值
            conf = supportData[freqSet] / supportData[freqSet - conseq]  # 可信度计算,结合支持度数据
            # 提升度lift计算lift = p(a & b) / p(a)*p(b)
            lift = supportData[freqSet] / (supportData[conseq] * supportData[freqSet - conseq])
     
            if conf >= minConf and lift > 1:
                print(freqSet - conseq, '-->', conseq, '支持度', round(supportData[freqSet], 6), '置信度:', round(conf, 6),
                      'lift值为:', round(lift, 6))
                ruleList.append((freqSet - conseq, conseq, conf))
     
    # 生成规则
    def gen_rule(L, supportData, minConf = 0.7):
        bigRuleList = []
        for i in range(1, len(L)):  # 从二项集开始计算
            for freqSet in L[i]:  # freqSet为所有的k项集
                # 求该三项集的所有非空子集,1项集,2项集,直到k-1项集,用H1表示,为list类型,里面为frozenset类型,
                H1 = list(freqSet)
                all_subset = []
                getSubset(H1, all_subset)  # 生成所有的子集
                calcConf(freqSet, all_subset, supportData, bigRuleList, minConf)
        return bigRuleList
     
    if __name__ == '__main__':
        dataSet = data_translation
        L, supportData = apriori(dataSet, minSupport = 0.02)
        rule = gen_rule(L, supportData, minConf = 0.35)
    

    部分结果汇总表格:
    在这里插入图片描述
    购买一种商品的顾客占全部顾客的比率,反映的是全品类的关联能力。行业参考值为40%,该值越小越好,越小说明关联能力越强。
    应用:亚马逊电商平台的相关商品推荐、B站/淘宝/京东电商平台的相关商品推荐

    4、产品定位分析

    在这里插入图片描述
    一般而言通过四象限分析法来完成产品定位。
    明星产品意味着拥有较高的相对市场占有率和较高的销售增长率,所以如果A产品是明星产品,B产品与A关联性很高,则B很可能也是明星产品。
    金牛类产品相对市场占有率高,销售增长率较低,一般属于成熟期或者衰退期,需要减缓衰退过程或者延长成熟期的时间。
    瘦狗类产品销售增长率高但相对市场占有率低,一般需要提高利润率,但需要很长的时间来提高市场占有率,需要进行替代品分析,找到竞品,让瘦狗类产品能替代竞品。

    课后思考:如果对review文本进行词频分析,那么动态词频分析与静态词频分析的结果意味着什么意思呢?

    对review文本可以从两种顺序进行词频分析,第一种是按照review时间排序进行词频分析,第二种是按照review受欢迎程度进行词频分析。
    在这里插入图片描述
    正序:随着不同词序列的上升,意味着某些词被使用的频率越来越高,很可能是最新产生的review比较喜欢用的词汇。
    在这里插入图片描述
    倒序:展现了哪些词汇能引起消费者的共鸣,属于趋势性词汇,如果与正序前列中的词汇重合,则可以运用。
    在这里插入图片描述
    静态词云图适合展现整体词频分析。

    展开全文
  • 数据挖掘实战—商品零售购物篮分析

    千次阅读 多人点赞 2021-04-06 21:09:01
    本文使用Apriori关联规则算法实现购物篮分析,发现超市不同商品之间的关联关系,并根据商品之间的关联规则制定销售策略。定义数据挖掘目标如下: 构建零售商品的Apriori关联规则模型,分析商品之间的关
  • 本文来自李平老师的分享,主要介绍一个普遍对商品模型的认知。这个认知已经很久没有更新了,十几年前的吧。所以这里在告诉大家历史是什么样,更要去思考哪里有错误、哪里要改进。 SPU、SKU概念 首先我们需要...
  • 什么是发布非约定商品?一般未经过天猫允许的品牌... 二、哪些形式属于发布非约定商品范围?  举例说明:以下图片都是容易导致被处罚扣分的,请商家自检自查;有授权的除外  1)发布耐克,阿迪达斯,NY,supreme,.
  • 干货 | 6大商品数据分析模型分享!

    千次阅读 2020-10-14 08:57:00
    Kervin_Chan| 作者掘金|来源https://juejin.im/post/6844903967416123399本节将介绍几个常用的商品分析模型,包括商品价格敏感度模型...
  • Python进行零售商品数据分析

    千次阅读 2021-04-26 19:42:27
    主要分析内容有:商品价格分析,商品销售量、销售额情况分析,商品关 联分析 4、店铺维度进行分析。主要分析内容有:店铺销售量、销售额法分析,店铺促销情况分析,店铺 销售时间分析,周均消费次数分析,客单价分析...
  • 电商后台:商品管理系统

    千次阅读 2019-10-09 17:51:00
    关于商品管理系统的总结介绍在网能够搜索出好多,这里也结合了接触过的系统,借鉴了一些资料,根据个人的理解整理出来,希望能够按计划形成一个完整的供应链系列文章,目的是通过...
  • 美团商品知识图谱的构建及应用

    千次阅读 2021-09-03 00:26:41
    总第469篇2021年 第039篇商品知识图谱作为新零售行业数字化的基石,提供了围绕商品的精准结构化理解,对业务应用起到了至关重要的作用。相比于美团大脑中原有的围绕商户的图谱而言,商品图谱...
  • 商品列表页在哪? 当我们进行首页的时候,点击三级分类的 第三级分类,就会进入该商品的 列表页。对应所有商品。 我们数据库中只有手机的数据,所以默认点击手机 下面就是对列表页的业务进行分析与实现: 面包屑...
  • 商品表结构分析

    千次阅读 2019-05-26 10:07:52
    SKU:Stock Keeping Unit(库存量单位),SPU商品集因具体特性不同而细分的每个商品 所有sku共享的规格属性(称为全局属性) 每个sku不同的规格属性(称为特有属性) 表结构分析     ...
  • 商品中心 --- 基本概念

    千次阅读 2019-07-24 23:18:31
      SPU指的是商品,SPU属性就是不会影响到库存和价格的属性, 又叫关键属性,与商品是一对一的关系;SKU指的是具体规格单品,SKU属性就是会影响到库存和价格的属性, 又叫销售属性,与商品是多对一的关系。   以...
  • 本文对中国商品期货投资进行了迄今为止最全面的研究。首次记录了中国独特的政策对于期货市场的影响。从已有文献中我们总结出 12 种不同的系统性风险溢价因子。我们发现,无论是在强流动性品种的市场还是随机选取的...
  • 商品属性设计

    千次阅读 2014-09-24 17:12:27
    这几天一直做商品的添加 的部分,到商品属性
  • 商品分类-vue

    千次阅读 2020-02-13 21:37:39
    商品分类-vue
  • 有多少张表?他们都是什么? 来一张图片,清晰的展示这些表之间的关系 从业务逻辑上分析表的作用 (一)tb_goods_category...这里我们知道,商品的 评论量,销量,信息,都是在 spu当中实现的,这很符合我们在京
  • 围绕商品设计表 之前也写过类似的数据库设计方案,这一篇是为大家详细讲解参考京东商城围绕商品怎么来设计数据库,需要关注的细节很多,对字段进行详解,结合功能实现分析每一个字段设计的意义 大家看完这篇文章后...
  • 电商网站,商品规格的设计思路

    千次阅读 多人点赞 2019-09-24 15:53:36
    1.商品规格数据结构 如图,这是一个商品详情页,它包括商品名称、价格、描述、规格等等数据信息。我们应该如何把这些数据存储到数据库,如何设计数据模型,是一个很关键的问题。如果设计的不好,会大大增加开发、...
  • 长尾商品定义与处理方法

    千次阅读 2020-04-20 19:13:21
    长尾商品:需求非常不频繁,需求变动也很大的产品 对于过去12个月有需求的备件,可以分为三大类  需求频繁,而且稳定(短尾):4%的备件属于此类  需求频繁,但很不稳定(中尾):20%左右的备件属于此类  需求...
  • 购物篮数据两种商品间的关联分析

    千次阅读 热门讨论 2019-07-14 10:03:50
    先讲一个故事,来自于百度...沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品哪些。沃尔玛数据仓库里集...
  • 电商平台搭建--商品管理功能模块开发(一)

    万次阅读 多人点赞 2018-02-13 11:10:59
    Hi,大家好,我们又见面了。相信通过前面几篇博文的学习,大家...一、商品管理功能模块-概要 先来看商品模块都需要实现哪些功能点 电商平台的商品管理模块,一般都分为前台和后台,所以在后端要写前台的商品管理...
  • 一个广为流传的挖掘商品之间的关联性的故事就是“啤酒与尿布”这个故事。相传某超市通过分析顾客的账单,发现啤酒总是和尿布一起购买。通过分析,发现这是因为美国人喜欢喝啤酒,当买尿布的时候看到啤酒就顺便买了。...
  • 商品属性表设计

    万次阅读 2017-04-01 20:01:42
    comments ... 这几个月都在做一个通过淘宝API线下管理淘宝店的系统,学习了很多东西,这里想对淘宝商品表设计用自己的想法表现出来,如果你觉得很扯淡,可以写下自己的看法.OK,切入正题.  淘宝的商
  • 一、首先,静态页面不需要自己写。找各种素材图片,需要自己做也行,但一定不如前台开发者做的精美。 个人更喜欢 用比较流行...这里商品product表,和商品分类category表 关系:product依赖category,表里有外建:pid。
  • 实现商品分类和品牌管理功能

    千次阅读 2020-02-23 15:27:23
    文章目录一、实现商品分类管理1.1 导入数据1.2 实体类1.3 controller1.4 service1.5 mapper1.6.启动并测试二、跨域问题2.1 cors解决跨域2.1.1 简单请求2.1.2 特殊请求2.2 cors跨域的实现过程三、实现商品品牌管理3.1...
  • Kmeans算法是数据分析中常用或者说常见的算法,属于聚类算法之一,用于对不知道明确划分界限的数据分类。电商中通常用在客户分析,构建RFM模型。 二、使用步骤 1.引入库 代码如下(示例): import numpy as np ...
  • 基于Spark实时计算商品关注度

    千次阅读 2017-05-02 14:53:02
    基于Spark实时计算商品关注度 一、实验介绍 1.1 内容简介 ...处于网络时代的我们,随着 O2O 的营销模式的流行,越来越多的人开始做起了电商。...通过这些数据我们就能分析出这段时间内哪些商品最受普遍

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 35,217
精华内容 14,086
关键字:

哪些属于商品