精华内容
下载资源
问答
  • 关联分析在库存管理中的应用
    2019-04-21 20:36:01

    Apriori算法

            Apriori算法是一种基于关联规则(Association rule)的原理的代表性算法。该算法源自于“啤酒喝尿不湿”的故事,Apriori算法应用广泛,可用于购物篮分析、消费市场价格分析,猜测顾客的消费习惯…… 

            如下表1,我们通常称其为购物篮交易(market basket transaction)。表中每一行对应一个交易,包含一个唯一标识ID和特定顾客购买的商品集合。零售商对分析这些数据很感兴趣,以便了解其顾客的购买行为。可以使用这种有价值的信息来支持各种商业中的实际应用,如市场促销,库存管理和顾客关系管理等等。 
     

    表1
    流水记录(ID)购物详细清单 
    1辣条,面包,牙膏,果冻,毛巾 
    2面包,雨伞,辣条 
    3牛奶,面包,可乐 
    4果粒橙,洗面奶,毛巾 
    5雨伞,辣条,牛奶 
    6面包,雨伞,果粒橙,可乐  
    7洗面奶,毛巾,牛奶 


           那针对上述数据,作为超市的老板,目前库内积压了很多毛巾,能否基于上述分析,给出一种策略,提升毛巾的交易量,进一步减少库存,实现利益的最大化呢? 

                        
     

           在上述的问题中,我们首先需要引入“关联规则”这个概念。何为关联规则? 
           关联规则:即事物(事件)和事物(事件)之间的关联性。如放到购物篮分析场景中,关联规格表现的就是购物篮里面的商品与商品之间的关联性。通俗解释即:购物篮中的商品能够体现用户的消费习惯,通过研究购物篮中商品与商品之间的关联规则,可以反向推导用户的消费标签,最后利用这些标签方便后续运营方的有效运营(比如知道了这个地区的人比较抠,那么就可以通过适当发放更多的礼物券或者其他来增加用户粘性等……)。 
            关联规则数学的表达:关联规则是形如 X→Y 的蕴涵表达式,其中X和Y是不相交的项集,即 X∩Y=∅。 
            说白了,就是通过关联规则找出哪些是商品放在一起会卖的更好?若是这样认为,会引出下一个问题,既然关联规则能体现哪些东西放在卖的更好,那么卖的好的是不是也分为:卖的第一好,卖的第二好……. 


           言外之意就是关联规则需要通过强度来排名,对“好”这个词进行量化操作。 
           那么关联规则的强度,我们是通过支持度(Support)和置信度(Confidence)来衡量的。 
           支持度(Support):支持度是指商品的受欢迎程度(也可以理解为衡量某淘、某东、某猫最热的那些商品的标准),可以通过查找包含特定项目的交易数量除以交易总数来计算。 
           支持度(面包)=(包含(面包)的交易)/(总交易)=4/7=0.5714 
           支持度(雨伞)=(包含(雨伞)的交易)/(总交易)=3/7=0.4285 
           支持度(面包,雨伞)=(包含(面包,雨伞)的交易)/(总交易)=???? 
           支持度(面包,雨伞,辣条)=(包含(面包,雨伞,辣条)的交易)/(总交易)=??? 


           置信度(Confidence,也可以叫信心度):如果购买物品A,也会购买物品B的概率(或者叫可能性). 可以通过查找A和B一起购买的交易数量除以购买A的交易总数来计算。在数学上,它可以表示为: 
           置信度(A→B)=(包含(A和B)的交易)/(包含A的交易)。 
           置信度(面包→雨伞)=(包含(面包,雨伞)的交易)/(包含(面包)的交易)=2/4=50% 


          另外再补充一个:提升度 
          提升度是指A出售时B的销售比率的增加(比如当前销售一件A,那么接下来B商品会因为A卖掉的缘故,下一次被厂家卖掉(B)的概率的增加)。 
    提升度(A → B)可以通过将置信度(A → B)除以支持度(B)来计算。提升度(A → B)=P(B A)/P(B)。 
          说白了,就是在买A的基础上还买了B的交易记录  除以  独立买B的交易记录。也就是说A的卖不卖是否可以影响B的销售。 
           若提升度(A → B)<=1。说明A卖不卖和B销售一点关系都没有(也可以叫两个商品独立)。 
           若提升度(A → B)>1,则说明A卖不卖和B是有关系的,通常我们认为若提升度(A → B)>=3的时候,A → B是强关联规则 提升度(面包→雨伞)=(置信度(面包→雨伞))/(支持度(雨伞))=???? 
    引入关联规则强弱的判别指标之后, k-项集概念。 
            以表 1 为例:

                 K-项集:一个包含 k 个数据项的项集

               (面包,雨伞,辣条)是一个 3-项集

               (面包,雨伞)是一个 2-项集

    关联规则挖掘算法可以分为两步:

    一、 产生频繁项集:发现满足最小支持度阈值的所有项 集,即频繁项集

    二、 上步骤一中发现的频繁项集中提取大于置信度阈值 的规则,即所谓的强规则

    算法过程

    1、找出频繁项集

    流水记录(ID)购物详细清单
    1辣条,面包,牙膏,果冻,毛巾
    2面包,雨伞,辣条
    3牛奶,面包,可乐
    4果粒橙,洗面奶,毛巾
    5雨伞,辣条,牛奶
    6面包,雨伞,果粒橙,可乐
    7洗面奶,毛巾,牛

    以下示例:假设最小支持度>2

    1-项集支持度计算

    1-项集支持度计数
    辣条3
    面包4
    牙膏1
    果冻1
    雨伞3
    牛奶3
    可乐2
    洗面奶2
    毛巾3
    果粒橙1

    比较候选支持度计数与最小值支持度(2),筛选出 1-频 繁项集。

    1-项集支持度计数
    辣条3
    面包4
    雨伞3
    牛奶3
    可乐2
    洗面奶2
    毛巾3

    由 1-项集产生候选的 2-项集

    1-项集支持度计数
    {辣条,面包}2
    {辣条,雨伞}2
    {辣条,牛奶}1
    {辣条,可乐}0
    {辣条,洗面奶}0
    {辣条,毛巾}1
    {面包,雨伞}2
    {面包,牛奶}1
    {面包,可乐}2
    {面包,洗面奶}0
    {面包,毛巾}1
    {雨伞,牛奶}1
    ….(未完待续)….(未完待续)

    比较候选支持度计数与最小值支持度(2),筛选出 2 频 繁项集。

    未完待续…...

    更多相关内容
  • 实际的业务开展库存管理常常会面临许多难题: 动不动就“多备些库存”,可见,当前库存管理面临的现状就是:库存成本劣势明显、库存周转差距较大。如果对此没有合理有效的解决方案,往往会导致企业库存...

    之前介绍过采购流程监控方案、生产质量全流程追溯方案,这次带来本系列的第三弹——库存管理分析方案。

    1、为什么要做库存管理?

    对于很多企业,库存很重要,但又往往容易成为各类业务问题的“接锅侠”:整个供应链的流转其实就是库存之间的不断转移变化,每个环节都有库存的身影。同时,企业内部所有业务也都和库存息息相关。

    但在实际的业务开展中,库存管理常常会面临许多难题:

    在这里插入图片描述

    动不动就“多备些库存”,可见,当前库存管理面临的现状就是:库存成本劣势明显、库存周转差距较大。如果对此没有合理有效的解决方案,往往会导致企业库存越来越混乱,经营、资金、成本问题丛生。

    为什么会造成这种现状?资深行业专家总结了以下3点原因:

    库存量大:库存量、金额超出企业正常经营状态,管理风险增加;
    结构复杂:库存结构杂乱无章,使用过程中无法做到不断料、不呆料、不囤料;
    管理混乱:库存问题不清晰,管理优化无从下手;
    从问题出发,帆软提出了这套库存管理分析方案。

    2、库存管理方案如何制定?

    本库存管理方案从“盘”、“析”、“管”三个方向出发,对导致库存管理问题的原因逐一击破。

    **盘:**通过库存盘点,整体把握企业库存情况,了解库存当前整体水平
    **析:**利用ABC结构分析,洞察库存和经营之间的关联关系,做到库存精细化管理
    **管:**针对库存管理过程中的典型问题,提出针对性的管理改善措施,责任到人,及时预警
    在这里插入图片描述

    方案思路弄清楚了,那么如何依托FineReport将此库存管理方案真正落地呢?(注:滑到到文末可体验、下载此套方案!)

    3、库存方案轻松落地

    1、库存盘点差异分析

    在库存盘点中,往往会遇到库存盘点数据比财务账面数据少的情况,那么实际库存金额少在哪里了呢?此时便需要通过盘点结果数据、仓储系统数据以及财务账面数据三者做对比,分析库存盘点盈亏情况,追溯异常原因。

    在库存盘点盈亏明细表中,我们可以通过盘查库存出入库记录和财务系统账面数据,如:订单出库了但是流程没走完,从而定位到库存数据与财务数据存在差异的原因。

    在这里插入图片描述

    2、变动分析

    通过存货变动看板,财务分析人员和管理会计人员可以根据指标的趋势、对比差异等进行分析。如:

    分析存货增长率及收入增长率:若收入增长率高于存货增长率则说明企业为支撑收入而加大了存货行为。
    分析存货及收入的变动趋势:若收入趋于快速增长则说明之前推理的问题属于正常增长存货行为。
    分析存货周转天数:明确企业自身的周期性行为,比如年初的囤货行为、年末向经销商的囤货行为以及营销的淡、旺季。
    在这里插入图片描述

    3、ABC分析

    针对企业原材料管理混乱、不知道哪些物料该重点管理的问题,可以结合二八原则分析给库存物料做分类分析:有价值的A类物料—重点管控,普通价值的B类物料—适当放松,低价值的C类产品—保证供给。

    通过库存结构分析看板,财务、运营以及库管人员,均可以根据物料的库存数量,占用资金的多少做ABC结构分析。

    在这里插入图片描述

    4、呆滞管理

    1)入库审核
    通过呆滞库存录入表,库管及采购人员可以从库存来源端针对呆滞库存严加管理。

    库管人员可及时将呆滞库存进行数据录入,而采购人员在采购计划执行之前首先核对是否为呆滞库存,是的话驳回采购;近似的物料则检查是否能够和呆滞物料替换,可以的话优先使用呆滞品替代,延缓采购。

    在这里插入图片描述

    2)呆滞库存明细及排名透明
    通过呆滞库存明细表将信息实时透明给库管、生产、采购等责任部门,传导给对应责任人关注,督促制定相关消除措施并执行。

    呆滞品整体情况分析表则将呆滞物料信息按照库存金额占用情况进行排名展示,优先清除这类占比较大影响较大的物料。

    在这里插入图片描述

    5、周转管理

    在库存周转率看板中,高层管理者以及运营人员除了从各个维度分析库存周转外,还会重点关注库存周转的散点图。

    通过中位数将库存物料分布分为A、B、C、D、区域,根据物料的库存周转率和库存金额,制订物料“是否需要加大投入”、“是否需要根据投资收益风险及时调整”等应对策略。

    在这里插入图片描述

    6、预警管理

    1)库存天数预警
    通过库存天数预警看板,高层管理者、库管及采购人员可以及时获取到库存按照不同的周转天数规则出现不足、正常、积压、严重积压状态的预警信息。

    同时看板中的库存可消耗天数预警,可以将关键原材料的状态推送给决策者,由高层领导亲自监督实时可消耗天数变化。

    在这里插入图片描述

    2)库存状态预警
    在库存状态预警分析看板中,高层管理者、库管及采购人员可以根据库存多种状态预警,及时决策:

    滞销品预警:保证库存不积压,避免物料呆滞
    缺货预警:保证产品不脱销,避免市场客户流失
    同时可根据超期天数分布占比分析,掌握产品市场表现状态,如果出现超期异常,有往呆滞发展的趋势时,及时做出促销等动作,防止呆滞。

    在这里插入图片描述

    3)库龄分级预警
    在库龄分析看板中,按照库存库龄分布的规则,参考不同物料和产品制定不同的库龄区间,并将库存时间长,物料占比较大的异常库存,在看板页面突出显示。高层管理者可根据看板指标,监控企业整体库存状态,保证库存总体稳定,动态平衡。

    在这里插入图片描述

    以上即为库存管理分析方案的全部内容,目前已有多家客户参考本次方案内容,并通过FineReport搭建库存业务管理系统。三步走推进企业全面库存管理!

    在线试用路径: 目录>场景应用>库存应用 账号:demo 密码:123456
    回复“库存管理”获取上述模板和免费工具~

    展开全文
  • 便于管理者和读者能够清楚地了解单位图书库存的情况。所设计应用系统的任务及目标。对图书的出库入库的情况进行记录。设计开发及运行的软硬件环境。操作系统为 Windows XP。数据库管理系统为 Wamp Server 2。程序...

    资源下载地址:https://download.csdn.net/download/sheziqiong/85697449

    一、引言

    对所设计的应用系统进行概要性的综述

    管理者注册、登录后对图书的出库入库记录进行添加、删除、修改和查看,同时使得用户(读者)注册、登录后能够查看图书的一些信息。

    设计开发的意义。

    便于管理者和读者能够清楚地了解单位图书库存的情况。

    所设计应用系统的任务及目标。

    对图书的出库入库的情况进行记录。

    设计开发及运行的软硬件环境。

    操作系统为 Windows XP。

    数据库管理系统为 Wamp Server 2。

    程序设计语言为 PHP + MySQL。

    二、系统分析与设计

    系统需求分析(对系统的目标任务进行简单描述并给出数据流图和数据字典)

    有待完成功能的主要有:

    管理人员基本信息的增删改查,包括人员编号、人员名称、人员密码。

    读者基本信息的增删改查,包括读者编号、读者名称、读者密码。

    图书基本信息的增删改查,包括图书编号、名称、数量、单价。

    入库图书基本信息的增删改查,包括图书编号、名称、数量、单价。

    库存图书基本信息的增删改查,包括图书编号、名称、数量、单价。

    出库图书基本信息的增删改查,包括图书编号、名称、数量、单价。

    数据流图:

    数据流图是用来表示系统的逻辑模型,可以用图形的方式描绘数据在系统中流动和处理。

    查询信息 图书信息

    图书信息

    图 1.2.1 顶层数据流图

    数据字典:

    数据字典可以用来对数据流图中的各部分进行定义,为系统的分析,设计及以后的实现提供有关元素一致性定义和详细的描述。

    名字:图书编号;别名:;描述:唯一地标识每一本图书的关键域;定义:图书序列号=1{int}4名字:图书名称;别名:;描述:标识每一本图书的实际名字;定义:图书名称=1{varchar}20
    名字:图书数量;别名:;描述:某一种图书的数量;定义:图书名称=1{int}4名字:图书单价;别名:;描述:某一种图书的单价;定义:图书名称=1{float}4
    名字:人员编号;别名:;描述:唯一地标识每一个工作人员;定义:人员编号={int}4名字:人员名称;别名:;描述:标识每一个工作人员的实际名字;定义:人员名称={varchar}20
    名字:人员密码;别名:;描述:工作人员登录时用的口令;定义:人员密码={varchar}20
    名字:读者编号;别名:;描述:唯一地标识每一个读者;定义:人员编号={int}4名字:人员名称;别名:;描述:标识每一个读者的实际名字;定义:人员名称={varchar}20
    名字:读者密码;别名:;描述:读者登录时用的口令;定义:人员密码={varchar}20

    数据库概念结构设计(给出 E-R 图)

    E-R 图可以根据需要实现的功能设计,描述系统中的实体,并建立实体之间的关系,从而实现逻辑结构功能。

    图书库存管理系统可以划分的实体有:图书信息实体、管理人员信息实体、用户信息实体、以及出入库图书信息实体。

    图书库存管理系统-总信息 E-R 图

    图书库存管理系统-图书信息 E-R 图

    图书库存管理系统-管理人员信息 E-R 图

    图书库存管理系统-用户信息 E-R 图

    2.2.5 图书库存管理系统-入库图书信息 E-R 图

    在这里插入图片描述

    图书库存管理系统-出库图书信息 E-R 图

    数据库逻辑结构设计

    (给出关系模式并用表格描述关系模式的属性名、类型、完整性约束等)

    根据以上 E-R 图,可以转换成如下逻辑结构:

    管理人员表(人员编号,人员名称,人员密码)

    用户表(用户编号,用户名称,用户密码)

    图书库存表(图书编号,图书名称,图书数量,图书单价)

    图书入库表(图书编号,图书名称,图书数量,图书单价)

    图书出库表(图书编号,图书名称,图书数量,图书单价)

    管理人员表:

    字段名数据类型字段长度是否为空
    人员编号Int4
    人员名称Varchar(20)20
    人员密码Varchar(20)20

    用户表:

    字段名数据类型字段长度是否为空
    用户编号Int4
    用户名称Varchar(20)20
    用户密码Varchar(20)20

    图书库存表:

    字段名数据类型字段长度是否为空
    图书编号int4
    图书名称Varchar(20)20
    图书数量int4
    图书单价float4

    图书入库表:

    字段名数据类型字段长度是否为空
    图书编号int4
    图书名称Varchar(20)20
    图书数量int4
    图书单价float4

    图书出库表:

    字段名数据类型字段长度是否为空
    图书编号Int4
    书名Varchar(20)20
    图书数量Int4
    图书单价float4
    • 数据库物理结构设计(任选,可给出要创建的索引)
    • 数据库的物理设计是指对数据库的逻辑结构在指定的数据库管理系统(DBMS)上建立起适合应用环境的物理结构。
    • 通过上面的逻辑结构分析所得到表的关系,用 PHP 创建数据库和相应的表。

    数据库创建(创建表的界面、创建外码的界面)

    创建数据库 bookstock_database, 并建立相应的表:

    初始化后的表的结构:

    系统总体结构设计(给出系统总体结构图)

    系统层次框图:

    系统主要功能:

    对图书入库的管理(更新、添加、修改和删除)

    对图书出库的管理(更新、添加、修改和删除)

    对图书进行入库统计

    对图书进行出库统计

    对图书入库结存报表的查询

    对图书出库结存报表的查询

    对用户权限的维护

    三、系统开发及实现

    论述设计开发采用的技术及设计效果(逐模块或主要模块)

    系统主控界面:系统的主控界面既系统主窗体,它用于控制其他功能模块的运行。

    在管理员登录后,进入需要处理的事务页面:

    在读者登录后,进入需要处理的事务页面:

    在这里插入图片描述

    在这里插入图片描述

    当 管理员或读者 注册后,可以进行登录:

    当 管理员 或读者 注销后,也可以重新登录:

    图书入库管理:由于图书入库是一个多次完成的过程,因此,需要用一个图书入库表与图书库存表进行关联。

    库存表的记录:

    入库表中的记录:

    入库后,库存表更新为:

    图书出库管理:由于图书出库也是一个多次完成的过程,因此,需要用一个图书出库表与图书库存表表进行关联。

    库存表:

    出库表:

    出库后:

    图书入库统计:图书入库是库存管理的重要内容之一,因此能否实现自动统计功能是非常重要的一个问题。图书管理员主要关心的是 全部图书的总数和总金额。

    入库表:

    图书总数:

    图书总价:

    图书出库统计:图书出库是库存管理的重要内容之一,因此能否实现自动统计功能是非常重要的一个问题。图书管理员主要关心的是 全部图书的总数和总金额。

    出库表:

    图书总数:

    图书总价:

    图书信息的输入:图书信息也是库存管理的重要内容之一,因此能否实现输入功能是非常重要的一个问题。图书管理员主要关心的是 信息的增删改查。

    当管理员对 入库、库存、出库 的图书信息进行输入时,也可以对它们进行增删改查:

    其中关于 图书库存的处理有:

    添加一本名为 Book6 的书的信息:

    删除编号为 4 的图书的信息:

    将 编号为 3 的图书进行信息的修改:

    查找编号为 2 的图书的信息:

    用户权限维护的模块:作为一个完整的系统,往往需要对用户权限进行控制或认证。管理员可以通过这个模块进行 人员和读者 的增删改差。

    其中 当管理员删除一个编号为 002 的读者的帐号后,这个帐号将无法登录。

    对模块要论述要实现的功能、界面设计效果、实现方法)

    系统主要功能:

    • 对图书入库的管理(更新、添加、修改和删除)
    • 对图书出库的管理(更新、添加、修改和删除)
    • 对图书进行入库统计
    • 对图书进行出库统计
    • 对图书入库结存报表的查询
    • 对图书出库结存报表的查询
    • 对用户权限的维护

    界面设计的效果可以由每个网页中 CSS 设定的样式进行修饰:

    其中 主页 index.php 的效果为:

    样式部分的代码为:

    <style type="text/css">
                html{font-size:12px;}
                fieldset{width:300px; margin: 0 auto;}
    legend{font-weight:bold; font-size:14px;}
    .label{float:left; width:70px; margin-left:10px;}
    .left{margin-left:80px;}
    .input{width:150px;}
    span{color: #666666;}
    </style>
    

    实现的方法:涉及到 (0)WampServer 的连接 (1)数据库的建立 (2)表的建立、初始化 (3)入库表和出库表对库存表的更新 (4)图书信息、人员信息、读者信息的增删该查。

    资源下载地址:https://download.csdn.net/download/sheziqiong/85697449

    展开全文
  • Python基于Apriori关联规则算法实现商品零售购物篮分析

    说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取。

    1.项目背景

          购物篮分析是商业领域最前沿、最具挑战性的问题之一,也是许多企业重点研究的问题。购物篮分析是通过发现顾客在一次购买行为中放入购物篮中不同商品之间的关联,研究顾客的购买行为,从而辅助零售企业制定营销策略的一种数据分析方法。

           本项目使用Apriori关联规则算法实现购物篮分析,发现超市不同商品之间的关联关系,并根据商品之间的关联规则制定销售策略。

    2.项目目标

           现代商品种类繁多,顾客往往会因此而变得疲于选择,且顾客并不会因为商品选择丰富而购买更多的商品。繁杂的选购过程往往会给顾客带来疲惫的购物体验。对于某些商品,顾客会选择同时购买,如面包与牛奶、薯片与可乐等,但是如果当面包与牛奶或者薯片与可乐分布在商场的两侧,且距离十分遥远时,顾客的购买欲望就会减弱,在时间紧迫的情况下,顾客甚至会放弃购买某些计划购买的商品。相反,如果把牛奶与面包摆放在相邻的位置,既能给顾客提供便利,提升购物体验,又能提高顾客购买的概率,达到促销的目的。许多商场以打折方式作为主要促销手段,以较少的利润为代价获得更高的销量。打折往往会使顾客增加原计划购买商品的数量,而对于原计划不打算购买且不必要的商品,打折的吸引力远远不足。而正确的商品摆放却能提醒顾客购买某些必需品,甚至吸引他们购买感兴趣的商品。

           因此,为了获得最大的销售利润,清楚知晓销售什么样的商品、采用什么样的促销策略、商品在货架上如何摆放以及了解顾客的购买习惯和偏好等对销售商品尤其重要。通过对商场销售数据进行分析,得到顾客的购买行为特征,并根据发现的规律而采取有效的行动,制定商品摆放、商品定价、新商品采购计划,对增加销量并获取最大利润有重要意义。

    请根据提供的数据实现以下目标:

    1)构建零售商品的Apriori关联规则模型,分析商品之间的关联性。

    2)根据模型结果给出销售策略。

    3.项目流程介绍

    本次数据挖掘建模的总体流程如图所示

    购物篮关联规则挖掘的主要步骤如下:

    1)对原始数据进行数据探索性分析,分析商品的热销情况与商品结构。

    2)对原始数据进行数据预处理,转换数据形式,使之符合Apriori关联规则算法要求。

    3)在步骤2得到的建模数据基础上,采用Apriori关联规则算法调整模型输入参数,完成商品关联性分析。

    4)结合实际业务,对模型结果进行分析,根据分析结果给出销售建议,最后输出关联规则结果。

    4.数据获取

    本次建模数据来源于网络(本项目撰写人整理而成),数据项统计如下:

    某商品零售企业共收集了9835个购物篮数据,它主要包括3个属性:id、Goods和Types。属性的具体说明如表所示:

    数据详情如下(部分展示):

    5.探索性数据分析

           本项目的探索分析是查看数据特征以及对商品热销情况和商品结构进行分析。

          探索数据特征是了解数据的第一步。分析商品热销情况和商品结构,是为了更好地实现企业的经营目标。商品管理应坚持商品齐全和商品优选的原则,产品销售应基本满足“二八定律”,即80%的销售额是由20%的商品创造的,这些商品是企业的主要盈利商品,要作为商品管理的重中之重。商品热销情况分析和商品结构分析也是商品管理中不可或缺的一部分,其中商品结构分析能够保证商品的齐全性,热销情况分析可以助力商品优选。

    5.1数据特征查看

    探索数据的特征,查看每列属性、最大值、最小值是了解数据的第一步。查看数据特征,关键代码如下:

    结果截图如下:

     从上图可得,每列属性共有43367个观测值,并不存在缺失值。查看“id”属性的最大值和最小值,可知某商品零售企业共收集了9835个购物篮数据,其中包含169个不同的商品类别,售出商品总数为43367件。

    5.2分析热销商品

    商品热销情况分析是商品管理中不可或缺的一部分,热销情况分析可以助力商品优选。计算销量排行前10的商品销量及占比,并绘制条形图显示销量前10的商品销量情况,关键代码如下:

    根据代码可得销量排行前10的商品销量及其占比情况,如下图所示:

    销量排行前10的商品销量及其占比

    销量排行前10的商品销量情况

    通过分析热销商品的结果可知,全脂牛奶的销售量最高,为2513件,占比5.795%;其次是其他蔬菜、面包卷和苏打,占比分别为4.388%、4.171%、3.955%。

    5.3分析商品结构

           对每一类商品的热销程度进行分析,有利于商家制定商品在货架上的摆放策略和位置,若是某类商品较为热销,商场可以把此类商品摆放到商场的中心位置,以方便顾客选购;或者是放在商场深处的位置,使顾客在购买热销商品前经过非热销商品所在位置,增加在非热销商品处的停留时间,以促进非热销商品的销量。

           原始数据中的商品本身已经经过归类处理,但是部分商品还是存在一定的重叠,故需要再次对其进行归类处理。分析归类后各类别商品的销量及其占比后,绘制饼图来显示各类商品的销量占比情况,关键代码如下:

     根据代码可得各类别商品的销量及其占比情况,结果如下图标所示:

    通过分析各类别商品的销量及其占比情况可知,非酒精饮料、西点、果蔬3类商品的销量差距不大,占总销量的50%左右,同时,根据大类划分发现,和食品类的销量总和接近90%,说明顾客倾向于购买此类商品,而其余商品仅是商场为满足顾客的其他需求而设定的,并非销售的主力军。

    各类别商品的销量及其占比

    各类别商品的销量占比情况

    进一步查看销量第一的非酒精饮料类商品的内部商品结构,并绘制饼图显示其销量占比情况,其关键代码如下:

    根据代码清单可得非酒精饮料内部商品的销量及其占比情况,如下图表所示:

    非酒精饮料内部商品的销量及其占比

    非酒精饮料内部商品的销量占比情况

    通过分析非酒精饮料内部商品的销量及其占比情况可知,全脂牛奶的销量在非酒精饮料的总销量中占比超过33%,前3种非酒精饮料的销量在非酒精饮料的总销量中的占比接近70%,这就说明大部分顾客到店购买的饮料为这3种,而商场就需要时常注意货物的库存,定期补货。

    6.数据预处理

    通过对数据探索分析发现数据完整,并不存在缺失值。建模之前需要转变数据的格式,才能使用Apriori函数进行关联分析。对数据进行转换,其关键代码如下:

     结果输入如下:

    7.构建Apriori规则模型

           本项目的目标是探索商品之间的关联关系,因此采用关联规则算法,以挖掘它们之间的关联关系。关联规则算法主要用于寻找数据中项集之间的关联关系,它揭示了数据项间的未知关系。基于样本的统计规律,进行关联规则分析。根据所分析的关联关系,可通过一个属性的信息来推断另一个属性的信息。当置信度达到某一阈值时,就可以认为规则成立。Apriori算法是常用的关联规则算法之一,也是最为经典的分析频繁项集的算法,它是第一次实现在大数据集上可行的关联规则提取的算法。除此之外,还有FP-Tree算法,Eclat算法和灰色关联算法等。本项目主要使用Apriori算法进行分析。

    关联规则指标说明:

    Support(支持度):表示某个项集出现的频率,也就是包含该项集的交易数与总交易数的比例。例如P(A)表示项集A的比例,表示项集A和项集B同时出现的比例。

    Confidence(置信度):表示当A项出现时B项同时出现的频率,记作{A→B}。换言之,置信度指同时包含A项和B项的交易数与包含A项的交易数之比。公式表达:{A→B}的置信度=

    Lift(提升度):指A项和B项一同出现的频率,但同时要考虑这两项各自出现的频率。公式表达:{A→B}的提升度={A→B}的置信度/P(B)=

    提升度反映了关联规则中的A与B的相关性,提升度>1且越高表明正相关性越高,提升度<1且越低表明负相关性越高,提升度=1表明没有相关性。负值,商品之间具有相互排斥的作用。但是一般在大数据实际应用中,提升度大于3才算是正相关。

    7.1商品购物篮关联规则模型构建

    本次商品购物篮关联规则建模的流程如图所示:

    商品购物篮关联规则模型建模流程图

    由上图可知,模型主要由输入、算法处理、输出3个部分组成。输入部分包括建模样本数据的输入和建模参数的输入。算法处理部分是采用Apriori关联规则算法进行处理。输出部分为采用Apriori关联规则算法进行处理后的结果。

    模型具体实现步骤:首先设置建模参数最小支持度、最小置信度,输入建模样本数据;然后采用Apriori关联规则算法对建模的样本数据进行分析,以模型参数设置的最小支持度、最小置信度以及分析目标作为条件,如果所有的规则都不满足条件,则需要重新调整模型参数,否则输出关联规则结果。

    目前,如何设置最小支持度与最小置信度并没有统一的标准。大部分都是根据业务经验设置初始值,然后经过多次调整,获取与业务相符的关联规则结果。本项目经过多次调整并结合实际业务分析,选取模型的输入参数为:最小支持度0.02、最小置信度0.35。其关联规则关键代码如下:

     输出结果如下:

    7.2模型结果分析

    根据代码清单的运行结果,我们得出了26个关联规则。根据规则结果,可整理出购物篮关联规则模型结果,如下表所示:

    根据表中的输出结果,对其中4条进行解释分析如下:

    1){'其他蔬菜','酸奶'}=>{'全脂牛奶'}支持度约为2.23%,置信度约为51.29%。说明同时购买酸奶、其他蔬菜和全脂牛奶这3种商品的概率达51.29%,而这种情况发生的可能性约为2.23%。

    2){'其他蔬菜'}=>{'全脂牛奶'}支持度最大约为7.48%,置信度约为38.68%。说明同时购买其他蔬菜和全脂牛奶这两种商品的概率达38.68%,而这种情况发生的可能性约为7.48%。

    3){'根茎类蔬菜'}=>{'全脂牛奶'}支持度约为4.89%,置信度约为44.87%。说明同时购买根茎类蔬菜和全脂牛奶这3种商品的概率达44.87%,而这种情况发生的可能性约为4.89%。

    4){'根茎类蔬菜'}=>{'其他蔬菜'}支持度约为4.74%,置信度约为43.47%。说明同时购买根茎类蔬菜和其他蔬菜这两种商品的概率达43.47%,而这种情况发生的可能性约为4.74%。

          综合表以及输出结果分析,顾客购买酸奶和其他蔬菜的时候会同时购买全脂牛奶,其置信度最大达到51.29%。因此,顾客同时购买其他蔬菜、根茎类蔬菜和全脂牛奶的概率较高。

           对于模型结果,从购物者角度进行分析:现代生活中,大多数购物者为“家庭煮妇”,购买的商品大部分是食品,随着生活质量的提高和健康意识的增加,其他蔬菜、根茎类蔬菜和全脂牛奶均为现代家庭每日饮食的所需品。因此,其他蔬菜、根茎类蔬菜和全脂牛奶同时购买的概率较高,符合人们的现代生活健康意识。

    8.结论与展望

           以上的模型结果表明:顾客购买其他商品的时候会同时购买全脂牛奶。因此,商场应该根据实际情况将全脂牛奶放在顾客购买商品的必经之路上,或是放在商场显眼的位置,以方便顾客拿取。顾客同时购买其他蔬菜、根茎类蔬菜、酸奶油、猪肉、黄油、本地蛋类和多种水果的概率较高,因此商场可以考虑捆绑销售,或者适当调整商场布置,将这些商品的距离尽量拉近,从而提升顾客的购物体验。

     本次机器学习项目实战所需的资料,项目资源如下:

    项目说明:
    链接:https://pan.baidu.com/s/1c6mQ_1YaDINFEttQymp2UQ 
    提取码:thgk

    网盘如果失效,可以添加博主微信:zy10178083

    展开全文
  • 3.库存管理(摆放);4.促销页面设计;5.捆绑销售;6.内容推荐 相关概念 支持度:物品或物品组合,所有数据出现的概率(计算物品A的概率) [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接...
  • SAP,有的企业同时应用了MM物料管理模块和WM参考管理模块。这就导致某些操作需要做双重处理。比如物料移动,当一个物料MM模块从一个库存地点移动到另一个库存地点时,WM模块层面,需要做相同的操作。否则...
  • 基于web的库存管理系统

    千次阅读 2021-02-21 21:38:26
    该系统可以实现对仓库的基本维护,例如,对仓库和货物信息进行添加、删除、修改和查询等功能;同时也可满足仓库的基本管理,如:进出货时更改仓库信息及对货物销售情况进行统计等。 基于web的购.
  • 这两天参加一个短期课程,群里聊天记录,大家分享了很多有很多养分的内容,觉得很重要,就整理下来了。 感谢大家的分享,也分享给更多的人~ 有些整理的过程理解吸收了,有些只是复制粘贴下来了。也分享给...
  • 进销存,是指企业管理过程 采购(进)→入库(存)→销售(销) 的动态管理过程。进:指询价、采购到入库与付款的过程。销:指报价、销售到出库与收款的过程。存:指出入库之外,包括领料、退货、盘点等影响库存...
  • Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集,而且算法已经被广泛的应用到商业,网络安全等各个领域。 ...
  • 而针对电子制造行业特性和管理需求研发的ERP管理系统,可以有效满足行业客户类型多、销售模式复杂、采购业务繁重、库存不易掌握、生产周期较长、成本核算困难等管理特点;其中针对仓库管理的具体问题有: 请点击...
  • 技术:Java、JSP等 摘要:管理信息系统是一个由人和计算机等组成的...整个系统开发的过程运用了软件工程的基本概念、相关技术和方法。并且采用了系统生命周期的结构化程序设计方法,从而将整个系统开发各阶段(系
  • Apriori算法目录一、前言二、关联分析三、Apriori原理四、利用Apriori算法来发现频繁集1、Apriori算法及实例描述2、生成候选项集2、组织完整的Apriori算法五、从频繁项集中挖掘关联规则六、示例1:发现国会投票的...
  • 有啊,看看无代码库存管理系统,让你盘点库存开启高速模式!首先,你需要一个盘点申请表通过雀书无代码系统的库存管理模板,你会拥有一个已经设置好的通用盘点表。里面不只是设定了盘点申请表,还能将盘点申请表与...
  • 传统搜索引擎可以根据用户输入关键词基于文本相似度搜索算法快速找到相关文档,但搜索引擎技术并不能完全解决备件库存管理相似性判断所面临的问题,例如电机管理,文本搜索引擎基于文本相似度,可以一定程度实现...
  • 该文章主要介绍该系统的功能模块。 2. 用户 该仓储管理系统的用户总共可以分为四类。自有商城的卖家用户,生产工厂的用户以及抖店和淘宝店铺的店家和仓储管理系统管理人员。 公司目前已经存在一套的用户管理系统...
  • ERP : 库存管理的基本原理

    千次阅读 2019-05-29 21:55:57
    2.同作业有关的人将说库存是成品、原材料、制品或产品使用的物料。 这种财务观点是一种真正的自相矛盾。毫无疑问库存具有价值,特别是当买进或卖出公 司时,它们的价值总是表示资产负债平衡表上资产的一方。...
  • SAP物料计划应用中,物料计划部门需要随时掌握其管理范围内物料的库存与供应天数的关系。己便及时发现及调整库存供应不足的问题。SAP标准功能可以满足该需求。 记录相关分析如下: 1、事务MD07,可以条件展示某个...
  • 大数据金融行业应用

    千次阅读 2021-10-28 01:18:53
    近年来,随着大数据、云计算、区块链、人工智能等新技术的快速发展,这些新技术与金融业务深度融合,释放出了金融创新活力和应用潜能,这大大推动了金融业转型升级,助力金融更好地服务实体经济,有效促...
  • 广告库存管理系统性能优化实战

    千次阅读 2022-02-17 01:22:54
    丨目录:· 写最前· 数据表的构建优化· 数据的查询优化· 优化结果展示· 优化总结· 关于我们▐写最前1. 本文概述阿里妈妈品牌合约广告,2021年广告售卖策略发生变化,大促订单...
  • 1985年,管理信息系统的创始人高登·戴维斯给管理信息系统做了一个完整的定义:“它是一个利用计算机硬件和软件,手工作业,分析、计划、控制和决策模型,以及数据库的用户-机器系统。它能提供信息,支持企业或组织...
  • 4.4 关联分析

    2020-03-18 15:43:47
    这种策略还会应用于捆绑销售、库存管理、商品促销设计、页面促销设计、货架设计、商品陈列设计、页面内容排版、推荐系统、商品价格策略和基于购买的用户特征分析等。网站分析工具Webtrekk关联分析报表便应用了...
  • 超市管理系统应用解决超市管理难题21世纪,电脑技术的普及与大众化,让信息化进程进一步加快,电脑已走进了千家万户,各种软件应用的出现,网上搜索,网上购物已不再是潮流人士所专有。普通老百姓开始享受网购的乐趣...
  • 智能制造数据分析综合应用方案

    千次阅读 2021-12-06 14:25:15
    智能制造数据分析综合应用方案 最全智能制造数字化应用方案 智能制造数字化应用全流程方案 制造业的生产数据通过采集设备,通过时序数据库或关系型数据库存储,通过数据大屏进行展示,以供生产车间、生产控制中心...
  • 认识工业大数据 什么是工业大数据? 我们先看看维基百科的说法:“工业大数据(Industrialbig data)是构成工业人工智能的重要...百度百科是这样说的:“工业大数据是指工业领域,围绕典型智能制造模式,从客户需
  • Odoo软件认识到需要一个有效、高效和可靠的库存管理系统,这为库存模型及其附加属性的开发铺平了道路。 Odoo库存模块与公司运营的各个方面相互关联,例如销售、采购、销售点、维修、制造以及Odoo公司运营的更多...
  • 随着新型智慧城市建设的逐步落地,围绕“以人为本、惠民便民、绩效导向、客观量化”的新型智慧城市评价体系也作为国家标准指导者智慧城市建设,评价指标分为主观指标和客观指标,主观指标强调市民体验,旨在注重...
  • 如何做台战略分析模型?

    千次阅读 2020-06-29 16:17:46
    1.CAPM:主要研究证券市场资产的预期收益率与风险资产之间的关系,以及均衡价格是如何形成的,是现代金融市场价格理论的支柱,广泛应用于投资决策和公司理财领域。 2.乘数模型:乘数模型是一个用来解释短期产出...
  • 另外,某仓库有不同的存储类型,并非每个存储类型都需要存储单位管理,因此,仓库的存储类型上也需要勾选的方式来激活仓储单位管理; 下面从原材料收货开始,来一步步揭开仓储单位管理的运作情况;某原材料一...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 14,120
精华内容 5,648
热门标签
关键字:

关联分析在库存管理中的应用