精华内容
下载资源
问答
  • 基于IP/MPLS的业务流量矩阵是在理想的状态下获得的,为了得到准确的业务流量矩阵,通过对业务流的到达过程的分布情况进行了分析,然后在推导出包丢失的业务理论模型的基础上进一步推导出业务流量矩阵修正模型
  • GE矩阵模型

    2015-05-28 10:06:31
    在需要对产业吸引力和业务实力作广义而灵活的定义时,可以以GE矩阵为基础进行战略规划。按市场吸引力和业务自身实力两个维度评估现有业务(或事业单位),每个维度分三级,分成九个格以表示两个维度上不同级别的组合...
  • 基于软件项目管理的特点分析,并结合软件项目开发管理经验,讨论了软件项目组织架构、计划与过程控制等软件项目管理要素,提出了矩阵式项目管理模型,分析了该模型业务知识与计算机技术共同作用所能达到的最佳效果...
  • 模型首先对配用电通信业务进行需求分析,通过求解准则层和业务层的判断矩阵,得到相应判断矩阵的最大特征根和特征向量,其中判断矩阵描述了业务准则的相互关系。而相应的特征向量和准则权值向量的乘积,则表示配...
  • 思维模型 波士顿矩阵

    2021-03-16 10:20:02
    1 模型故事 以白酒市场为例,能经久不衰的酒品牌并不多,能维持三年五载的品牌已经是不错了,“一年喝倒一个牌子”成为白酒品牌中常有的事。酒类商品作为快速消品,近年品牌链不断延长,一个酒品牌往往有高中低档...

    1 模型故事

    @1 波士顿矩阵在白酒市场中酒类营销中的运用

    以白酒市场为例,能经久不衰的酒品牌并不多,能维持三年五载的品牌已经是不错了,“一年喝倒一个牌子”成为白酒品牌中常有的事。酒类商品作为快速消品,近年品牌链不断延长,一个酒品牌往往有高中低档全部的品种,同时为了实现品牌的差异化,总会有新品推出,这些变化就连“茅五剑”这些名牌,也在不断采用。某一酒类经销公司经营A、B 、C 、D 、E、F、G7个品牌的酒品,公司可用资金50万。经对前半年的市场销售统计分析,发现:

    • A、B品牌业务量为总业务量的70%,两个品牌的利润占到总利润的75%,在本地市场占主导地位。但这两个品牌是经营了几年的老品牌,从去年开始市场销售增长率已成下降趋势,前半年甚至只能维持原来业务量;
    • C、D、E三个品牌是新开辟的新品牌。其中C、D两个品牌前半年表现抢眼,C品牌销售增长了 20%,D品牌增长了18%,且在本区域内尚是独家经营。E品牌是高档产品,利润率高,销售增长也超过了10%,但在本地竞争激烈,该品牌其它两家主要竞争对手所占市场比率达到70%,而公司只占到10%左右;
    • F、G两个品牌市场销售下降严重,有被C、D品牌替代的趋势,且在竞争中处于下风,并出现了滞销和亏损现象。

    针对上述情况,根据波士顿矩阵原理,采取如下措施:

    • 确认C、D品牌为新星品牌,虽然目前不是公司的主要利润来源,但发展潜力很大,决定加大资金投放力度,加快发展步伐,扩大与竞争对手的差距,力争成为公司新的利润增长点。决定先期投入资金10万元。
    • 确认E 为 问题品牌,对E品牌投入研究力量,寻找竞争对手薄弱方面,整合资源,争取扩大市场份额,使E品牌成为新星品牌。决定投入资金5万元。余下5万元作为机动资金,以便在特殊情况下,对某品牌作侧重支持。
    • 确认A、B品牌为金牛品牌,维持原来的资金投入30万元,以保证市场占有率和公司的主要利润来源,同时也认识到A、B品牌已经出现了衰退现象,要认真找出原因,一方面寻找替代品牌,一方面尽可能地延长其生命力。
    • 确认 F、G为 瘦狗品牌,对F、G品牌果断采取撤退战略,不再投入资金,着手清理库存,对滞销商品降价处理,尽快回笼资金。

    @2 使用波士顿矩阵明确产品定位和发展方向

    上海和达汽车零部件有限公司是由某国内上市公司与外商合的生产汽车零部件的企业。公司于1996年正式投产.配套厂海大众发、一汽大众、上海通用、东风柳汽、吉利、湖南长风武等。和达公司的主要产品分成五类,一是挤塑和复合挤塑类(密封嵌条、车顶饰条等);二是滚压折弯类(车门导槽、滑轨、车架管;三是普通金属焊接类(汽车仪表板横梁模块);四是激光焊接镁合金横梁模块);五是排档杆类(手动排档总成系列)。和达公司产品波士顿矩阵分析如下:

    BCG Matrix 解读如下:

    • 明星型业务(Stars,指高增长、高市场份额):这个领域中的产品处于快速增长的市场中并且占有支配地位份额。但也许不会产生正现金流量。但因为市场还在高速成业必须继续投资,以保持与市场同步增长,并击退竞争对手。对于和达公司来说,铝横梁的真空电子束焊接系统是国内第一家。具有技术上的领先优势。因此企业应该加大对这一产品的投入.以继续保持技术上的领先地位。对于排档杆类产品.由于国内在这个领域的竞争程度还不太激烈,因此可以考虑进入。和达公司应该把这类产品作为公司的明星业务来培养.要加大对这方面的资金支持。在技术上应充分利用和寻找国外已具有同等类似产品的厂商进行合作。
    • 问题型业务(Question Marks.指高增长、低市场份额):处在这个领域中的是一些投机性产品。这些产品可能利润率但占有的市场份额很小。公司必须慎重回答“是否继续投资.业务?”这个问题。只有那些符合企业发展长远目标、企业具优势、能够增强企业核心竞争力的业务才得到肯定的回答。从和达公司的情况来看。滚压折弯类产品由于技术含量不高、槛低,未来市场竞争程度必然加剧。所以对于这类产品.最好就是舍弃。由于目前还能带来利润,不必迅速退出,只要目前持必要的市场份额,公司不必再增加投入。当竞争对手大举,可以舍弃。
    • C 现金牛业务(Cash COWS,指低增长、高市场份额):处在这个领域中的产品产生大量的现金。但未来的增长前景是有限的。由于市场已经成熟。企业不必大量投资来扩展市场规模.同时作为市场中的领导者。该业务享有规模经济和高边际利润的优势,因而给企业带来大量现金流。对于和达公司来说,其普通金属焊接类产品即是现金牛类产品。由于进入市场的时机较早。产品价格不错.每年能够给企业带来相当的利润。因此对于和达公司来说,对于金属焊接类产品,应该保持住目前的市场份额.把从这个产品中获取的利润投入到铝横梁和排档杆的产品中去。
    • D 瘦狗型业务(Dogs,指低增长、低市场份额):这个剩下的领域中的产品既不能产生大量的现金,也不需要投入大量现金,这些产品没有希望改进其绩效。瘦狗型业务通常要占用很多资源。多数时候是得不偿失的。对于和达公司来说,普通塑料异型挤出和异型体复合挤出类产品因设备陈旧等原因。在国内已落后于主要竞争对手。从公司战略的角度出发,应该不断对这一块进行收缩.不必再投入更大的精力和财力,逐渐把注意力集中在激光焊接和排档杆的业务上去。

    通过运用波士顿矩阵分析,使和达公司明确了产品定位和发展方向,对于企业投资的选择起到了举足轻重的作用。但波士顿矩阵仅仅是一个工具.问题的关键在于要解决如何使企业的产品品种及其结构适合市场需求的变化。只有这样企业的生产才有意义。同时,如何将企业有限的资源有效地分配到合理的产品结构中去。以保证企业收益。是企业在激烈竞争中能否取胜的关键。  

    @3 产品分析

    波士顿矩阵分析乳业产品如下所示:

    波士顿矩阵分析 肯德基产品 如下所示:

    2 模型 波士顿矩阵

    @1 波士顿矩阵简介

    制定公司层战略最流行的方法之一就是BCG Matrix(Boston Consulting Group, BCG,波士顿矩阵)。该方法是由波士顿咨询集团在上世纪70年代初开发的。BCG矩阵将组织的每一个战略事业单位(SBUs)标在一种2维的矩阵图上,从而显示出哪个SBUs提供高额的潜在收益,以及哪个SBUs是组织资源的漏斗。BCG矩阵的发明者、波士顿公司的创立者布鲁斯认为“公司若要取得成功,就必须拥有增长率和市场份额各不相同的产品组合。组合的构成取决于现金流量的平衡。”如此看来,BCG的实质是为了通过业务的优化组合实现企业的现金流量平衡。BCG矩阵区分出4种业务组合。

    1. 明星型业务(Stars,指高增长、高市场份额):这个领域中的产品处于快速增长的市场中并且占有支配地位的市场份额,但也许会或也许不会产生正现金流量,这取决于新工厂、设备和产品开发对投资的需要量。明星型业务是由问题型业务继续投资发展起来的,可以视为高速成长市场中的领导者,它将成为公司未来的现金牛业务。但这并不意味着明星业务一定可以给企业带来源源不断的现金流,因为市场还在高速成长,企业必须继续投资,以保持与市场同步增长,并击退竞争对手。企业如果没有明星业务,就失去了希望,但群星闪烁也可能会闪花企业高层管理者的眼睛,导致做出错误的决策。这时必须具备识别行星和恒星的能力,将企业有限的资源投入在能够发展成为现金牛的恒星上。同样的,明星型业务要发展成为现金牛业务适合于采用增长战略。
    2. 问题型业务(Question Marks,指高增长、低市场份额):处在这个领域中的是一些投机性产品,带有较大的风险。这些产品可能利润率很高,但占有的市场份额很小。这往往是一个公司的新业务。为发展问题业务,公司必须建立工厂,增加设备和人员,以便跟上迅速发展的市场,并超过竞争对手,这些意味着大量的资金投入。“问题”非常贴切地描述了公司对待这类业务的态度,因为这时公司必须慎重回答“是否继续投资,发展该业务?”这个问题。只有那些符合企业发展长远目标、企业具有资源优势、能够增强企业核心竞争力的业务才得到肯定的回答。得到肯定回答的问题型业务适合于采用战略框架中提到的增长战略,目的是扩大SBUs的市场份额,甚至不惜放弃近期收入来达到这一目标,因为问题型要发展成为明星型业务,其市场份额必须有较大的增长。得到否定回答的问题型业务则适合采用收缩战略。如何选择问题型业务是用BCG矩阵制定战略的重中之重,也是难点,这关乎企业未来的发展。对于增长战略中各种业务增长方案来确定优先次序,BCG也提供了一种简单的方法。通过下图权衡选择ROI相对高然后需要投入的资源占的宽度不太多的方案。
    3. 现金牛业务(Cash cows,指低增长、高市场份额):处在这个领域中的产品产生大量的现金,但未来的增长前景是有限的。这是成熟市场中的领导者,它是企业现金的来源。由于市场已经成熟,企业不必大量投资来扩展市场规模,同时作为市场中的领导者,该业务享有规模经济和高边际利润的优势,因而给企业带来大量现金流。企业往往用现金牛业务来支付帐款并支持其他三种需大量现金的业务。现金牛业务适合采用战略框架中提到的稳定战略,目的是保持SBUs的市场份额。
    4. 瘦狗型业务(Dogs,指低增长、低市场份额):这个剩下的领域中的产品既不能产生大量的现金,也不需要投入大量现金,这些产品没有希望改进其绩效。一般情况下,这类业务常常是微利甚至是亏损的,瘦狗型业务存在的原因更多的是由于感情上的因素,虽然一直微利经营,但象人养了多年的狗一样恋恋不舍而不忍放弃。其实,瘦狗型业务通常要占用很多资源,如资金、管理部门的时间等,多数时候是得不偿失的。瘦狗型业务适合采用战略框架中提到的收缩战略,目的在于出售或清算业务,以便把资源转移到更有利的领域。

    @2 为什么要使用波士顿矩阵?

    它的精髓在于把战略规划和资本预算紧密结合了起来,把一个复杂的企业行为用两个重要的衡量指标来分为四种类型,用四个相对简单的分析来应对复杂的战略问题。该矩阵帮助多种经营的公司确定哪些产品宜于投资,宜于操纵哪些产品以获取利润,宜于从业务组合中剔除哪些产品,从而使业务组合达到最佳经营成效。

    @3 应对策略

    波士顿矩阵对于企业产品所处的四个象限具有不同的定义和相应的战略对策。

    1. 明星产品(stars)。它是指处于高增长率、高市场占有率象限内的产品群,这类产品可能成为企业的现金牛产品,需要加大投资以支持其迅速发展。采用的发展战略是:积极扩大经济规模和市场机会,以长远利益为目标,提高市场占有率,加强竞争地位。发展战略以及明星产品的管理与组织最好采用事业部形式,由对生产技术和销售两方面都很内行的经营者负责。
    2. 问题产品(question marks)。它是处于高增长率、低市场占有率象限内的产品群。前者说明市场机会大,前景好,而后者则说明在市场营销上存在问题。其财务特点是利润率较低,所需资金不足,负债比率高。例如在产品生命周期中处于引进期、因种种原因未能开拓市场局面的新产品即属此类问题的产品。对问题产品应采取选择性投资战略。因此,对问题产品的改进与扶持方案一般均列入企业长期计划中。对问题产品的管理组织,最好是采取智囊团或项目组织等形式,选拔有规划能力,敢于冒风险、有才干的人负责。
    3. 现金牛产品(cash cow),又称厚利产品。它是指处于低增长率、高市场占有率象限内的产品群,已进入成熟期。其财务特点是销售量大,产品利润率高、负债比率低,可以为企业提供资金,而且由于增长率低,也无需增大投资。因而成为企业回收资金,支持其它产品,尤其明星产品投资的后盾。①把设备投资和其它投资尽量压缩;②采用榨油式方法,争取在短时间内获取更多利润,为其它产品提供资金。对于这一象限内的销售增长率仍有所增长的产品,应进一步进行市场细分,维持现存市场增长率或延缓其下降速度。对于现金牛产品,适合于用事业部制进行管理,其经营者最好是市场营销型人物。现金牛业务指低市场成长率、高相对市场份额的业务,这是成熟市场中的领导者,它是企业现金的来源。由于市场已经成熟,企业不必大量投资来扩展市场规模,同时作为市场中的领导者,该业务享有规模经济和高边际利润的优势,因而给企业带来大量财源。企业往往用现金牛业务来支付帐款并支持其他三种需大量现金的业务。图中所示的公司只有一个现金牛业务,说明它的财务状况是很脆弱的。因为如果市场环境一旦变化导致这项业务的市场份额下降,公司就不得不从其他业务单位中抽回现金来维持现金牛的领导地位,否则这个强壮的现金牛可能就会变弱,甚至成为瘦狗。
    4. 瘦狗产品(dogs),也称衰退类产品。它是处在低增长率、低市场占有率象限内的产品群。其财务特点是利润率低、处于保本或亏损状态,负债比率高,无法为企业带来收益。对这类产品应采用撤退战略:首先应减少批量,逐渐撤退,对那些销售增长率和市场占有率均极低的产品应立即淘汰。其次是将剩余资源向其它产品转移。第三是整顿产品系列,最好将瘦狗产品与其它事业部合并,统一管理。

    @4 波士顿矩阵应用法则

    按照波士顿矩阵的原理,产品市场占有率越高,创造利润的能力越大;另一方面,销售增长率越高,为了维持其增长及扩大市场占有率所需的资金亦越多。这样可以使企业的产品结构实现产品互相支持,资金良性循环的局面。按照产品在象限内的位置及移动趋势的划分,形成了波士顿矩阵的基本应用法则。

    • 第一法则:成功的月牙环。在企业所从事的事业领域内各种产品的分布若显示月牙环形,这是成功企业的象征,因为盈利大的产品不只一个,而且这些产品的销售收入都比较大,还有不少明星产品。问题产品和瘦狗产品的销售量都很少。若产品结构显示的散乱分布,说明其事业内的产品结构未规划好,企业业绩必然较差。这时就应区别不同产品,采取不同策略。
    • 第二法则:黑球失败法则。如果在第三象限内一个产品都没有,或者即使有,其销售收入也几乎近于零,可用一个大黑球表示。该种状况显示企业没有任何盈利大的产品,说明应当对现有产品结构进行撤退、缩小的战略调整,考虑向其它事业渗透,开发新的事业。
    • 第三法则:西北方向大吉。一个企业的产品在四个象限中的分布越是集中于西北方向,则显示该企业的产品结构中明星产品越多,越有发展潜力;相反,产品的分布越是集中在东南角,说明瘦狗类产品数量大,说明该企业产品结构衰退,经营不成功。
    • 第四法则:踊跃移动速度法则。从每个产品的发展过程及趋势看,产品的销售增长率越高,为维持其持续增长所需资金量也相对越高;而市场占有率越大,创造利润的能力也越大,持续时间也相对长一些。按正常趋势,问题产品经明星产品最后进入现金牛产品阶段,标志了该产品从纯资金耗费到为企业提供效益的发展过程,但是这一趋势移动速度的快慢也影响到其所能提供的收益的大小。

    3 模型简图

     

    展开全文
  • 不知道大家还记不记得上一周给大家分享的波士顿矩阵,当时在分享波士顿矩阵的时候忘记给大家提到了一个重要的矩阵就是今天要给大家分享的麦肯锡矩阵(GE矩阵)。由于波士顿矩阵在使用的时候其实会存在很多的问题...

    不知道大家还记不记得上一周给大家分享的波士顿矩阵,当时在分享波士顿矩阵的时候忘记给大家提到了一个重要的矩阵就是今天要给大家分享的麦肯锡矩阵(GE矩阵)。由于波士顿矩阵在使用的时候其实会存在很多的问题(小白并不是说波士顿矩阵就不能用了,只是会有一些不可避免的问题),所以有的时候为了避免波士顿矩阵可能带来的不利影响,有的时候企业就会选择使用麦肯锡矩阵,在行业里面,麦肯锡矩阵可以说是为了克服波士顿矩阵缺点所开发出来的。

    对于麦肯锡矩阵,使用的目的其实和波士顿矩阵是差不多的。今天就不跟大家说太多背景知识,咱们直接进入模型当中来。

    在使用麦肯锡矩阵的时候,一般是根据具体业务模块在市场上的竞争实力和所在市场的吸引力两个维度进行评估,每个维度用高中低三个档来评价,形成一个3×3的矩阵(九宫格):

    上面这个图就是一个麦肯锡矩阵的模型。我们在企业中运用麦肯锡矩阵分析时,使用的流程如下:

    第一步:定义要素

    外部要素—行业吸引力要素

    企业要想得到发展,必须在行业中有一定的吸引力,这样才能够占领市场,争夺到自己的客户。下面这些就是在行业吸引力要素中必要重要的一些要素:

    1.企业在市场中的营销能力

    2.企业品牌知名度

    3.企业自身技术开发能力

    4.企业产品质量

    5.企业自身的行业经验和人才水平

    6.企业的融资能力

    7.企业的管理水平

    8.企业自身的产品系列宽度

    9.企业生产线技术水平

    10.企业的渠道能力

    内部要素—企业竞争力要素

    当企业占领了市场,又需要保持足够的竞争力,因为不同行业入行门槛的条件参差不齐,所以为了保住企业自身的市场,必须要保持足够的竞争力才能够取得长足的发展,在竞争力方面,我们需要注意的部分竞争力要素如下:

    1.市场增长率

    2.市场规模

    3.盈利性

    4.竞争对手强弱

    5.进入市场门槛高低

    6.市场容量大小

    7.政治经济文化法律技术等环境

    8.通货膨胀

    9.人才的可获得性

    10.行业的持续发展能力

    第二步:评估要素

    当我们确定好我们想要分析的要素时,我们就需要根据列出来的要素,对要素的权重进行评分,同时还需要对各要素(内部要素和外部要素)的具体等级进行评级,在内部要素和外部要素上的得分计算公式为:

    其实就是在每个要素后加三个小标签,第一个是我们所定义的要素等级,第二个是所定义要素的权重,第三个就是所定义要素的得分。

    第三步:做出麦肯锡矩阵图

    根据企业自身的业务,我们需要在麦肯锡矩阵的九宫格中作图:

    上图就是小白举出来的一个例子,在上图中,圆圈大小代表企业的业务规模,饼图代表该业务模块的市场占有率实际情况。

    当我们完成上面的步骤以后,我们就可以对企业的业务进行细致的分析,为每个业务模块制定战略发展计划。企业可以综合考虑各个业务模块的特征,合理分配企业战略资源如何进行投入。

    上面这个图就是针对九宫格中每个模块企业可以对相应产品做出处理的方法和建议。当然,每一个企业都有自身所面临的环境,在分析的时候需要灵活调整,这样才能够帮助企业自身得到长期的发展。

    **文章来自公众号【小白数据营】**

    大家可以私信我进入到交流群中参与讨论和交流。

    展开全文
  • 模型评估方法(混淆矩阵

    千次阅读 2018-11-11 12:38:00
    在数据挖掘或机器学习建模后往往会面临一个问题,就是该模型是否可靠?可靠性如何?也就是说模型的性能如何我们暂时不得而知。 如果模型不加验证就使用,那后续出现的问题将会是不可估计的。所以通常建模后我们都会...

    在数据挖掘或机器学习建模后往往会面临一个问题,就是该模型是否可靠?可靠性如何?也就是说模型的性能如何我们暂时不得而知。

    如果模型不加验证就使用,那后续出现的问题将会是不可估计的。所以通常建模后我们都会使用模型评估方法进行验证,当验证结果处于我们的可控范围之内或者效果更佳,那该模型便可以进行后续的进一步操作。

    这里又将面临一个新的问题——如何选择评估方法,其实通常很多人都会使用比较简单的错误率来衡量模型的性能,错误率指的是在所有测试样例中错分的样例比例。实际上,这样的度量错误掩盖了样例如何被分错的事实。其实相对于不同的问题会有不同的评估思路:

    回归模型:

    对于回归模型的评估方法,我们通常会采用平均绝对误差(MAE)、均方误差(MSE)、平均绝对百分比误差(MAPE)等方法。

    聚类模型:

    对于聚类模型的评估方法,较为常见的一种方法为轮廓系数(Silhouette Coefficient ),该方法从内聚度和分离度两个方面入手,用以评价相同数据基础上不同聚类算法的优劣。

    分类模型:

    本篇文章将会主要描述分类模型的一种评估方法——混淆矩阵。对于二分类问题,除了计算正确率方法外,我们常常会定义正类和负类,由真实类别(行名)与预测类别(列名)构成混淆矩阵。

    首先直观的来看看(混淆矩阵图):

    文字详细说明:

    • TN:将负类预测为负类(真负类)
    • FN:将正类预测为负类(假负类)
    • TP:将正类预测为正类(真正类)
    • FP:将负类预测为正类(假正类)

    最后根据混淆矩阵得出分类模型常用的分类评估指标:

    准确率 Accuracy:

    测试样本中正确分类的样本数占总测试的样本数的比例。公式如下:

    Accuracy = \frac{TP+TN}{TP+TN+FP+FN}

    scikit-learn 准确率的计算方法:sklearn.metrics.accuracy_score(y_true, y_pred)

    from sklearn.metrics import accuracy_score
    accuracy_score(y_test, y_predict)

    精确率 Precision:

    准确率又叫查准率,测试样本中正确分类为正类的样本数占分类为正类样本数的比例。公式如下:

    Precision = \frac{TP}{TP+FP}

    scikit-learn 精确率的计算方法:sklearn.metrics.precision_score(y_true, y_pred)

    from sklearn.metrics import precision_score
    precision_score(y_test, y_predict)

    召回率 Recall:

    召回率又称查全率,测试样本中正确分类为正类的样本数占实际为正类样本数的比例。公式如下:

    Recall = \frac{TP}{TP+FN}

    scikit-learn 召回率的计算方法:sklearn.metrics.recall_score(y_true, y_pred)

    from sklearn.metrics import recall_score
    recall_score(y_test, y_predict)

    F1 值:

    F1 值是查准率和召回率的加权平均数。F1 相当于精确率和召回率的综合评价指标,对衡量数据更有利,更为常用。  公式如下:

    F1 = \frac{2*(Precision*Recall)}{Precision+Recall}

    scikit-learn F1的计算方法:sklearn.metrics.f1_score(y_true, y_pred)

    from sklearn.metrics import f1_score
    f1_score(y_test, y_predict)

    ROC 曲线:

    在部分分类模型中(如:逻辑回归),通常会设置一个阈值如0.5,当大于0.5归为正类,小于则归为负类。因此,当减小阈值如0.4时,模型将会划分更多测试样本为正类。这样的结果是提高了正类的分类率,但同时也会使得更多负类被错分为正类。

    在ROC 曲线中有两个参数指标——TPR、FPR,公式如下:

    TPR = \frac{TP}{TP+FN}

    FPR = \frac{FP}{FP+TN}

    TPR 代表能将正例分对的概率(召回率),而 FPR 则代表将负例错分为正例的概率。

    TPR作为ROC 曲线的纵坐标,FPR作为ROC曲线的横坐标,如下图:

    由图可得:

    • 当 FPR=0,TPR=0 时,意味着将每一个实例都预测为负例。

    • 当 FPR=1,TPR=1 时,意味着将每一个实例都预测为正例。

    • 当 FPR=0,TPR=1 时,意味着为最优分类器点。

    所以一个优秀的分类器对应的ROC曲线应该尽量靠近左上角,越接近45度直线时效果越差。

    scikit-learn ROC曲线的计算方法:

    sklearn.metrics.roc_curve(y_true, y_score)

    AUC 值:

    AUC 的全称为 Area Under Curve,意思是曲线下面积,即 ROC 曲线下面积 。通过AUC我们能得到一个准确的数值,用来衡量分类器好坏。

    • AUC=1:最佳分类器。

    • 0.5<AUC<1:分类器优于随机猜测。

    • AUC=0.5:分类器和随机猜测的结果接近。

    • AUC<0.5:分类器比随机猜测的结果还差。

    scikit-learn AUC的计算方法:

    sklearn.metrics.auc(y_true, y_score)
    from matplotlib import pyplot as plt
    from sklearn.linear_model import LogisticRegression
    from sklearn.metrics import roc_curve
    from sklearn.metrics import auc
    
    model = LogisticRegression()
    model.fit(X_train,y_train.ravel())
    
    y_score = model.decision_function(X_test)    # model训练好的分类模型
    fpr, tpr, _ = roc_curve(y_test, y_score)    # 获得FPR、TPR值
    roc_auc = auc(fpr, tpr)    # 计算AUC值
    
    plt.plot(fpr, tpr, label='ROC curve (area = %0.2f)' % roc_auc)
    plt.plot([0, 1], [0, 1], color='navy', linestyle='--')
    plt.xlabel('False Positive Rate')
    plt.ylabel('True Positive Rate')
    plt.legend()
    plt.show()

     

    由于(精准率、召回率)(偏差、方差)很相似,都是一对需要平衡的衡量值,(偏差、方差)衡量模型的拟合能力与泛化能力,而(精准率、召回率)则需要考虑的情况更多,主要如下3点:

    1:如果某个业务需要控制一定的成本,同时还想要最大限制的预测出更多的问题。(精确率、召回率 平衡)

    2:(极端情况)如果某个业务成本可以最大化,只要得出所有的可能性。(牺牲精确率,提高召回率)

    3:(极端情况)如果某个业务成本需要最小化,只要模型不出错即可。(牺牲召回率,提高精确率)

     

    提高阈值,如逻辑回归中修改sigmoid函数的判断阈值k=0.5,我们来看看精确率与召回率的变化情况:

    1:提高k大于0.5,精确率提高,召回率下降

    2:降低k小于0.5,精确率下降,召回率提高

    展开全文
  • 在机器学习中,当我们基于某个业务建立模型并训练后,接下来我们需要评判模型好坏的时候需要基于混淆矩阵,ROC和AUC等来进行辅助判断。 混淆矩阵也叫精度矩阵,是用来表示精度评价,为N *N的矩阵,用来判别分类好坏...

           在机器学习中,当我们基于某个业务建立模型并训练后,接下来我们需要评判模型好坏的时候需要基于混淆矩阵,ROC和AUC等来进行辅助判断。

    混淆矩阵也叫精度矩阵,是用来表示精度评价,为N *N的矩阵,用来判别分类好坏的指标。

    混淆矩阵中有以下几个概念:

    TP(True Positive): 被判定为正样本,实际也为正样本

    FN(False Negative):伪阴性 ,被判定为负样本,实际为正样本

    FP(False Positive):伪阳性,被判断为正样本,实际为负样本

    TN(True Negative):被判断为负样本,实际为负样本

    另外模型的评判的时候大家会谈到如下几个指标概念:

    精确率(Precision):也称之为查准率,代指实际为正样本你预测也为正样本占整体你预测为正样本的比重

    precision=\frac{TP}{TP+FP}

    召回率(Recall):也称为查全率,代指实际为正样本你预测也为正样本占整体实际为正样本的比重 。换句话说可以认为,实际为正样本中你在预测中也正确预测为正样本的占比有多大。

    Recall=\frac{TP}{TP+FN}

    这些概念很绕,建议多读几遍,多思考几次,慢慢的就有了一个印象。

           所以在模型评判的时候我们需要把握最终看重的结果,比如在流失模型中,流失用户占比始终是小部分,那么我们要尽可能全的把这部分小样本数据找到,那么会更看重查全率,也就是Recall.

    利用Python来定义混淆矩阵如下:

    通过sklearn导入混淆矩阵

    from sklearn.metrics import confusion_matrix,roc_curve,auc,precision_recall_curve,average_precision_score
    from sklearn.model_selection import learning_curve
    import matplotlib.pyplot as plt
    
    def confusion_metrix(y,y_p):
        Confusion_matrix=confusion_matrix(y,y_p) #y代表真实值,y_p 代表预测值
        plt.matshow(Confusion_matrix)
        plt.title("混淆矩阵")
        plt.colorbar()
        plt.ylabel("实际类型")
        plt.xlabel("预测类型")

    通过调用sklearn的confusion_matrix我们就可以得到混淆矩阵,通过画图来画出对应的图形

    ROC(Receiver Operating Characteristic): 是一条曲线,由FPR和TPR的点连成。横轴是FPR,纵轴是TPR  

    TPR=\frac{TP}{TP+FN}             

    FPR=\frac{FP}{FP+TN}

    AUC(Area Under the Curve):ROC的曲线面积就是AUC值。AUC主要用于衡量二分类问题中机器学习算法性能或者泛化能力。

    下面截图ROC曲线

     

    ROC曲线重点了解下这几个节点

    (0,1)点:代表FPR=0,TPR=1; 最好的情况,所有正样本都被正确的预测了,并且没有负样本被人为是正样本。

    (1,0)点:代表FPR=1,TPR=0;最坏的情况,表明所有的正样本都被错误的认为是负样本

    (0,0)点:代表FPR=0,TPR=0;分类器将所有的样本都判定为负样本

    (1,1)点:代表FPR=1,TPR=1;分类器将所有的样本都判定为正样本

          如上图,有一条红色的虚线,y=x ,这条曲线的面积为0.5 ,这里是代表的如果是随机猜测的话,AUC=0.5.如果我们得到的ROC曲线在y=x下面,AUC<0.5,则表明分类器不合格,还不如乱猜测。

    在实际中由于侧重的点不同,所以我们需要明白侧重在哪,如果在实际中结果重在覆盖,我们应该更加注重True Positive高,如果是重在准确,我们则应该更加注重False Positive低

    那么怎么通过ROC曲线来判断True Positive和False Positive呢? 这里我们如果看到曲线越往左上凸越好,这样得到的True Positive 就越高,对应的False Positive越低,

    上图来自于我做的逻辑回归分类,最终得到的模型AUC=0.99。

     

    PR曲线: 是由精确率和召回率的点连成的线,横轴为Recall ,纵轴为Precision,

    在PR曲线中越右上凸越好,PR想要Precision 和Recall同时高

    如果样本表现的极不均衡的时候,哪个曲线更好呢?通过ROC曲线和PR曲线的含义,我们事先假设正样本非常少,负样本非常多,这样TN会非常大,将FPR拉低,最后的曲线会表现的非常好,但是我们再反过来看PR曲线,我们会发现曲线反而表现的没那么好。所以我们在判断的时候不能由单一指标来下决定。

    实现代码如下:

    def plot_PR(model,x_test,y_test):#绘制PR曲线
        y_pro=model.predict_proba(x_test)
        precision,recall,thresholds=precision_recall_curve(y_test,y_pro[:,1])
        average_precision = average_precision_score(y_test, y_pro[:, 1])
        ax2 = plt.subplot(224)
        ax2.set_title("Precision_Recall Curve AP=%0.2f"%average_precision,verticalalignment='center')
        plt.step(precision, recall,where='post',alpha=0.2,color='r')
        plt.fill_between(recall,precision,step='post',alpha=0.2,color='b')
        plt.xlim([0.0, 1.0])
        plt.ylim([0.0, 1.05])
        plt.ylabel('Precision')
        plt.xlabel('Recall')
    
    def plot_ROC(model,x_test,y_test):#绘制ROC和AUC,来判断模型的好坏
        y_pro=model.predict_proba(x_test)
        false_positive_rate,recall,thresholds=roc_curve(y_test,y_pro[:,1])
        roc_auc=auc(false_positive_rate,recall)
        ax3=plt.subplot(223)
        ax3.set_title("Receiver Operating Characteristic",verticalalignment='center')
        plt.plot(false_positive_rate,recall,'b',label='AUC=%0.2f'%roc_auc)
        plt.legend(loc='lower right')
        plt.plot([0,1],[0,1],'r--')
        plt.xlim([0.0,1.0])
        plt.ylim([0.0,1.0])
        plt.ylabel('Recall')
        plt.xlabel('false_positive_rate')

    学习曲线:主要用来提高学习算法性能,通过对学习中的过程进行判断,来进一步调整学习参数。来判断模型是否过拟合。

    我们通过绘制可以发现效果如下:

    对应实现代码如下:

    def plot_learning_cruve(model,x,y,train_sizes,n_jobs):#绘制学习曲线来判断模型的学习情况
        #构建学习曲线评估器,train_size:控制用于生成学习曲线的样本的绝对或相对数量
        cv=10  #ShuffleSplit(4,n_iter=3,test_size=0.2,random_state=0)
        train_sizes,train_scores,test_scores=learning_curve(estimator=model,X=x,y=y,train_sizes=train_sizes,cv=cv,n_jobs=n_jobs)
        #统计结果
        train_score_mean=np.mean(train_scores,axis=1)
        train_score_std=np.std(train_scores,axis=1)
        test_score_mean=np.mean(test_scores,axis=1)
        test_score_std=np.std(test_scores,axis=1)
        #绘制效果图
        ax1=plt.subplot(211)
        ax1.set_title('learning curve')
        plt.fill_between(train_sizes,train_score_mean-train_score_std,train_score_mean+train_score_std,alpha=0.1,color='r')
        plt.fill_between(train_sizes,test_score_mean+test_score_std,test_score_mean-test_score_std,alpha=0.15,color='green')
        plt.plot(train_sizes, train_score_mean, color='blue', marker='o', markersize=5, label='training score')
        plt.plot(train_sizes,test_score_mean,'o-',color='g',label='Cross_validation score')
        plt.grid()
        plt.xlabel('training samples')
        plt.ylabel('Accuracy')
        plt.legend(loc='lower right')
        plt.ylim([0.2,1.01])

    最后作图如下:

     

    展开全文
  • 数据分析模型篇—波士顿矩阵

    千次阅读 2019-09-03 23:21:11
    今天给大家介绍一个跟企业市场增长率和市场份额有关的数据分析模型—波士顿矩阵。 波士顿矩阵是通过使用企业市场吸引力以及所处的市场竞争位置来比较不同的产品(也可说不同战略经营单元)之间的具体情况。企业市场...
  • 业务分析模型,该怎么搭建

    千次阅读 2020-07-23 20:10:19
    很多同学最怕听“建模型”仨字。尤其是建立“业务分析模型”。往往自己辛辛苦苦搞得LR、SVM、CNN被业务方狂喷:你这都是啥东西!脱离业务!不切实际!所以到底什么是“业务分析模型”,又改怎...
  • 本文将分享数据仓库实践中的业务数据矩阵的设计经验,帮助大家在工作中快速理解业务并规划数据仓库体系。 本文将包含如下三部分内容: 分享业务数据仓库的概念的作用 举个栗子说明 一些思考 0x01 业务...
  • 参考百度百科  波士顿矩阵(BCG Matrix) 又称市场增长率—相对市场份额矩阵、四象限... 波士顿矩阵是由BCG提出的,这个模型主要用来协助企业进行业务组合或投资组合。在矩阵坐标轴是的两个变量分别是业务单元所...
  • ROS/RMS(Return Of Sales/Relative Market Share)矩阵也称做销售回报和相对市场份额矩阵,主要是用来分析企业的不同业务单元或产品的发展战略。这个模型认为,企业某个业务单元或产品在市场上的销售额应该与其在...
  • 我们经常面对一大堆模型评估的报表和指标,如Confusion Matrix、ROC、Lift、Gini、K-S之类(这个单子可以列很长),往往让很多在业务中需要解释它们的朋友头大:“这个模型的Lift是4,表明模型运作良好。——啊,...
  • 模型评估通常作为建模的最后一步,用于评估模型效果,判别该模型是否达到预期。连续性预测模型常用的是`MAPE/RMSE`,而分类常用`AUC/accuracy/recall/specify`等等。本文将介绍常用的评估指标,并对应指出各指标的...
  • 最近在复盘udacity 的机器学习的课程,现在来整理一下关于机器学习模型的评估指标的相关知识。...学习模型的评估指标常用的有几种:F-β得分(F1得分,F2得分等等,根据不同的业务实际需求来指定适合的β值),ROC...
  • 一提到案例分析就头疼的小伙伴们,分享BCG的经典波士顿矩阵,再也不怕案例分析啦!制定公司层战略最流行的方法之一就是BCG矩阵。该方法是由波士顿咨询集团(Boston Co...
  • 1.3 数据模型 第2章 工具环境搭建 2.1 MongoDB(单节点)环境配置 2.2 Redis(单节点)环境配置 2.3 Spark(单节点)环境配置 2.4 Zookeeper(单节点)环境配置 2.5 Flume-ng(单节点)环境配置 2.6 Kafka...
  • 利用离散时间型马尔科夫链及随机理论,构造了一个转移概率矩阵,并按照通信网业务特性,将需要预测的通信业务分为N个等级,定义了S={1,2,…,N}共N个状态空间,建立了通信网业务参量的随机预测模型。通过通信网的...
  • 关于模型的评估,内含有混淆矩阵以及ROC曲线、KS曲线在案例的详细描述和说明。还包括混淆矩阵的可视化,最大KS和最佳阙值与0.5、0.8阙值在ROC曲线的对比说明。
  • 将改增广矩阵中系数据很和常数矩阵分别写成列向量组的形式: , ,其中, 。注意向量的转置。 , 将要求解的未知量用向量组w来表示: , ,一个w行向量4个维度都相同,即一个w行向量是一个1维向量。  它...
  • 推荐系统-基于模型协同过滤理论基础与业务实践 1.SparkMllib库框架详解 Spark机器学习库 五个组件 ML Algratham算法 : 分类 , 聚类 , 降维 , 协同过滤 Pipelines管道 ---- Featurization 特征化---- ...
  • LDA是一个简洁、优雅、实用的隐含主题模型,腾讯效果广告平台部(广点通)的工程师们为了应对互联网的大数据处理,开发了大规模隐含主题模型建模系统Peacock,通过并行计算对10亿x1亿级别的大规模矩阵进行分解,从而...
  • 腾讯效果广告平台部的Peacock大规模主题模型机器学习系统,通过并行计算可以高效地对 10亿x1亿 级别的大规模矩阵进行分解,从而从海量样本数据中学习10万到100万量级的隐含语义。该系统应用到了腾讯业务中,包括 QQ ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 26,569
精华内容 10,627
关键字:

业务矩阵模型