精华内容
最热下载
问答
  • 5星
    201.98MB weixin_47723732 2021-01-01 19:17:28
  • 5星
    11.8MB guoruibin123 2021-05-21 15:45:32
  • 5星
    38.01MB weixin_44510615 2021-07-08 11:02:17
  • 5星
    111.52MB qq_28239511 2021-03-17 13:04:53
  • 5星
    387KB weixin_44510615 2021-06-23 18:04:15
  • 5星
    338KB m0_52957036 2020-12-23 08:59:45
  • 5星
    14.01MB qq_27595745 2021-08-08 21:31:06
  • 5星
    56KB weixin_40412037 2021-07-07 14:36:10
  • 5星
    887.34MB shaoyezhangliwei 2021-08-11 15:50:28
  • 5星
    15KB weixin_42759190 2021-05-08 14:09:29
  • 一、概念 什么是商业 B2B/B2C/B2B2C/C2B/B2VC 什么是商业运作供应链-产品/服务-销售渠道-(营销/风控)-用户-售后客服->财务表现+数据表现 商业运作组织有哪些? 前线(销售/渠道/业务)-中...什么是商业分析? 用数

    一、概念

    什么是商业 B2B/B2C/B2B2C/C2B/B2VC

    什么是商业运作供应链-产品/服务-销售渠道-(营销/风控)-用户-售后客服->财务表现+数据表现

    商业运作组织有哪些? 前线(销售/渠道/业务)-中台管理(市场/运营/公关)-后台支持(客服/供应链/开发)-战略决策(总办)

    它们关心什么?前线(卖货收钱)-中台(品牌客户产品线助力营销)-后台(供应质量服务)-战略决策(往哪走走多远走多快)

    解决商业问题的能力? 权力-魅力-创造力-协调力-执行力-数据分析能力

    什么是商业分析? 用数据分析方法,解决产品、销售、运营、营销等数据问题。

    解读商业数据的步骤? 找标准-做判断-业务含义-初步假设-预测走势-追踪标准-迭代假设-结论

    开展商业分析的步骤?清晰主体-明确概念-确定时间-了解原因-明确标准-审核现状-深入分析-输出结论

    怎么深入分析? 梳理问题-明确标准-整体趋势-初步假设-关联业务-深入细节-迭代假设-总结结论

    理解商业模式的关键? 业务模式-四大角色(产品/渠道/用户/运营)-部门-KPI

    什么是商业决策? 战略类->战术类->创意类->执行类->支撑类

    策略类决策流程? 方向->目标->内外部条件->关键行动->执行人->作战计划(数据要求高,关键是决定轻重缓急、先后顺序)

    创意类决策流程? 目标->需求洞察->市场评估->原型设计->上线测试->效果评估->优化调整(数据要求中,关键是创造力)

    **执行类决策流程?**目标->任务分解->人力物力配置->技巧培训->干->结果评估(数据要求低,关键是执行力)

    支撑类决策流程? 服务需求->任务计算->人力物力配置->技巧培训->干->记过评估(数据要求低,关键是执行力)

    判断流程? 定方向->定目标->定责任人->定方案->定计划->执行,出问题后,从后往前研究

    统计学方法只是工具,不是目的: 是多少->描述性统计;是什么->描述性统计、分组对比、方差分析;为什么->分组对比、相关分析、回归分析、决策树;会怎样->时间序列、回归分析、神经网络、回归树;又如何->层级分析、因子分析、神经网络、聚类、决策树

    数据分析的作用 是多少->用数据描述现状(量化);是什么->用数据标准判断好坏(标准);为什么->用数据找出问题原因(定位问题容易,找出真实原因难);会怎样->用数据预测未来趋势(信息越多越容易);又如何->用数据做综合评价(决策层最需要,现状、标准、预测都做好才能评估好)

    数据分析不能解决什么? 想不想(主观意愿问题是个人的事情)、能不能(客观限制问题需要研究政策而不是分析数据)、会不会(业务能力问题缺什么补什么,怎么销售怎么运营问销售问运营)

    怎么办? 可以将问题进行转化:想不想->用数据支持/否定支撑想法的理由;能不能->用数据预测可能性;会不会->用数据量化过往行为,找标杆

    商业分析输出成果有哪些? 取数-报表-专题分析-数据产品-数据模型

    二、思维-分析商业问题的思路

    数据指标是
    用数据表示的指数、规格、标准

    怎么制定指标?
    确定数据产生环节、确定数据产生系统还是人工记录、确定计算方式(指标包括:数据来源、时间范围、计算公式)交据采集的方式?人工来集(容户满意度、客户体验)、半人工采集(销售保单、库存出单表)、系统采集(系统订单)人工采集主观污染概率大

    看不懂指标怎么办?
    看指标是什么业务动作产生的,指标背后是具体业务动作与含义

    指标类别?
    过程指标和结果指标(越接近终极结果,含义越清晰),正向(与结果指标正相关,如商品毛利)、负向(负相关,如成本)、无偏向(无必然联系,如活跃率,不一定是越高收入越高)

    如何进一步读懂数据?
    计算增长率(发展趋势),计算分解指标后的组成指标的结构(确定重点),计算两相关指标的比值(看是否有相关关系)

    什么是指标体系?
    解释一个问题需要的多个指标(杜邦分析法),指标间有关系(并行-如加减关系,串行-如购买漏斗)

    怎么判断数据好坏?
    找标准,数据+标准=判断

    标准要符合什么条件?
    容易识别、界限清晰、区分度高

    如何找标准?
    趋势法、对标对比确定、自带标准(增长率、结构分析法(毛利率、成本率)、投产比)

    如何找结论?
    梳理指标->构建指标体系->找标准->单维度判断->综合判断->结论

    看趋势怎么下结论?
    找数据背后的驱动因素(周期性因素、周中周末因素、业务因素等)

    分析维度和指标变多怎么办?
    先梳理商业模式,确认业务流程,然后运用分析方法进行分析

    分析方法有哪些?
    漏斗分析法,但会产生更多指标,如多个渠道如何评价好坏,可以引入整体水平做参考;结构分析法,如投入结构与产出结构进行对比,可以判断ROI、效率,结构是否可以改变、流程是否可以优化、流量是否可以增加

    分析完怎么提建议?
    先了解现状、清晰问题目标、探索可行空间、推算ROI、提供渠道评级和流程数据、提出具体业务动作建议

    什么叫单维度分类?
    在某个维度上进行范围切割,如年龄段

    什么是两维度分类?
    就是矩阵法或分组对比法,即列联表

    什么是商业含义标签?
    虽然只有时间,但是可以根据场景分为工作日休息日、上下班高峰期等,赋予数据商业标签,因此要利用社会生活常识进行分析,才能给出更多建议

    分析时要按什么顺序? 先看宏观再看细节

    多维度、多时间下怎么提建议?
    从大到小、从尾(结果)到头(供给需求)->观测整体形态、再联系具体时间;多个信息结合才能更深入理解问题

    高级分析方法是什么?
    构建分析思路的基本方法:先解析题目,确定需要我们解决什么问题(常见问题:是多少、是什么、为什么、会怎样、又如何、想不想、能不能、会不会),然后找到常规方法(家人、要钱、优化流程),然后拆分成单维度进行分析(涉及部门越少越容易落地)

    销售分析基本原理是什么?
    一是加人加客(因为销售不能定价),但是新员工能力不足,新客源质量参差,因此要监控转化率;
    二是提高转化率,提高客源质量,提高销售能力

    用户分析基本原理是什么?
    找优质用户(需求强烈,价格不敏感,买了还买),不同渠道挖掘,但是要考虑渠道增长瓶颈

    促销分析基本原理是什么?
    以利润换数量(薄利多销),但是要预防薄利不多销情况,促销可以提高用户购买积极性(转化率)、提高用户数量、但是减低了客单价;分为全员促销和精准营销;精准营销需要条件(封闭的信息渠道、即时响应、个人参与,更适合互联网应用内开展,APP、会员券);促销敏感型人群

    综合性策略建议的基本原理是什么?
    如果预测了四种方案,按投产比挑选;基于此还可以提综合性方案(可同步执行的融合性方案)

    如何梳理问题现状?
    5w2h分析方法,标准的核心是共识
    在这里插入图片描述

    如何找原因?
    构建分析逻辑(逻辑树法),将假设归类,形成判断逻辑(如内部问题or外部问题),排除顺序(从宏观到微观、从外到内、从大到小),找到支撑/否定假设的数据

    如何分析宏观因素?
    趋势分析法,宏观因素影响巨大(pest,特别是p和t),数据表现有断崖式下跌和温没式下跌(缓慢);时间发生顺序非常重要,如果是在数据下跌滞后,可能还有其它因素;从局部看应该大家都下跌,如果不是,则宏观因素不是唯一或最重要的因素,找到不下跌的对象进行学习研究

    多因素下如何解析内部原因?
    外部因素的挑战在于难以量化其对内部的影响,因此主要从粗粒度的方向来判断,也拒绝用宏观因素作为借口;内部的挑战主要是因素相互叠加。通过单维度观测,看群体间的差异(用户、促销、渠道);要看整体发展趋势。

    什么是假设检验与趋势预测?
    分组做测试,但是测试效果是哪一方带来的效果?解决办法:不纠结一个点的效果,而是看整体目标是什么。假设越简单,越容易验证清楚。进一步解决方法:从大到小,确认测试输出(排除法)。第三步:设定目标。第四部:观察结果,推动决策。

    综合性汇报的方法是什么?
    首先回答是多少、是什么;然后回答为什么;第三回答又如何(打算什么方向);第四回答会怎样(怎么做)

    最高级的分析是什么?
    是体系化作战。最好的商业分析是简单的(目标确定、方法清晰、结果明确);要掌握每次行动后的变化;要找到合适的标准来源(推翻难度高:KPI考核法、老板期望法、整体目标分解法,推翻难度低:环比趋势法(季节因素)、走势分析法(会反弹)、同比趋势法(今年都差)、同类相比法(城市结构不同),推翻难度中:投入反推法(城市成本不同)、投入产出比法(整体成本提高))

    整体总结:看什么指标:什么维度细分;什么时间周期观测:树立什么标准;做出判断后怎么行动:记录哪些关键结果;常见的问题原因积累。

    三、工具篇-分析商业问题的六种工具

    内部数据如何分析?
    内部数据是非常有限的,目前问题的原因可能有周期性波动(看趋势线)、行业问题(行业研究)、竞品问题(竞品研究)、用户问题(用户调研)、产品问题(看产品用户的饱和度)

    怎么寻找问题原因?
    一般可以从内部、外部、态度、行为等方向进行研究;内部行为(数据报表、专题分析、数据模型),外部行为(行业研究、定性定量研究),内部态度(定性访谈定量调研)一六大工具

    什么是数据报表?
    报表的基本要素是指标、维度(时间等),常见趋势(生命周期、自然周期、突发事件):用途是监控情况、发现问题、简单分析,看是计划内(正常变化、检查过程)还是计划外(持续观察、解决问题)

    什么是专题分析?
    专题分析往往是一问一答的形式(问题是什么以及针对问题回答),题目往往是“行业+业务名+分析内容”,常见的三种形式:无假设(定位问题找假设),有假设但不确定(论证先验假设),有确定的假设(直接验证真伪)

    什么是定性访谈?
    就是有目的有规矩地问问题,是快速找到原因、快速形成思路的最好办法。分为内部访谈(掌握内部动向、数据背后的真实情况、驱动业绩的真正原因)和外部访谈(掌握竞品动向、找到参考样本、掌握用户需求、找到痛点场景、找到解决灵感);访谈步骤:了解数据->明确对象->设计问题->回收反馈->建立假设->验证假设

    怎么做好用户访谈?
    访谈前先做好用户分群(控制分群数量,8类是极限)、贴好标签,按照标签建立假设,保证每个群体有代表性人物(经验数据表明每群人数3-9人即可);设计问题时候开始以一个具体事件入手,不提概念(如你玩过xx游戏没有),然后深入问题(先讲事实再讲感受最后讲评价);回收反馈时尽量多打标签(如果没有年龄标签,可以考虑通过渠道识别);建立假设(通过人群标签建立假设,按照标签进行验证,比如年龄大的用户比年轻用户更可能在xx关卡失败,渠道来源一般为xx);数据验证,用数据情况验证假设是否正确,访谈的用户是个案还是大多数情况。

    用户访谈注意事项:
    不把自己当用户、不把想象当用户、不随便捞个人当用户:不做数据分析就去问,没有做分类,把所有人当成一类用户;提问不具体,不统一名词,不具象化形容词;提问预设立场,诱导回答;听到什么信什么,不做验证;验证不拆标签,数据一锅炖。

    如何通过访谈收集竞品信息?
    如店铺分布、产品、活动等素材,最终分析竞品对我们的影响;研究目的:竟品是不是最大影响?
    步骤:建立假设->收集信息->业务判断->验证假设(证伪更容易)。本质上不是关注产品,而是要关注用户需求。更广泛的宏观影响因素,用排除法证伪,找到短期内逆势的标杆。

    什么是定量分析?
    定量问卷《市场研究方法实务》,目前埋点数据可以取代很多定量问卷的用途;问卷本身的问题:样本数不够、代表性不够、抽样维度不够。所以要做问卷,先与想看结果的人一起谈好方案。用户有可能乱填。执行问题,填的人样本有偏,不能代表真实总体情况。

    什么时候用问卷?
    问卷更适合在采集不到数据的场景:用户(潜在用户、竞品用户、流失用户、潜水用户)、产品(概念收集、新产品测试、改版测试)、渠道(线下商品铺货、线下门店陈列、线下销售执行、服务流程监督)。问卷不适合用于探索性分析(用内部数据做较好)。能用系统数据不用调研数据、能用产品测试不做调研。一般只有没数据的传统零售企业大量依赖问卷。调研问卷更多是拿来背书用的。

    什么是行业研究?
    行业研究难度大,主要考虑的是如何利用行业研究报告数据。行业研究一般是政府机关、第三方机构、券商等发布的,有关整体行业发展情况信息。行业研究最核心问题:数据来源(一是自上而下,把行业里企业数据加总:二是自下而上抽样调研、反推整体情况);弊端(自上而下可能造假,未上市难以统计;自下而上可能抽样数据量小,反推可能过于夸张、幸存者偏差)。

    常见行业数据发布者的数据来源是什么?
    国家统计局:汇总大规模企业,中小企业抽样统计;券商:上市企业用财报,未上市凭经验估算;BAT:汇总自己产品的数据,补充调研数据:第三方机构:大企业财报汇总,从自己的样本库里抽样。

    行业数据的价值是什么?
    对整体趋势的判断。做行业基础情况的了解(用户、政策、环境);做整体发展趋势的判断(发展空间,速度);做竞争关系的了解。参考意义大于实战价值。一般只有大型垄断企业、大型金融机构有精力自己做行研(一方面有能力搞到内部数据,另一方面本身对政策敏感)。如果内部数据分析不出来,也不用指望行业研究能解决问题。

    什么是数据模型?
    逻辑模型(PEST,SWOT),经营分析模型(杜邦分析法拆解指标),查询模型(RFM,AARRR,按固定逻辑从数据库查询指标),算法模型(时间序列-基于统计原理计算,机器学习-真正的算法模型)

    算法模型类别有哪些?
    有监督(预测(回归,神经网络)、分类(决策树,相似度)、二元响应(逻辑回归)),无监督(分类(K均值聚类),关联关系(关联分析));
    模型的最大用处不是分析,而是替代人工劳动,替代大量重复劳动(图像识别:安防、医疗影像、自动驾驶;语义识别:智能客服、自动翻译;推荐系统、搜索系统、风险等级评估等等)。

    特点:特征多、评估标准客观、人工判断未必比机器准。

    如何应用算法模型到商业分析上?
    局限非常大,商业分析的特点是数据少、评估标准不确定、结果受人影响大。本质上商业发展是人做出来的,不是算出来的。

    算法模型有哪些应用场景?
    有监督:预测/分类-业绩预测,逻辑回归-外呼/短信/推送响应/风险评分卡;
    无监督:分类/关联关系-找分类的感觉;统计方法:相关(相关系数/回归分析)-需进一步验证因果关系,时间序列-需假设业务保持不变

    如何正确使用模型?
    事前:探索性分析,比如用户聚类,商品聚类,找业务规律
    事中:人力无能为力/已经尽力的条件下,再做优化(人力管控足够的情况下)
    事后:总结经验,形成固定套路。如时间序列预测业绩,客服外呼响应模型。

    六种工具的适用场景是什么?
    1、报表更适合发现问题;2、专题分析“专”在一问一答;3、模型适合特殊场景,固化经验;4、访谈适合深度分析,但要结合数据验证得到支持,否则是个案;5、定量分析不好用,除非特别缺数据,人力资源耗费不必建模低;6、行业研究基本少用,一般是已有结论后用来背书。

    常见的工作开展方法是什么?
    一是由表及里:报表发现问题,进行定性分析,然后开展专题分析,利用行业报告和定量分析辅助,输出结论,通过模型固化经验。
    二是由内而外:定性发现问题,分别通过报表和专题分析进行验证,可能还要行业报告和定量分析,伪命题则持续监控,真命题则深入分析,用模型固化经验。

    商业分析的要点是什么?
    掌握真实情况,将所有内外部信息用数据表现出来。

    影响分析的铁三角
    时间、成本、质量

    如何利用工具分析?
    利用报表监控过程,不要干等专题分析,在具体场景下谈模型,把数据融入定性访谈中,收集定量问卷和行业研究但不依赖于此。透过数据看本质。

    四、套路篇-常用商业分析指标与分析套路

    什么是商业分析体系?

    就是企业的导航:锁定目标->提供多种方案->提供合理预测->及时跟踪行程->用上就忘不了。

    目标:用数据量化目标,验证目标可行性;现状:数据量化现状,发现问题/机会点;

    战术:数据指导战术设计,促成目标;预测:预测走势,选择合适战术;

    监控:监控执行进度,发现问题;

    复盘:数据总结、沉淀经验,指导后续工作。

    传统企业如何设计?

    杜邦分析法拆解,基于眼前和长远,风险和收益来设计整体战略。基于行为分析、基于特征(固定属性)分析、基于模型分析。

    互联网企业如何设计

    AARRR。重要的是增长率和发展态势(我明天能挣钱)。中介模式就是供需匹配成功率。明确核心指标(北极星指标),明确方向(增长or收益)。活跃指标、付费指标等。

    经营分析的含义?

    对经营状况宏观指标进行的分析。关注的是:目标、趋势、策略、责任、结果。核心是轻急缓重、大小多少。关键点:部门KPI。

    销售分析的含义?

    对销售状况进行的分析,辅助销售。销售的分类主要靠“谁来卖”(销售主体)区分。销售目标层层分解。监控最重要。明确流程,分解流程定位问题。从产品、用户、对手、运营等角度进行深入对比分析。确定是否宏观问题、是否市场营销运营配合活动支持、是否价格问题、是否门店问题、推哪个产品线哪个组合更容易达标(先大到小,先外再内,先看战术再看细节)。应对方法是从一线队伍里找标杆,复制战术。

    用户运营分析的含义?

    用户(拉新、促活、留存、转化)问题进行分析。

    输出成果:目前现状如何、哪里有问题、能做什么去改善。对于转化,互联网企业与产品有关,传统企业与销售有关。

    用户分析两层意义:用户运营本身的需求,了解用户活跃留存转化状况,为制定用户运营计划,会员规则等提供支持;作为基础分析,支持其它工作,如活动设计、文案创作、销售策略等。掌握业务基础运营数据(RFM)、定义核心用户/核心场景(特征、行为、消费,确定后引导用户向核心迁移)、识别业务发展阶段&主要问题(不同阶段关注的指标不同:孵化期(产品体验、种子用户)、扩张期(新增用户、用户活跃)、补贴退出期(用户转化、用户活跃)、常规运营期(用户留存、核心用户))、关注核心指标组合、控制非关键指标、先判断轻重缓急再考虑对策、掌握业务动向形成预判、重点问题深入分析(优先把控自己可以控制的,防范其它白犀牛问题;事件型波动大、系统型可把控、持续型要持续积累和关注)、活跃留存流失联合观测。

    活动分析的含义?

    针对短期活动(促销、推广、拉新等)进行分析,

    输出成果:活动效果、用户有什么问题、能改善什么怎么办?快速理解营销活动的三个核心问题:是否考核销售(是则品牌类)、是否全公司参与(是则大促类)、是否封闭信息(是则精准营销类)、服务对象(商品、用户)。

    活动要素:规则(目标群体、参与条件、达标要求、奖励力度)、组织(礼品选择、物料准备、系统上线、活动运作、物流售后)、宣传(宣传渠道、宣传主体、发布节奏、内容制作、落地页面、转化路径)、费用(预算范围、成本使用、效益估算、投产比)。

    活动分析类重点:为了特定目标开展的、短期、大力度的行动,整个分析围绕目标展开(是否达成目标、未达成原因、达成的话是否效率可以优化、达成目标后对整体经营有何影响)。活动分析,定好目标是成功的一半、做好监控是另一半。

    活动分析步骤?

    步骤:目标达成率(达成总结经验、未达成找原因)

    ​ ->先复盘活动执行过程(设定目标、洞察用户需求->选择产品->包装卖点->设计传播内容->选择投放渠道->投放用户响应->响应后服务跟进,分析时从后往前看,先看执行问题(上线时间问题、系统问题等等)、再看投放策略问题(渠道优化等))

    ​ ->后复盘活动策略问题(事前Abtest或者事后同类活动对比)

    ​ ->多活动叠加分析(分散计算剥离每个活动的效益是不切实际的,将活动按目的分类,观测对宏观指标的影响)

    ​ ->关注整体效果(除了单次活动分析,要关注整体营销费用投入产出比,业绩是否过度依赖营销,隐藏的其它经营问题是更深入分析的起点)。

    内容分析的含义?

    针对公司发布内容(公众号、短信)回收(客服、评论)的内容。

    输出成果:主动推送-是否达成目标、被动接收-说明了什么问题。

    推送信息:推哪些内容关注点高、哪些内容吸引人注册、哪些内容带货效果好。接收信息:反映了客户、产品、品牌出现了什么问题。

    分析关键:打标签、分类别。

    内容如何打标签?

    硬推:主体、产品/行动、奖励、转化链接;

    软推:主题、内容、奖励;接收:咨询(产品信息、活动信息、门店地址)、建议、投诉(产品质量、售后服务、业务流程)。

    主动推送如何分析?

    • 第一步:清晰目标:硬推:信息到达多少用户、多大比例响应、转化率;软推:信息到达多少用户、引发二次传播、口碑。量化目标是分析的关键。

    • 第二步:检讨目标:是否达成目标?利用漏斗分析法判定是否达成目标,哪一个环节出问题。

    • 第三步:贴标签,分类深度分析问题(拆解标签:时间、卖点、内容、产品)。

    被动接受如何分析?

    • 第一步:将信息数量与业务行为关联(本质上被动接受的信息是由各种业务行为产生的客户意见,单看信息难以区分是个案还是普遍问题,一定要联系业务);
    • 第二步:整体解读信息,形成假设(先看整体、再归纳假设);
    • 第三步:分类验证,输出结论(孤证不立)。重点:从大到小的多级分类

    商品分析的含义?

    商品的进销存。输出成果:有没有货卖、有多少库存还要卖。

    • 服装:SKU多,换季速度快,库存压力大(生命周期6-8周);手机/电子产品:单价高、资金占用多、降价速度快;
    • 生鲜:SKU多、库存成本高、腐败速度快;
    • 医药:同生鲜。商品生命周期:导入期(铺货)、成长期(走量赚利润)、成熟期(控制库存、逐步退出)、尾货期(甩货、清库存、减少库存损失)。
    • 产品类别:未来爆款(培育)、防守型产品(人有我有)、交叉类(和爆款交叉销售)、引流类(入门级销量大、利润薄)。不同分级决定了生命周期不同。

    管理基本原则是什么?

    畅销品不断货、不畅销少积压、资金动起来——基本做不到。往往是争取眼前毛利最大化+全生命周期价值最大化。常规监测、积累经验(对关键指标进行监控:商品生命周期、热销成都排行、补货周期、库龄、售罄率、库销比、周转率)。根据经验为每一类产品的指标设置预警值。问题预警,提示风险(:针对新品产品评级如何、如何配货,针对老品生命周期如何、进货节奏是否要控制;:热销还能持续多久,对其它品类是否有帮助,滞销商品是否有细分市场机会、进货/库存得控制在什么水平;:哪些已经库存警报,需要立即清货/控制进货)。

    找出路:配合业务需求,提供分析思路(前期:Abtest,测试用户需求;后期:哪些客群还没买、哪些地区还有需求、哪些产品可以搭配着带一点货、全生命周期赚了多少还能让多少利润来打折)。

    流量分析的含义?

    针对网站、网店、APP流量进行分析。输出成果:花了多少钱获了多少流量,流量质量如何。流量来源(开店位置)、流量入口展示(门店装修)、CTA(call to action,门店促销)。

    流量分析是:在哪里以什么形式展示(站外渠道、创意展示),用户进来后要做什么动作(注册、购买、转发……)(落地页,CTA),做完动作后获得什么(产品页、购买转化)。

    流量分析基本思路是什么?

    流量计价:CPM(mile)/CPS(sale)/CPA(action)/CPT(time)/CPC(click),因此要了解花钱是否起作用,常用漏斗分析法。

    流量分析难点:渠道创意产品三者交织,难以区分;流量造假严重。

    思路:关注整体目标,不断迭代降低成本,总结成功案例。

    第一步:整体需求测算(用户增长:要多少系用户、每用户成本、投入多少钱;电商运营:要多少流量,除了自然流量还要买多少,总投入),先设定宏观标准(总流量、单位或可成本、总成本),面对众多渠道时就有了分解目标的标准,考核最终成果时先关注整体目标是否达成。

    第二步:渠道分类&流量分配(根据历史数据找到渠道特点,细分渠道目标,配置资源投入)。

    第三步:创意&活动优化(步骤多的能否优化,能否提升环节转化率,对页面、流程、活动改进可结合abtest进行)。

    第四步:执行&调优(根据数据表现动态优化,减少劣质渠道投入,调整创意,观察效果)。

    第五步:总结&积累经验(优先关注整体目标&整体效率,再谈执行细节)。关注细节但不要陷入细节,数据分析的价值是:通过不断迭代,积累经验,长期降低成本,达成整体目标。

    如何从0搭建分析体系?

    五个要点:业务目标(为什么做)、相关责任(谁负责谁配合)、业务流程(步骤)、数据流程(哪里产生哪里记录)、管理流程(我可以做什么改变业务效果)。

    数据监控指标(从大到小的顺序):总销售任务是多少、分解任务(杜邦分析法)、过程指标(转化漏斗)、分类标签(竞争策略标签,方案/demo质量标签,跟进频次标签)。

    分析思路:是多少(做到了多少)、是什么(是否达标、趋势是否向好)、为什么(线索问题还是跟进问题)、会怎样(按目前转化率,是否能达标,做什么能达标)、又如何(核心问题在产品、营销、销售)。

    展开全文
    qq_41951254 2020-12-11 21:03:24
  • 5星
    1.78MB u010380670 2018-11-28 18:14:59
  • 公众号后台回复“图书“,了解更多号主新书内容作者:livan来源:数据python与算法前言上一篇文章中,我们分析了生态位,并总结了认知市场的方法《战略分析思路——沙盘推演逻辑》。在这一基...


    公众号后台回复“图书“,了解更多号主新书内容

    作者:livan

    来源:数据python与算法

    前言

    上一篇文章中,我们分析了生态位,并总结了认知市场的方法《战略分析思路——沙盘推演逻辑》。在这一基础上我们聊一下商业模式,企业的发展过程就是确定目标,设计商业模式,并在满是竞争的环境中实现成长和盈利的过程,而企业的发展方式也取决于模式如何设计。

    随着互联网的发展,我们见证了一个行业从0到成熟的过程,而行业的裹挟也督促着商业模式日趋完整:从做连接,到做平台,再到生态,最终做数据,我们在最短的时间内经历了商业模式的完整过程,这一机遇,不可小视。企业的成长与商业模式的完善相辅相成,本文从一个小商贩开始,沿着历史的轨迹探索了主流商业模式的设计原则和运行逻辑,并在此基础上分析了平台型的商业模式,总结了商业模式分析的主要思路,在生态位的基础上与大家聊一下商业模式的拆解和设计。

    一个最简单的商业模式应该是什么样子?

    雏形

    市场经济刚刚兴起时,我们在街头巷尾经常会看到拎着货品篮子吆喝叫卖的小商贩,这种商业行为就是最早的商业模式形态:自家使用有所盈余,拿出来卖给大家,以赚取相应的利润,画成商业图形即为:

       这个是最早期的自营模式,看似简单,但模式中包含了完整的商业元素,我们来仔细分析一下:

       商业模式的现状是产品自己自足的同时产生物料盈余,目标是获取一定程度的利润,为了达到盈利的目的,商贩消耗自己的时间和物料,将其转化成商品,出售给邻里乡亲:

       所谓商业模式,即为面对现状,明确目标,并通过一定的模式建立两者关联,实现物料向商品转化的过程。正如上图所示,这一模式中包含的元素有:人、财、物和信息,这四个方面在不同的商业模式中侧重各不相同,产生了形形色色的商业形态,我们用这四种元素拆解一下上图的模式:

       人:即自己和村里其他人,一个供给,一个需求,市场相对简单;

       财:即资金和利润,通过售卖商品,满足村里其他人的需求,获取对应的钱财,一手交钱,一手交货,交易也非常简单;

       物:即自己多余的物料和产品,通过自己的劳动,将物料转化为产品,并将其包装成商品出售,供、产、销全部由自己完成,商品转化的过程也非常简单;

       信息:即如何知道村里其他人需要什么和自己的产品如何让大家知道,在一个如此熟悉的村子里,沿街叫卖走亲访友是主要的信息渠道,拎着商品大街上喊两嗓子,四邻八舍都听得到;亲戚朋友逛一逛,“闲话中心”坐一会,村里需要什么,基本上也问的清,信息交互的过程原始又便捷;

       各个元素采用最直接的方式组合在一起,形成最简单的商业模式。

       但是,麻雀虽小,五脏俱全,沿着这一小小模式,我们思考一下如何评估一个商业模式的好坏,商业模式设计的基本原则有哪些?模式运作过程中会遇到哪些问题?

    画布

    工欲善其事,必先利其器,我们先介绍一个小小工具——商业画布

    文章一开始,笔者勾画小农模式时呈现了一个商业模式的常用画布,有兴趣的小伙伴可以了解一下,面对画布思考商业模式问题,是否感觉事半功倍呢?

    画布的样式如下:

       这一画布的名称叫Canvas,他将商业模式分成九块,如果我们将整个画布看成一个公司,则重要合作和客户细分是当下商业模式与外界的两个接口,一个输入,一个输出,模式通过关键业务将企业的核心资源整合成对应的产品(价值主张),然后通过渠道将产品推广给用户并实时维护用户关系的过程。整个过程产生的收入和成本会聚集在画布的下方。

    画布的价值在于协助我们建立商业模式的大局观,一个画布就是一个公司,勾勾画画就是模式,是不是很简单?事实远非如此,模式设计过程需要遵循一定的原则,模式的生长也需要有一定的逻辑,正如一个人生长的原则和逻辑,有目标,能克制,才能有所建树。

    原则

       在商业模式设计过程中,往往存在着三个原则:

    1)反论及延伸:商业模式的设计往往是反常识的,如上文案例,农户生产的产品通常是供自己使用的,使用盈余部分会出现浪费,而村中其他人又存在使用不足的情况,因此可以变产品为商品,解决浪费的同时又能贴补家用,一举两得。

    商业模式的创新性往往来自于反论是否巧妙,脱离常识,采用新的方法解决当下的问题,便是反论的立意,我们可以用一个图形来描述这一思路:

       反论的思路是很容易梳理的,但是做起来却未必简单,日本企业家近藤哲朗曾提到一个比较有意思的词,叫“时代领悟能力”,梳理常识逻辑已然不易,更何况提出反论。

       除反论之外,受时代、科技的限制,很多有所认知的商业模式难以轻松达到,例如:量子计算、基因工程等,此时便需要稍安勿躁,等时代的洪流和技术的进步向更深层次推进,商业模式就可以向更深层次延伸。

    2)八方受益:八方受益是在考虑商业模式的社会性,具备反论的商业模式都具有创造性和趣味性,然而只有反论结构却不一定会发展顺利,例如:3Q大战之前的腾讯,流量加持的商业模式所向披靡,却因缺乏关联方共赢的思路而成为全民公敌;改革开放刚开始的中国企业也因为只顾发展经济,忽略环境保护而带来一系列环境问题,间接影响企业发展。

    商业模式的设计往往会形成两个循环:一个是人为设计的,我们称作是增强回路,这一循环的转动会给企业带来利润;另一个是自然形成的,我们称作是调节回路,他伴随增强回路持续转动,调节回路一开始往往难以发现,随着时间的推移越来越明显,最终影响商业模式的运行。等两个循环持平,我们讲商业模式遇到了瓶颈。

    从八方受益的角度讲,调节回路的循环来自于利益相关方受到损失,久而久之,养痈为患。《可持续资本主义》一书的作者新井先生将商业模式运作的环境切分成八个利益相关方,并指出:企业经营需要考虑多方面的利益相关者,牺牲掉任何一方的商业都难以做到持续经营。

    我们简单的梳理了企业的八个利益相关方为:

    无论是模式设计还是模式评估,从全局出发,梳理商业模式对上图八个利益相关方的影响,能够更加丰富商业模式。八方受益的梳理过程是一个从更宏观的视角审视商业模式的过程,与前文中的大局观不谋而合。

    3)盈利的构造:商业模式的设计往往是以盈利为目的的,社会性和良心型企业也是从更宏观的角度考虑盈利问题。商业性是商业模式的根本。

    结合上述三个方面,我们梳理了商业模式设计和评估的三个基本面:社会性、商业性和创造性。下图可以看到三者的关系:

    Social围绕“是否具有社会性”,Business针对“是否具有经济合理性”,Creatvie则指“是否具有创造性”,社会性考虑“八方受益”,商业性考虑“盈利构造”,创造性考虑“反论及延伸”。然而,为了评估社会性进行八方受益判断并不容易,不仅在于“八方受益”的实现难度之高,还在于每个人对“做到什么程度才算八方受益”无法统一评判标准,当然,这也是商业模式迷人的地方。

    讲到这里,大家还记不记得上文小商贩的案例,这一案例是否符合上面三个原则呢?

    从自用到商用的转变体现了“反论”的思路,多余的商品换取资金也体现了商用性,从全村的角度审视这一商业模式的社会性,村里有人家有盈余,就有人家有不足,沿街叫卖实现了资源的宏观调控,减少了产品浪费,增加了各家的经济来源,带动了大家的积极性,同时也有利于村委进行资源的协调整合。巨大的利好引发全民浪潮,改革开放刚开始时私企林立,便是真实的写照。

    原则是设计过程中人为的思考框架,但是在具体运行过程中会遇到哪些问题?有哪些不尽如人意的地方?我们需要将模式投入到实际环境中,观察其运行逻辑,推敲每一个细节。

    运行逻辑

    商业模式的运作过程,也往往存在四个基本逻辑:

    1)因果链:因果链本身非常简单,就是因为、所以,因为有盈余,所以把拿出去卖,对于村里其他人而言,因为需要,所以购买,也是一个正常的逻辑。

    2)增强回路:这一思路来自于系统动力学,第一次在经管类资料中看到这个名词是在《第五项修炼》中,彼得·圣吉将系统论融入到了管理学理论中,从系统的角度分解企业中可能遇到的问题,并提出了系统要持续运作,就需要有持续的动力输入,即为正反馈,不断为系统增加能量,从而强化系统的因果逻辑。

    在上文小商贩的思路中,每次商品的成交都是一次正反馈,由于交易周期短,这种正反馈频繁发生,刺激村民持续生产,并想办法扩大产量,乡镇民营企业往往在这样的刺激中产生,推而广之,所有商业能运转起来,并快速扩张,都是因为走出了某种增强回路。

    3)调节回路:是不是找到了因果链和增强回路就可以持续增长?村里如此多村民,为什么有人越赚越多,有些人反而没了生意?问题的根本在于“消耗”,节能是生物的本能,所有的生物都会避免高能耗的东西,我们从“八方受益”的角度分解这一问题:

    客户方面:生产的产品是否切实满足需求?其他村民选择自己制造还是购买?定价过高以及未满足需求的产品自然会感受到市场的阻力,久而久之,生产者自身的消耗无法获取到正向反馈,自然有所衰减;

    经营者方面:需求的增加势必提高供给量,自身物料无法满足的情况下是否需要购买原材料?是否要扩大生产?物料开放的同时成本也会提升,成本会削弱利润带来的正向反馈,同时,自身的经营能力也会影响物料开放的规模,两相均衡,增强回路的效果进一步衰弱;

    贸易往来企业等方面:从一个村的角度来讲,供应链和竞争对手同时存在,需求和物料的总量相对稳定,走街串巷的人越来越多,竞争越来越激励,进一步加剧产品成本和经营成本,村里用来供给的物料也会在不断的竞争中奇货可居,“供需关系”天然就是一个调节回路。

    村委方面:良性的竞争能够带动村民的积极性,但是过于激烈的竞争环境会引发村整体的经济停滞甚至倒退,于是,村委出面,宏观调控,避免竞争过度,同时又防止一家独大。“行政手段与市场调节”又是一个强力的调节回路。

    除此之外,产品生产对环境的破坏、合伙人/债权人对利益的分割、员工及家属生活条件的满足都会成为影响村办企业发展的制约条件。

    4)滞后反馈:从物料投入到转化成利润需要一定的时间,使我们无法实时看到效果,这一现象即为“滞后反馈”,小农经济情况下,这一时间相对较短,但随着产量的增加,企业复杂度提升,滞后会越来越明显,正向激励也发生的越来越迟,而与此同时,调节回路的负向反馈也逐渐显现出来,企业资源被击穿,于是崩溃了。

    梁宁老师的《增长思维三十讲》中提到了一个词:“心理能量”,企业最核心的资源是什么?是经营者的心理能量,《总体战》中也提到“战争以一方失去战斗意志为结束“。战争如此,企业亦是如此。

    上面四个逻辑,落地到图形中即为:

       结合上面的小农企业,我们又能画出什么样的图形呢?大家可以发挥一下自己的想象力,笔者思路如下:

       图中也可以看出,正向反馈是经营者构建的,而负向反馈则是伴随正向反馈自然生成的,两者相伴相生,缺一不可。

    线下平台模式

       小商贩的模式可以说是比较早期的自营模式,自主生产,自负盈亏,但是市场的发展从来不是独角戏模式,有自营就一定有非自营模式,改革开放以来,中国非自营的商业模式主要有两种:

    1)“民营办市场,商贩唱主角”的市场型商业模式

    《大江大河2》中杨巡就是筹建了“杨子街电器市场”和“东海批发市场”两个平台型模式,主要是将小商户集中起来,以多品类吸引消费者,并从中收取租赁佣金的模式。

    2)“国营开大荒,垄断行业龙头”的国营商业模式

    国营企业因其关系结构较为复杂,承担的历史使命不同,商业模式较为固定,虽然改革开放以来国营企业也发生了从政府独资到股份制改革的变动,但其根本的模式与市场型商业模式大相径庭,因此,本文重点在于介绍市场型商业模式。

    平台模式主要是制定规则,维护买卖双方交易,在这一模式成型之前,国内市场存在两个阶段性的角色,其一是倒爷:在改革开放前后实现跨地域商品倒买倒卖的交易,主要起连接作用,牵线搭桥,成交收取佣金;其二是集市:改革开放后允许商户自由买卖,倒爷的舞台就谢幕了,各个村镇集中画出一块土地,允许商户之间自由买卖,但由于缺少对应的管理,集市交易非常混乱,一时间成为地域乱象。

    此时私营平台商出现了,筛选精品商户入驻,收取租金,统一对外宣传,不仅提高了市场知名度,也一定程度上保障了消费者的权益。过不多时,国外的超市概念传入中国,沃尔玛、家乐福、麦德龙等大型超市迅速崛起,线下平台模式得以迅速发展,平台所承担的角色也越发丰富,如下图:

       与自营模式相比,平台模式涉及的面更广,利益相关方更多,可延展性更强,同时又由于其自身所具有的市场话语权,很多商业大佬关注并践行这一模式,推动了这一模式的快速发展。

       我们先通过两个公司形态解读一下线下的平台模式,再结合现在的互联网场景分析新环境下平台模式的演进和发展:

       第一个即为百货商场这样的纯平台形态,类似于港汇、八佰伴、代购平台等:

       平台构建会设立品牌定位,进而选择对应的商场入驻,而后吸引对应的客户前来消费,从“八方受益”的角度来看,平台涉及的利益相关方为:

       平台在运行过程中,用户从进入商场开始在各个门店消费,单独完成支付行为,并拎包走出商城,我们能清晰的看到这一模式的增强回路:在同一商场一站式完成多笔订单,强化了对这一商场的认可,各个商户根据用户的购买行为丰富对应的商品,以便于展示更热门的商品,便捷是这一商场的主旋律。

       但是对于一个商场平台来讲,这一模式极度依赖于进驻的商家,用户的消费数据不会流入平台,产品的优化依赖于商家的数据处理能力,商家之间的组合只能依赖商城运营人员的经验,一站式的消费平台成长阻力明显:

       这一平台模式在起步阶段门槛较低,可以投入较少的资金,但是在可持续发展方面后继乏力。

       第二个即为超市模式的平台自营形态,类似于沃尔玛、家乐福、Costco等:

       这一模式在原来商城模式的基础上做了下沉:统一了各个商户,将商品买入再统一售卖给消费者,同时,还统一了营销、支付和物流体系,整个交易体系全由平台商掌控,不仅能保障消费者的权益,同时在商品协调、支付数据收集、用户喜好挖掘方面都能形成闭环,为个性化满足消费者提供极大的便利,“啤酒尿布的案例”就是发生在这样的环境下。

       数据的闭环在平台的商业环境下非常重要,运用得当的话可以辅助平台决策、协助调整整体资源,我们看一下这一模式的图形:

    数据闭环和交易闭环带来的不仅仅是对商品更高的控制能力,更多的是“精准”和“快速”,通过数据的探索,企业可以充分的获取到用户的兴趣爱好,企业的经营状态以及供应商的供给能力等,实现精准、快速的商品运营。完整的数据积累不仅能让平台更了解客户/供应商,更重要的是可以让企业和客户/供应商协同生长,培养平台与客户/供应商的粘性,挖掘更深层次的客户需求。

    闭环外,商业模式的可持续性扩展能力是衡量商业模式优劣的另一个维度,就线下而言:多长时间能聚集起“百万+”客户?多快的速度扩展到多家分店?如何将企业营业能力提升到稳定阶段?单店、单企业能够实现自盈利?品牌、口碑、广告和营销模式的价值就凸显出来,而线下营销模式中品牌/质量是营销的基础,在这一基础上采用广告和口碑交互式扩展的方式,持续扩大市场和模式。

    这一模式往往成型在高频快销的产品行业,因为低廉的价格、高频的需求不仅能够快速丰富用户数据,同时也满足低议价空间、消费场景简单、高质量保障的标准,能够有效保障平台的良好运作,降低平台的复杂度,更好的体现出“一站式服务体验”的商业要求。

    总结

    经过上面对商业模式的元素、原则和逻辑的梳理,大家是否对商业模式的设计和评估有一个深层的理解呢?在模式设计和评估中,我们需要做哪些考量?笔者梳理了相对重要的四个方面,如下:

    1)确定有哪些元素?

    2)梳理有哪些因果链和正负反馈?

    3)是否满足三大原则?

    4)滞后反馈何时发生?

    在梳理这四个问题的时候,如果再辅以商业画布,是不是会在脑海中勾勒出商业的全景图,这一文章我们勾画了线下平台模式的商业逻辑,下面的文章我们会仔细了解一下在互联网加持下的商业模式变革,谢谢大家阅读。

    ◆ ◆ ◆  ◆ ◆麟哥新书已经在当当上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的:
    
    
    
    数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。
    管理员二维码:
    猜你喜欢
    ● 卧槽!原来爬取B站弹幕这么简单● 厉害了!麟哥新书登顶京东销量排行榜!● 笑死人不偿命的知乎沙雕问题排行榜
    ● 用Python扒出B站那些“惊为天人”的阿婆主!● 你相信逛B站也能学编程吗
    
    展开全文
    weixin_38753213 2021-02-23 11:58:00
  • 评价一个事务需要从多个角度衡量,基本的分析流程包括理解商业问题、准备阶段、数据分析和解释结果,找整个供应链出现问题的主要环节;从点、线、面角度评价业绩;需要用到Excel、Python、MySQL等工具。数据粒度是指...

    一、商业数据分析概念

    1.商业数据分析引入

    先列举几个案例:
    (1)请估计一下2020年八月份在北京卖出有多少双鞋子?
    显然,这是一个很开放的问题,并不像在学校里的题目都有标准答案,是需要经过自己的思考、定义和分析的。

    (2)Corley主营在网上卖手机壳,根据销售数据,发现8月份比7月份购买手机壳的顾客数量下降了10%,怎么回事?
    这也是一个开放的问题,可以从内部和外部两方面来思考问题:

    • 外部
      是手机销售量下降了还是同行业竞争对手出现了,或者经济不景气?物流延迟?
    • 内部
      销售环节出了问题?哪一类用户下降?

    重点需要分析背后的原因,因此需要分析问题的能力。
    很多时候我们觉得学校学到的东西都没用,那只是因为我们没有将学校的知识与实际应用结合起来。

    2.什么是商业数据分析?

    商业数据分析从业要求:

    • 基础知识
    • 工具
    • 业务能力
    • 软技能

    举一个例子,拿学武功来说,武功秘籍就是基础知识,宝剑就是工具,在实际练武过程中就得到了面对不同武功和不同对手所需要的方法和技巧,慢慢培养出了业务能力,出神入化之后形成了自己的软技能。

    基于数据通过分析手段挖掘出商业价值,解决商业问题,并通过分析商业问题建立相应的分析模型。
    上面的几个案例都可以通过数据分析的手段得出结论。

    3.所需技能

    数据分析大致分为5个阶段:数据获取、数据处理、数据分析与建模、数据解释与呈现、验证及优化。
    这五个阶段在上述的基础知识、工具和业务能力方面又有不同的要求,具体如下:
    所需技能

    4.基本分析流程和供应链各个环节

    再举一个案例:
    (3)Corley卖鞋,2020年9月前10天就完成了本月计划的80%,业绩是好还是不好?

    可能有人会觉得好,毕竟三分之一的时间就卖出了大部分,但是实际上并不一定好:
    要看整个月的销售情况,如果前10天销量处于上升趋势,剩下的时间处于快速下降并保持很低的水平,有可能是完成不了计划的;
    还好看以前的销售情况,比如说同比销售额,是不是可能比现在还好;
    和其他竞争对手相比,是否比他们好。

    销量好或者不好需要从多个维度进行衡量,而不是单纯地给出一个答案;
    每个行业不同,相应的分析方法和思路也千差万别。

    一个基本的分析流程如下:

    • 理解商业问题
      根据具体的商业场景理解商业问题。
    • 准备阶段
      根据相应的商业场景进行计划和准备,需要哪些数据、怎么进行分析。
    • 数据分析
    • 解释结果

    供应链的各个环节如下:

    原材料供应商
    生产商
    经销商
    销售商
    终端客户

    分析时,不仅要从销售价格来分析,也要从源头即成本进行分析,处于供应链的哪个位置;
    找整个商业供应链出现问题的主要环节,找出问题。

    5.商业理解

    对于一个事件,会有很多因素,可能都会影响到结果。

    在商业数据分析中,需要进行多维度思考,包括产品、位置、时间等角度,比如零售业中有人、货、场的概念,如下:
    多维度思考

    从点、线、面的角度评价销售业绩:
    分析自己9月份业绩即为点;
    分析与去年同期相比即为线;
    与其他人相比即为面。

    获取知识的金字塔DIKW如下:
    DIKW

    从原始数据中提取出信息,并通过总结得到知识,逐渐积累成为智慧。

    6.需要用到的工具

    (1)Excel是最普及的数据处理和分析工具,作为Office三件套之一,受到各行业广泛的使用,也很容易上手。

    (2)思维导图工具,如XMind、Mind Master等,可以整理知识体系、梳理思维。

    (3)专业的Python数据分析工具Anaconda,可以进行Python基础编程、数据分析、建模计算等,自带了很多包,可以直接点击加QQ群 Python极客部落963624318 在群文件夹Python相关安装包中下载安装。

    (4)关系型数据库软件MySQL,是最常见的的数据库之一,个人一般直接使用社区版即可,可以到MySQL官网https://dev.mysql.com/downloads/mysql/中下载,由于官网下载较慢也点击加QQ群 Python极客部落963624318 在群文件夹数据库软件中下载,然后解压并执行安装配置即可,具体可参考https://www.cnblogs.com/zhangkanghui/p/9613844.html

    除此之外,还可以充分利用Github开源平台https://github.com/,可以查询一些开源项目、查看源码,是一个学习的平台。

    二、数据特性

    1.数据粒度

    数据存在特定的特点,其中之一为粒度
    较标准的定义为:
    数据粒度是指数据仓库中数据的细化和综合程度
    根据数据粒度细化标准:细化程度越高,粒度越小;细化程度越低,粒度越大。

    很多时候得到的数据为汇总的数据,比如对于电商来说,得到了每个月的销售情况,要预测每天的销售情况是不现实的;
    汇总数据可以获取整体趋势。

    而对于原始数据,可以为每一种商业模式确定相应的指标KPI,比如电商行业的常见指标如下:
    电商指标

    并且可以使用杜邦分析法评价指标组合进而确定经营业绩,示意如下:
    杜邦分析法

    对于Leader来说,很重要的一个要求是用户体验好,好的用户体验好主要包括以下方面:
    好的用户体验

    分析流程可以进一步细分如下:

    • 目标
      比如设定PV、DAU(日活)等指标。
    • 收集数据
      根据需求、按照指定的方法获取数据,并过滤掉无用的信息。
    • 数据探索
      发现收集到的数据的特点、分布特征,并探索数据间的关系。
    • 特征工程
      数据中哪些重要。
    • 开发计算
      进行建模计算、并产生结果,如线性回归、逻辑回归。
    • 评估

    假如有一个JSON格式的电影评分数据如下:
    计算相似性

    现在需要计算谁和谁更相似,对两部电影建立坐标系如下:
    电影坐标系

    每个人的评分都以坐标的形式体现出来,可以通过两者之间的距离计算出来,距离越近则相似度越高,最简单的方式是通过勾股定理计算;
    有多部电影则计算多维距离。

    2.数据质量与形式

    数据有一个很重要的特性是数据质量。
    根据定义,数据质量是指在业务环境下,数据符合数据消费者的使用目的,能满足业务场景具体需求的程度。

    比如说,调查问卷因为设计不好而导致收集到的结果有失客观性,这就是数据质量有问题。

    衡量数据质量有一定的衡量指标:

    • 重复
      数据重复是否有意义。
    • 完整
      数据探索时判断数据是否完整。
    • 一致
      数据之间是否一致,比如问卷数据前后部分是否符合。
    • 时效
      数据一般在某个时间区间内有效。

    数据还有一个特性是数据形式,主要包括:

    • 结构数据
      具有一定结构的数据,如MySQL数据库中的数据,对数据类型有一定的限制。
    • 半结构数据
      具有特定的格式,如之前的json数据就是半结构数据,一般来自网站。
    • 非结构数据
      文本、图片等文件,没有特定的结构,不能使用常规方法分析。
      对于图片文件,图都是有由像素组成的点阵,每一个像素点由RGB值确定,组成一个矩阵进行处理。

    不同格式的数据也有不同的来源。

    3.数据隐性

    可以从数据中挖掘出信息和价值。

    再举一个案例:
    (4)对于电商行业,怎么分析客户的男女比例:
    假如有一个客户叫孙悦,昵称是小悦悦,最近老是频繁登录公司的APP,并且总是浏览美妆产品,而且最近三个月购买了大量女鞋和美妆。
    那么孙悦是男还是女呢?

    要判断一个客户是男性还是女性,可以从以下指标出发:
    性别判断指标

    最简单的方法:

    男性概率=姓名倒数第一个字男性概率×权重1+姓名倒数第二个男性概率×权重2
    女性=1–男性概率

    这个模型只是依据姓名来判断的,较为单一。

    更进一步的分析:
    在姓名判断性别概率的基础上,再依据消费行为(如购买剃须刀)的特征判断性别概率,并确定权重计算加权概率。
    这是一个分类问题。

    进行数据分析的好处:

    • 搞清事实
      分析事情的好坏。
    • 接近真相
      可以发现真相的可能情况。
    • 预测未知
      比如预测消费曲线。
    • 帮助决策
      如智能投顾。

    三、数据分析类型、可视化与数据驱动开发团队

    1.不同类型的分析

    不同类型分析的复杂度和价值如下:
    不同类型的分析

    其中,描述性分析用于描述当前情况,比如分布、曲线等;
    诊断分析主要分析问题原因,可能需要进行可视化;
    预测分析主要预测未知,包括自动化推荐系统、销量预测;
    指导分析用于指导行动。

    随着难度的加大,所需要的数据也越来越多工具越来越复杂

    常见的分析框架如下:
    数据分析框架

    具体包括SVM、决策树、逻辑回归、神经网络、线性回归、K-means、分层聚类等理论模型。

    2.数据可视化

    有了分析的结果,需要进行报告,其中可视化不可缺少,需要将结果呈现出来。
    同时在数据探索时,数据可视化可以让我们更加直观地了解数据所呈现出的特点。

    一个图表示意如下:
    数据可视化反面示例

    显然,左右两部分都是有问题的:
    标题不规范;
    刻度不一致,不协调;
    坐标轴起点;
    两个表的差距感觉不同,但实际上差别是一样的。

    3.数据驱动开发团队

    一个典型的数据驱动开发团队的成员如下:
    典型数据驱动开发团队
    左侧负责数据分析,右侧负责项目开发,需要相互协调和配合。

    展开全文
    CUFEECR 2020-09-10 17:33:07
  • 5星
    6.01MB jiangjingjiu 2013-06-23 15:33:09
  • 来源:数据分析不是个事儿商业分析能力=商业理解+事实分析能力(主要依靠数据资源)。...先讲一个完整的商业分析案例:PAS是一家销售企业管理软件的公司,虽然整个行业欣欣向荣,但是这家公司的业务却陷...

    640?wx_fmt=jpeg

    来源:数据分析不是个事儿

    商业分析能力=商业理解+事实分析能力(主要依靠数据资源)。

    关于商业理解,千篇万律,已经讲了很多了。

    这里,想谈谈如何利用数据事实,分析商业问题,也就是如何练就“商业数据分析的思维能力”?

    阅读提示:

    全文10000+字

    案例故事+方法论,建议点赞+收藏,慢慢品读。

    先讲一个完整的商业分析案例:

    PAS是一家销售企业管理软件的公司,虽然整个行业欣欣向荣,但是这家公司的业务却陷入泥沼,销售额连续八个季度出现下滑。为了扭转此局面,PAS花重金招聘了过往销售业绩极为出色的老李担任CSO(Chief Sales Officer),直接向CEO汇报。

    上任伊始,老李为了摸清情况,召集销售、产品、售前、人事、市场部门一起开了一个沟通会议,没想到这个会议变成了吐槽大会。

    销售部门报怨人事部门给的候选人素质不高,经验太少。人事反击说是你们管理不善,有经验的老员工频繁离职,新入职的员工培训不够,不能快速成长。销售又抱怨公司产品功能不完善,在市场上的竞争力不足。而产品则回怼,已上线项目的客户反应良好,是你们销售能力不行。还有销售抱怨售前顾问不给力或者支持力度不够,还说市场部门组织的活动效果太差,获得的销售线索太少等等,不一而足。

    640?wx_fmt=jpeg


    在决定接受PAS公司的Offer时,老李已经做好接受挑战、迎接困难的准备。但是没想到实际情况比预想的更严重。虽然老李在销售方面有丰富的经验,但是PAS公司目前的问题貌似是全方位的,各个部门的说法听起来都有一定道理,但是哪些才是关键的问题?要想改变现状,又该从何处破局呢?老李不禁限入深思。

    在思路不畅、需要灵感时,老李喜欢到星巴克坐坐。在公司附近的星巴克,老李看到一个年青人正在写商业计划书,于是找这个年青人攀谈起来。原来这个青年叫小白,毕业于斯坦福。小白学成归来打算回国创立自己的商业数据分析公司,并且向老李介绍了数据分析在商业决策中的作用和案例,尤其是描述性分析、诊断性分析、预测性分析和处方式分析这四个层次和所用的具体方法。

    听完之后,老李觉得或许在PAS的事情上小白可以提供帮助,于是向小白介绍了自己面临的困境,并希望接下来在改造销售团队和提升销售业绩的过程中,小白能通过数据分析的方法提供有力支撑。当然他也想考校下小白,看他说的数据分析方法是不是有那么神奇。公司还没创立就接到了第一单生意,遇到这种好事小白欣然答应。

    1、描述性分析

    在进入PAS公司后,小白先对公司的业务现状和数据情况做了初步调研。PAS公司上线了CRM、ERP、HR等系统,针对商机、合同、付款、客户、价格、销售员的入职时间、接受过的培训等信息都是有详细记录的,这就为后续的数据分析工作打下了坚实的基础。

    在做描述性分析时,最重要的是结构化思维,即要把分析的问题或指标进行逐层结构化分解,直到无法分解为止。

    比如,总体销售收入=销售漏斗中所有销售机会的数量 * 每个销售机会的交易金额 * 胜率

    而每个销售机会的交易金额=每个销售机会包含的产品 * 每个产品包含的模块数量 * 每个模块的平均单价

    根据上述思路,小白首先对去年销售员整体的业绩情况做了分析:总体销售指标为 1亿2000万,已签单 1个亿,指标达成了83%,目前有100个销售员,平均每个销售员的签单金额为100万,这样看起来貌似还不错。但是再看下一项数据就会发现比较大的问题,仅有20%的销售员完成了销售指标。

    640?wx_fmt=jpeg


    通过查看去年销售员签单金额分布,这个问题体现的更明显,销售业绩主要是靠几个明星销售员来达成的。

    640?wx_fmt=jpeg


    再看去年整体销售漏斗的表现,整体销售漏斗金额高达5亿,而每个销售员平均的漏斗金额有500万,但是平均签单金额仅有100万,也就是说胜率仅为20%;另外,去年已完结的交易数量为1000,而销售员平均完成交易数量仅为10个,数量偏少;同样,平均的交易金额仅为10万,平均客户价值仅为20万,在企业管理软件行业,这两个数字都是偏小的。

    640?wx_fmt=jpeg


    接着分析新老客户平均交易金额及胜率,可以看出新客户虽然单子大,但是赢单的概率较低;反之,老客户虽然单子小,但是胜率很高。

    640?wx_fmt=jpeg


    下面再看新老客户对收入的贡献,可以看到老客户虽然平均交易金额较小,但是对整体收入的贡献还是远远高于新客户的。

    640?wx_fmt=jpeg


    再看交易金额分布及其胜率,可以看出单子金额越大,胜率越低。

    640?wx_fmt=jpeg


    以及不同产品的收入分布和胜率,A、B、C这三种产品收入贡献较高,并且胜率也相对较高,证明在产品、价格等方面在市场上有较明显的竞争优势,可以重点突破。

    640?wx_fmt=jpeg


    2、诊断性分析

    经过初步的描述性分析,对现有CRM、ERP、HR、售后、市场等5大系统或数据源中的数据做了梳理,共137个变量或KPI。如此之多的变量想通过传统的数据分析方法分析是很困难的(如通过散点图分析这些变量与销售业绩的相关性),只能使用机器学习的技术;通过此项技术,可计算出不同变量(机器学习称为特征)对结果值(即销售业绩)的影响到底有多大。具体结果如下:

    640?wx_fmt=jpeg


    去年销售员业绩达成率分布如下图所示:

    640?wx_fmt=jpeg


    根据上图把销售业绩分为三类:平庸,中等和优秀;

    其中平庸为业绩完成不到50%的;中等为业绩完成50%-99%的;优秀为业绩完成100%的。

    下图可以看到优秀组和平庸组在这12个关键KPI的差异:

    640?wx_fmt=jpeg


    可以看到:

    • 对业绩影响最大的变量为销售员销售的产品种类:业绩优秀的销售员,是所有产品都销售的;而业绩平庸的销售员,则只销售自己熟悉的产品。其次,业绩优秀的销售员,和合作伙伴的关系很紧密,销售线索可能来自于合作伙伴,甚至合同都是与合作伙伴联合与客户签订;而业绩平庸的销售员,只依赖于公司内部市场部提供的销售线索。第三重要的是平均合同金额。业绩优秀的销售员合同金额是平庸的销售员的2倍多;而较大的合同金额通常是因为每个合同销售的产品更多。第四重要的是销售漏斗金额与销售指标的比率。业绩优秀的销售员会在全年保持稳定的销售机会创造率,其每月创造的销售漏斗金额是平庸销售员的3倍。

    3、预测性分析

    再细致分析不同销售人员这12个变量表现:

    640?wx_fmt=jpeg


    通过上图可以看出,尺有所短,寸有所长。比如,85号销售员看起来大部分变量都处于平均水平或之下,但是其也有闪光点,这些人里只有他每季度创造的销售机会超过平均水平,那其他人就可以向他学习如何提升这一点。

    上图虽然可看出不同销售员在单个变量的表现,但是很难据此直接判断出其未来是否能完成业绩指标。如果可以做到这点,就可以把可能不达标的人提前找出来,进而给予其必要的帮助。

    这里就需要用到预测性分析,通过建立预测性模型,根据其关键KPI的表现情况,即可以预测其业绩达标情况。小白根据历史数据训练出的预测模型,预测的准确率已经达到了95%。

    4、处方式分析

    预测模型完成后,即开始发挥作用。根据模型预测,刚入职一年的销售员小王很难完成今年的业绩指标,虽然其很努力,每月创造的销售机会比均值高不少,销售漏斗金额与销售指标的比率也OK,但是在部分关键指标表现不佳:

    640?wx_fmt=jpeg


    对销售业绩影响最大的因素之一就是合同的平均金额,目前均值是180K,但是其只有25K。

    另外,看起来他不怎么和合作伙伴一起合作,公司平均60%的合同是和合作伙伴一起打单打下来的,而他的比率是0;而有合作伙伴参与的订单金额是没有合作伙伴参与的订单金额的6倍,胜率也更高。

    因此,小王的直属主管找他沟通后,建议他着重提升合同的金额,并给出了以下改进措施:

    • 首先,主管给到小王负责区域的合作伙伴名单,以及以往公司与每个伙伴签署的平均金额,小王需要更积极地联系合作伙伴。其次,建议小王要提升捆绑销售软件的数量,公司平均有40%的软件都是捆绑销售出去的。主管给了小王捆绑销售占比较高的产品清单,以及在与合作伙伴和捆绑销售做的好的同事名单,要求小王找他们多沟通,看他们是如何做到的。

    经过一年的时间,PAS公司的业绩得到了明显的提升:

    640?wx_fmt=jpeg


    -------------------------------------------------------

    理论+方法论

    在上述案例中,反复提到了一个商业数据分析框架:

    • 描述性分析(Descriptive Analysis)诊断性分析(Diagnostic Analysis)预测性分析(Predictive Analysis)处方性分析(Prescriptive Analysis)

    这是著名的咨询公司Gartner于2013年总结、归纳、提炼出一套数据分析的框架,可以很好地解决企业内部的商业问题。

    640?wx_fmt=jpeg


    商业数据分析的根本目的就是要洞察数据背后的规律,基于此,企业可以制订决策、并采取相应措施和行动,进而达成想要的结果。这是商业数据分析的最大价值所在。

    描述性分析——发生了什么?

    故名思义,该层次主要是对已经发生的事实用数据做出准确的描述。比如某企业本月订单签约额比上月增加100万,至1100万,但是订单履约率从上月的98%下降到了95%,库存周转率从上月的0.8下降到了0.7。

    诊断性分析——为什么会发生?

    知道到底发生了什么,对我们的帮助不大,更重要的是,我们要明白为什么发生。比如经过分析,发现上文提到的订单履约率下降的原因是成品生产不出来,无法完成交付。而成品生成不出来的原因则是部分原材料的供应商未能按时送货,导致原材料不齐套,无法开始生产。

    预测性分析——什么可能会发生?

    基于上述两个层次的分析,我们发现了其中的规律,即原材料供应商的送货及时率会影响成品订单的履约率。假如上月某原材料供应商A送货及时率只有70%,通过建模,我们可以预测本月该供应商会使我们的订单履约率下降2%。

    处方性分析——该做些什么?

    有了预测性分析的结果后,我们无需再做事后诸葛亮,而可以运筹帷幄,在事前就采取措施。上例中,供应商A会导致本月我们的订单履约率下降,我们可能采取的措施就是把A换掉,但是现在有B和C两个供应商供我们选择,该选择哪个呢?通过分析和计算得出:选用供应商B会比选C的订单履约率高1%,因此建议选择供应商B。这就是处方性分析。

    四个层次层层递进,经过这四个层次的分析以后,可以对企业的决策和行动提供有力支撑。接下来具体讲讲,这4种分析对应的商业分析场景。

    描述性分析

    描述性分析做为商业数据分析的第一个层次,主要回答『发生了什么』的问题,接下来将对如何通过数据发现、描述和回答『发生了什么』的方法和工具进行介绍。

    一、方法

    1、了解业务场景

    如果想通过数据发现和回答『发生了什么』的问题,第一步并不是急急忙忙的直接去分析数据,而是首先要了解和还原数据产生的业务场景,包括:数据涉及到的部门和岗位有哪些,这些部门和岗位之间的业务流程是怎么样的,在不同业务流程中有哪些输入,对数据做了什么处理,又是如何输出和传递给下游部门的。如果不了解业务场景就去做数据分析,就如同盲人摸象,因此这一步至关重要。

    2、 探索性分析

    探索性分析又细分为以下三个步骤:

    ①提问,理顺初步分析思路和目标

    在了解清楚数据产生的业务场景后,可试着问自己一些what happened的问题。比如,本月销售额是多少?环比和同比变化分别是多少?本财年销售的变化趋势是怎么样的?通过相应问题,可以理顺初步的分析思路和分析目标。另外,在上一步了解业务背景的时候,也要注意和相关业务的关键干系人沟通,获取他们想知道的what happened的问题有哪些。

    需要注意的是,这里说的是初步的分析思路和目标,因为在随后做分析的时候,新的灵感可能会被不断激发,分析的思路和目标也在不断调整,这是一个循环往复的过程。

    ②收集数据

    有了初步的分析思路和目标以后,就可以确定需要收集哪些数据了。比如上文提到的销售额分析可能用到的数据为销售订单数据、销售开票数据。

    ③选择相应分析方法

    根据分析的思路和目标,就可以对收集到的数据选择相应的分析方法了。具体的方法包括:

    • 对数据位置的探索,包括:最大值、最小值、均值、中位数、分位数等对数据分布的探索,包括:偏差、方差、标准差、茎叶图、直方图、箱形图(也叫盒须图)、密度图等对数据趋势的探索,包括:同比、环比、趋势图、条形图等对数据聚合的探索,包括:排序、筛选、计数、重复项、分组、求和、比例、条形图、饼图等

    3、提炼指标

    对数据做探索性分析后,可对数据反映的事实有一个直观的感受,比如,通过分析一个仓库的月度收发存数据,可以大概知道这个仓库的货物周转情况。但是要想更准确、简洁地描述发生了什么,还应该提出更高的要求:即总结和提炼出相应指标。比如描述库存周转的整体情况,库存周转率、库存周转天数等指标更有效。这些指标可以做为企业日常经营管理的KPI,让相关人员快速、准确地了解到企业当前的经营情况。

    二、工具

    1、个人使用

    描述性分析中最常用的工具就是Excel,但是随着商业环境中产生数据的增多,Excel的运行效率变得相对低下,并且Excel主要侧重于表格中的数字分析,但是因为人类对图形的敏感度和理解力天生就比数字高,正所谓一图胜千言,因此近年来可视化分析工具逐渐流行起来,此类工具主要是通过图形去对数据产生洞见,发现其中的规律,而不仅仅是用做结果的展示。

    FineBI就是其中之一。其上手比较容易,很多功能设计的也比较便捷和人性化,运行效率较高(10万行以上的数据FineBI较Excel有明显优势),输出的可视化图表也很美观,可直接用在数据分析报告dashboard里(Excel默认输出的图表都很丑,后期还需要做不少调整和美化,才能放到数据分析报告里)

    640?wx_fmt=jpeg


    2、企业使用

    对企业来说,描述性分析的工具主要是报表和BI。

    报表一般是嵌入至各专业系统中,如CRM、SRM、ERP、WMS、MES等。

    BI一般是单独的系统,其从各专业系统中抽取数据,经过处理后,通过表格或图形展示出来。过去Oracle的BIEE,IBM的Cognos,SAP的BO曾经在企业数据化建设上一度受欢迎,太犹豫这些工具过去庞大且上手难度大,在企业业务部门难以推广。后来出现了新一代的自助式BI,目前最受欢迎的有Tableau、Qlikview,PowerBI,国内还有一家帆软(没错就是我们)也被写入Gartner报表市场推荐指南。这类自助式BI之所以受欢迎是,商业智能分析平台市场的主流已经从IT部门主导的静态展示分析转向业务部门主导的动态探索分析,这样才能激发员工的主动性和创造力。

    报表目前最受欢迎的是帆软的FineReport,能制作各种复杂报表、以及数据可视化大屏。在报表和BI的基础之上,可增加预警系统,如对异常的指标进行邮件或微信预警,让领导仅对这些指标进行关注,而无需把所有的指标都看一遍,以节省时间,提高效率,有必要时再查看相应报表或BI展示,这也是企业描述性分析的应用方式之一。

    关于描述性分析的方法和工具,涉及到的知识主要是统计学的内容,这部分知识需要大家自行找相关书籍进行补充阅读。

    诊断性分析&预测性分析

    明确为什么发生以及未来会发生什么,这就是诊断性分析(Diagnostic Analysis)和预测性分析(Predictive Analysis)的作用。如何对问题做这样的分析:

    1、寻找相关特征(feature)

    在诊断性分析中,首先需要知道和结果可能相关的因素(在数据分析里,这些因素被称为特征)有哪些,这个过程一方面依赖于我们对业务的了解程度,另外也要多和业务人员进行头脑风暴,只要是可能相关的,都纳入考虑,也可以基于现有特征构造新特征,至于是否相关可在后面的分析中进行验证。

    比如和汽车油耗可能相关的特征包括:车重、排量、轴距、变速箱类型(手动、自动)、驱动方式(两驱、四驱)等。

    2、相关性分析(Correlation Analysis)

    列出和结果可能相关的特征后,下一步就是要验证这些特征和结果到底是否相关。具体方法包括:

    2.1 定性分析

    2.1.1 二维散点图

    若分析的仅是一个特征与结果的相关性,则可以通过画二者的二维散点图进行分析,通过图形描述,可以初步且直观判断二者的存在何种相关关系:正相关、负相关、无关;如果相关的话,是线性相关还是非线性相关(抛物线、指数等)。下图为不同性别年龄与身高关系的散点图,可以看出在青少年时期,这二者是呈线性正相关的。

    640?wx_fmt=jpeg


    2.1.2 矩阵散点图

    在现实中,仅有一个特征与结果相关的情况是少之又少的,大部分情况都是存在多个与结果相关的特征,此时需要矩阵散点图进行分析。矩阵散点图样式如下:

    640?wx_fmt=jpeg


    其实质就是针对每一个特征与结果分别做二维散点图,以分析其相关性。当然,在矩阵散点图上也可分析特征与特征之间是否有相关性,专业上称呼为多重共线性,多元线性回归要求模型中的特征数据不能存在有多重共线性,否则模型的可信度将大打折扣,此时需要排除部分特征消除共线性才能建模。

    2.2 定量分析

    上述的散点图分析仅能通过图形看出特征与结果的大致关系,即定性分析;但是无法对它们的关系做精确性描述,即定量分析;定量分析主要分为如下两个步骤:

    2.2.1 特征选择

    当我们列出可能和结果有关的多个特征,并通过散点图获得大致的直观认知后,还需要更精确的判断到底哪个特征与结果的相关性更高,为了降低计算的复杂度,我们应该只把那些最相关或者最重要的特征放到模型中,主要的方法有两种:

    单变量特征选择方法:常用的手段有计算皮尔逊系数(即相关系数)和互信息系数,相关系数只能衡量线性相关性而互信息系数能够很好地度量各种相关性,但是计算相对复杂一些,不过很多toolkit里边都包含了这个工具(如sklearn的MINE),得到相关性之后就可以排序选择特征了;

    基于模型的特征选择方法:部分模型本身在训练过程中就会对特征进行排序,如逻辑回归、决策权、随机森林等;

    特征选择不仅有助于简化计算,还可以帮助我们对特征与结果的关系有更好的理解。

    2.2.2 模型建立

    2.2.2.1 回归(Regression)

    若结果为连续值,则应用的模型为回归模型,包括:

    • 一元线性回归(Linear Regression)

    若仅有一个特征与结果相关,并且其是呈线性关系的,则可以进行一元线性回归,即建立回归模型y=a+bx计算出截距a和斜率b,x为特征(自变量),y为结果(因变量);

    • 多元线性回归

    上文中已经提到,在现实生活中,仅单个特征与结果相关的情况是不多见的,大多数都是多特征共同作用导致的结果。若通过矩阵散点图判断,各特征无多重共线性,且与结果呈线性关系,则可以进行多元线性回归分析,建立回归模型y=a+b1x1+b2x2+...+bnxn;

    • 非线性回归(Non-Linear Regression)

    如果回归模型的因变量是自变量的一次以上函数形式,回归规律在图形上表现为形态各异的各种曲线,称为非线性回归。常见的非线性回归模型包括:双曲线模型、幂函数模型、指数函数模型、对数函数模型、多项式模型等;

    那么如何获得上述的回归模型呢?常用的回归算法包括:最小二乘法、支持向量机(SVM)、GBRT、神经网络等。

    2.2.2.1 分类(Classification)

    若结果为离散值,则应用的模型为分类模型。比如人的年收入、日平均运动时间、日平均睡眠时间与人的寿命的相关关系是回归模型;而人的年收入、日平均运动时间、日平均睡眠时间与人健康与否(健康或者不健康)的相关关系则是分类模型。

    常用的分类算法包括:决策树、逻辑回归、随机森林、朴素贝叶斯等。

    2.2.3 监督式学习(Supervised Learning)

    上述回归模型和分类模型均是机器学习的监督式学习模型,它主要指通过学习历史的真实数据,找到其中的规律(即模型),并假设「历史总是惊人的相似」「太阳底下没有新鲜事」,通过找到的模型对未来进行预测。这一种学习方式相当于既包括了诊断性分析,也包括了预测性分析。但是,通过历史数据找到真正的规律是比较难的。在现实生活中大家应该都有这种感觉,回顾过去好像清清楚楚,但是展望未来时又是一片迷茫。这是因为实践和未来才是检验规律的唯一标准,但是在未来还没有发生的情况下,检验只能依靠历史的数据,这样非常容易出现机器学习中常说的过拟合和欠拟合的问题。如何评估机器学习模型的效果,避免过拟合和欠拟合的问题,找到那个真正的规律,业界提出了很多的方法,限于篇幅的原因,只能在其他文章中下回分解了。

    3. 因果性分析

    诊断性分析的隐含意思就是,要找到事物的因果关系,即因果性分析。所谓因果性,假设X是因,Y是果,则只要X出现,必然会导致Y的发生,其是百分之百的概率。

    虽然我们在上文中介绍了相关性分析,但是需要特别注意的是,相关性分析并不等同于因果性分析,相关性分析可达不到百分之百的概率。比如,虽然收入与个人的健康有很大的关系,因为收入高的人可以享受更好的物质和医疗,但是并不意味着有钱人就一定健康,现在有钱人英年早逝的新闻经常见诸报端,因此我们只能说收入与健康是呈相关性,而非因果性。

    但是,在现实世界中,很多事务的因果性是很难被证实的,因为其追求的是百分之百的概率,一点差错、一个反例都不能出。「吸烟有害健康」这句话听了很多年,现在听起来貌似这两者之间存在因果性,但是其实它们也是相关性,只不过是强相关性。因为要证明所有吸烟的人健康都受到了影响,这件事是很难的。

    所以,回过头来,做诊断性分析时,我们依然要从相关性分析出发,并结合相关领域的知识,通过逻辑推理,对分析的结果进行合理解释。因此,在使用机器学习的模型时,也要注意其可解释性。

    另外,在大数据时代,我们看问题和分析问题时,也要转换自己的思路,从以往的寻找确定的因果性改为寻找强相关性。

    最后,这里要特别推荐著名计算机科学家吴军博士所著的《智能时代》,对本节内容解释的更精彩,推荐大家阅读。

    处方式分析

    处方式分析回答的问题是:为了解决这个问题,我们该做些什么?或者说,为了达到某个目标,我们该朝哪个方向努力?

    那么如何通过处方式分析给出相应问题的解决方案和行动建议呢?

    首先,还是要进行描述性分析。通过描述性分析明确现状和问题,及业务人员和管理人员的需求,这样才能做到有的放矢。

    其次,进行诊断性分析,寻找和当前问题相关的特征,并对其进行建模。

    上述两个步骤在前面的文章中已经做了详细介绍。

    最后,根据不同的业务场景和需求,给出具体的解决方案和行动建议。具体方法又分为以下三种:

    1. 预测性分析

    有一些情况,仅仅使用诊断性分析和预测性分析的模型,即可以给出建议,比如银行可根据申请人的基本信息,包括学历、收入、是否有车、是否有住房、存款金额、是否有违约记录等,去建立模型预测其信用违约的风险有多大,进而给出建议是否要给这个申请人发放信用卡,如果要发放,信用卡的额度又该是多少。

    2. 仿真(Simulation)

    仿真就是通过建模模拟真实世界的系统或流程,并通过不同的输入参数或条件查看其对结果的影响,据此制订相应决策。仿真在各行各业已经有广泛的应用,比如军事上初级的沙盘推演、中级的电脑模拟对抗、高级的实战演习,都是仿真。再比如飞机设计时初级的软件CFD(计算流体力学)仿真、中级的风洞实验、高级的试飞,也是仿真。当然,越高级的仿真付出的成本就越高,所以在商业环境中,主要是通过在电脑上做数学建模仿真,进而根据仿真结果给出相应的解决方案和行动建议。比如企业的成本支出和客户服务水平是一个两难问题,往往成本的削减意味着客户服务水平的下降,那如果说企业要制订年度成本削减目标,通过仿真发现成本降低5%,但是客户服务水平仅下降1%,属于可接受范围,但是当成本降低10%时,客户服务水平下降达6%,可能对公司的经营、商誉等产生重大影响,则此时成本降低5%是相对合适的,而10%就不是那么合适了。

    3. 最优化( Optimization)

    最优化是应用数学的一个分支,主要指在一定限制条件下,选取某种研究方案使目标达到最优的一种方法。最优化问题在当今的军事、工程、管理、商业等领域有着极其广泛的应用。比如,企业都希望利润尽量高,那如何在现实的约束条件下,达到上述目标就是一个普遍的最优化问题。最优化常用的方法为线性规划、非线性规划、凸优化、整数规划、网络流优化(物流、电网、通讯网络应用)等。

    处方式分析是数据分析方法的最高阶形态,也是在商业环境中对企业最有用、产生价值最大的方法,因此希望大家未来不管是在做数据分析时,还是在设计数据产品时,都能以此为目标,我们一起共勉。

    展开全文
    lazyfisher 2020-04-01 12:44:30
  • duan_zhihua 2017-01-26 21:07:07
  • 2.31MB weixin_38502929 2021-05-07 08:15:58
  • yyxyyx10 2017-10-24 16:41:45
  • 999KB weixin_38744153 2019-09-20 21:04:34
  • EHorizen 2020-10-31 19:53:55
  • simon803 2012-06-05 10:21:15
  • weixin_43656359 2020-03-14 08:52:50
  • deng214 2018-06-26 10:25:29
  • weixin_42875245 2020-11-29 16:04:29
  • qq_44186838 2021-10-01 17:24:18
  • 2.5MB m0_52957036 2020-11-25 03:52:23
  • 431KB m0_52957036 2020-07-24 01:00:59
  • weixin_40873462 2019-05-20 18:32:37
  • junhongzhang 2021-08-02 00:15:11
  • hejnhong 2020-08-04 21:48:00
  • spark798 2019-06-24 15:56:26
  • yoggieCDA 2021-11-26 09:31:45
  • broadview2006 2014-04-17 15:22:17
  • weixin_45734379 2021-01-22 17:01:58
  • shenmanli 2014-01-16 15:36:43
  • weixin_45121855 2021-11-23 16:37:44
  • weixin_44636612 2019-03-21 18:04:29
  • qq_25948717 2018-11-11 15:46:11

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 18,787
精华内容 7,514
热门标签
关键字:

商业案例分析思路

友情链接: STM32-interrupt-note.rar