精华内容
下载资源
问答
  • 研究发现,煤炭企业环境信息披露程度的提高有助于提升企业价值,分析师关注在环境信息披露对企业价值的影响中起部分中介作用。研究结论有助于促进煤炭企业主动进行环境信息披露,为有关管理部门引导企业履行环境社会...
  • 新时期中国进口环境下电商企业的发展思路与策略.pdf
  • 数据分析思路

    万次阅读 多人点赞 2018-09-14 16:08:06
    而大部分我们所购买的书基本都是某一类工具如何使用去进行数据分析,但是看完过后还是不太懂什么是数据分析,应用到实际工作场景中照样很迷茫不知道该如何下手,这是什么原因呢?有的小伙伴会说:我想分析的根本没有...

    数据分析是在当今每个企业都所需要涉及的一门学科,数据分析的书随便一搜就会有太多教大家如何的去使用。大致能把搜到的书分为两类:第一类讲数据理论统计学相关的,第二类就是数据分析工具应用类型的。而大部分我们所购买的书基本都是某一类工具如何使用去进行数据分析,但是看完过后还是不太懂什么是数据分析,应用到实际工作场景中照样很迷茫不知道该如何下手,这是什么原因呢?有的小伙伴会说:我想分析的根本没有数!拿到的这个数也就只能做做折线图,同比环比两组数对比一下!业务当中发生了什么数据好像不能看出来!不知道一个函数得出的结果代表什么!还有可能我根本不会用一些工作等等。。。

    那为什么很多伙伴都想学数据分析呢?我想原因可能很简单:就是数据分析相关的岗位工资高啊!现在进入大数据时代不会点数据分析你具备核心竞争力吗?

    本文就以个人愚见来探讨一下如何去做数据分析。文章大致分四个层次分别为:需求层数据层分析层输出层。也是数据分析按重要顺序排的大体步骤。
    这里写图片描述

    需求层

    需求层为什么是最重要的呢?因为需求是数据分析的开始,也是你要分析的目标方向。如果你都不知道你要分析什么,还怎么谈如何分析?数据分析需求的来源往往有3种场景:1.监控到现有的指标出现了异常情况需要通过数据分析去找原因;2.公司要对现有的运营模式或者某个产品进行评估确定是否需要进行调整或者优化;3.公司下达了战略目标或短期目标需要通过分析看如何达成。要确定需求就必须与需求方进行沟通,清楚的确认需求的内容或者自己要分析前必须要清楚你想要的结果是什么方向。举个简单的例子:年底将近,双十一大促销在即,数据分析师们又到了一年最辛苦,最悲催的时间段。然而,有多少无意义的加班,是因为业务部门不会提需求所导致的。需求提的不合理,业务部门看了不解决问题,就会反反复复的再提需求。导致数据分析师们辛苦加班还不落好,背上一个:“分析没深度啊!”的坏名声。其实这不能怪需求方不会提需求,而是你作为数据分析人员要用你的经验,你的专业技能,你的沟通技巧去引导,去确定,去达成一致。

    所有要做到清晰的确定需求,需要自身具备:1、对业务、产品、需求背景有比较深的了解。了解的足够对你才能去引导去判断这个需求;2、光了解需求方是还不够的,你需要从获得的需求快速的去结合你所掌握的技能组工具有个初步的分析思路;3、综合判断后你再决定是否需要分析,应该怎么分析,与需求方沟通确定清楚两方理解是否一致。如果无法做到就会出现很多无法避免的问题。

    理论上数据分析师所从事的工作是给出业务方相应的数据结果,而不是解决方案。虽然也有分析两个字,但是如何设计解决方案是业务部门的事。运营部门就该做活动方案,产品经理就该出产品方案,销售部门就该想东西怎么卖。这才是业务部门的本职工作。吵吵着:“你说我不行,你行你上啊”是玩忽职守的扯皮表现。如果连具体的业务方案都让分析师来想了,分析师也干脆把业务部门的工资领了算了。但是当下专业的数据分析师是需要比业务方更了解业务,你不了解业务下的结论领导或者需求方感信任吗?所以,一个业务技术双精通的数据分析师,是可以替业务方搞定上边所有问题的,不依赖业务方的判断,因为他自己就是个业务高手,有丰富的实战经验与业务能力。但这种人是可遇不可求的。大部分数据分析师还是70%时间处理数据的技术男。

    在需求层我总结一下我们所需要了具备的能力:1、对业务、产品、需求背景有足够的了解,如果不了解说明你在这块应该先去充充电;2、然后当你无法想到分析方法的时候说明你对现有的数据不够了解。你同样该去了解了解数据的来源,数据的流转,数据的定义。


    数据层

    目标需求确定过后,现在的你就需要开始准备相关的数据了。数据层大致分为:数据获取数据清洗数据整理。有的伙伴会问,数据应该从哪来呢?数据来源取决于你分析需求,有直接从企业数据库通过SQL进行取数、有通过各统计网站进行数据下载,有通过爬虫技术在互联网进行数据抓取,也有通过企业已经加工好的数据报表,这里主要去讲在大数据时代如何去准备数据。因为利用数据库才能实现大数据下的真正核心分析,你才能配上数据分析师这次名称。

    大数据(Big Data)是指“无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合。大数据挖掘商业价值的方法主要分为四种1.客户群体细分,然后为每个群体量定制特别的服务;2.模拟现实环境,发掘新的需求同时提高投资的回报率;3.加强部门联系,提高整条管理链条和产业链条的效率;4.降低服务成本,发现隐藏线索进行产品和服务的创新。

    为什么大数据能实现这些场景?因为大数据的类型大致可分为三类:1.传统企业数据(Traditional enterprise data):包括 CRM systems的消费者数据,传统的ERP数据,库存数据以及账目数据等;2.机器和传感器数据(Machine-generated /sensor data):包括呼叫记录(Call Detail Records),智能仪表,工业设备传感器,设备日志(通常是Digital exhaust),交易数据等;3.社交数据(Social data):包括用户行为记录,反馈数据等。如Twitter,Facebook这样的社交媒体平台等。通过数据库你能取到已加工好的报表EXCEL所无法做到的多样性及细节化,你才能通过这些详细的数据找出数据背后存在的问题。

    现在的数据库主要分为关系类型数据,分布式数据库。关系类型数据代表产品为mysql(免费开源的),分布式数据库代表hadoop。两种都是实用sql语言进行数据提取,在数据分析中你将提取出来与分析相关的数据这步就是数据获取。这里你需要具备基础的sql语言能力,要从海量的数据中找到你想要的部分。这个环节你也能对数据进行初步的清理,这里取决于数据库中的数据存储是否完整规范。这里有一篇说数据库数据质量的文章推荐给大家数据质量管理。当你数据清理好也整理好后就可以开始进行数据分析了。


    分析层

    分析的工具有很多,平民版的分析工具有excel、非专业的专业分析工具有spss、专业资深的分析工作有sas/R/python。我的个人建议是在整个分析过程需要掌握的工具中为sql、excel、python。为什么是这三个,我先来说一下各个工具的特点。sql上文讲当它是数据获取的一个主要语言,而excel可以进行一下快速的数据展示(手动拖动点选快),Python功能强大几乎可以做你想做的任何事情不止局限于数据分析,学习优势绝对大于其他分析工具python能做的事情

    好了,那我们就利用Python来进行数据分析,分析的思路都是由”浅到深“。数据分析一般的步骤为:描述分析——锁定方向——建模分析——模型测试——迭代优化——模型加载——洞察结论。

    描述分析是最基本的分析统计方法,在实际工作中也是应用最广的分析方法。描述统计分为两大部分:数据描述指标统计
    数据描述:用来对数据进行基本情况的刻画,包括:数据总数、时间跨度、时间粒度、空间范围、空间粒度、数据来源等。如果是建模,那么还要看数据的极值、分布、离散度等内容。
    指标统计:用来作报告,分析实际情况的数据指标,可粗略分为四大类:变化分布对比预测;变化:指标随时间的变动,表现为增幅(同比、环比等);分布:指标在不同层次上的表现,包括地域分布(省、市、区县、店/网点)、用户群分布(年龄、性别、职业等)、产品分布(如动感地带和全球通)等;对比:包括内部对比和外部对比,内部对比包括团队对比(团队A与B的单产对比、销量对比等)、产品线对比(动感地带和全球通的ARPU、用户数、收入对比);外部对比主要是与市场环境和竞争者对比;这一部分和分布有重叠的地方,但分布更多用于找出好或坏的地方,而对比更偏重于找到好或坏的原因;预测:根据现有情况,估计下个分析时段的指标值;

    洞察结论这一步是数据报告的核心,也是最能看出数据分析师水平的部分。一个年轻的分析师和一个年迈的分析师拿到同样的图表,完全有可能解读出不同的内容。
    举个例子:
    这里写图片描述
    例子来源Data Science with R&Python

    年轻的分析师:2013年1月销售额同比上升60%,迎来开门红。2月销售额有所下降,3月大幅回升,4月持续增长。
    年迈的分析师:2013年1月、2月销售额去除春节因素后,1月实际同比上升20%,2月实际同比上升14%,3月、4月销售额持续增长。
    看到两者的区别了吗?2013年春节在2月,2012年则在1月,因此需要各去除一周的销售额,再进行比较。如果不考虑这一因素,那么后续得出的所有结论都是错的。挖掘数字变化背后的真正影响因素,才是洞察的目标。


    输出层

    都到这一步了,相信各位对数据报告也不再陌生了。这一步中,需要保证的是数据报告内容的完整性。一个完整的数据报告,应至少包含以下六块内容:报告背景、报告目的、数据来源、数量等基本情况、分页图表内容及本页结论、各部分小结及最终总结、下一步策略或对趋势的预测;
    其中,背景和目的决定了你的报告逻辑(解决什么问题);数据基本情况告诉对方你用了什么样的数据,可信度如何;分页内容需要按照一定的逻辑来构建,目标仍然是解决报告目的中的问题;小结及总结必不可少;下一步策略或对趋势的预测能为你的报告加分。

    这大致就是整个数据分析所涉及的四个大步骤,后面就靠大家自己努力学习和思考了。最后说一下一直激励我前进的话:科技改变命运,科技掌握自己手中,自己由心出发。

    展开全文
  • 电子商务企业内控环境与风险变化思路 摘要新形势下 市场经济不断发展现代科学技术不断进步各行各业面临着前所未有的机遇与挑战互联网技术在社会领域中的应用范围得到了扩大和拓宽电子商务企业基于日益发展的互联网...
  • 数据分析常用6种分析思路

    万次阅读 多人点赞 2019-03-19 14:20:57
    作为数据分析师,你是否常因为缺乏分析思路,而被以下问题影响到幸福感(甚至怀疑人生)? 1. 新上线某个产品,需要监控转化率效果,既要看总体情况,也要看细分渠道; 2. 策划营销活动,预算有限...

     

    文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。

     

     

    转自 | CrossHands  

    作者 | Ahong  

     

    作为数据分析师,你是否常因为缺乏分析思路,而被以下问题影响到幸福感(甚至怀疑人生)?

    1. 新上线某个产品,需要监控转化率效果,既要看总体情况,也要看细分渠道;

    2. 策划营销活动,预算有限,要看看选择哪些目标用户群、采用哪种方案带来的销量更高(更能拉动KPI);

    3. KPI又出现较大波动,待会领导估计要问起来,赶紧分析数据找原因;

    一个问题就是从天上随机掉落的食材,分析思维就是将这些奇形怪状的食材加工成“看得懂”的美味佳肴。既然要做菜,有哪些值得借鉴的“万金油”菜谱呢? 本篇会为你慢慢道来。

     

    01

    流程

     

    完成一项任务,通常需要一系列操作,比如做菜,得先想好吃啥,然后买菜、洗菜、切菜、炒菜。

     

    1.1

    行动步骤

     

    行动步骤就是先确定起点、终点(目标),然后将起点和终点的距离拆分成一个个小步骤,知道先做什么,后做什么。

     

    注:图中小黑点表示该步骤下可以选择的行动方案

     

    e.g. 常见的数据分析路径之一是SAS公司提出的SEMMA范式

    1. Sample,数据抽样,保证数据的效度和信度;

    效度是指数据的准确性,也指选择的数据和分析目标及业务目标是吻合的;

    信度是指数据的稳定性,要保证样本数据有代表性,且在一定周期内不能有过大的波动(否则模型不稳定);

    2. Explore,数据特征探索及预处理,e.g. 看数据的分布情况、对数据进行标准化等;

    3. Modefy,明确问题、模型选择、方案调整;

    4. Model,执行建模方案;

    5. Assess,结果评估(准确性、稳定性、是否符合业务预期、效益如何);

     

    另一个常用的数据分析范式是CRISP-DM,分为6个步骤:

     

    数据分析范式-CRISP-DM.png

     

    1. 商业理解:确定业务目标,评估现有资源,确定分析目标,制定解决方案;

    2. 数据理解:数据采集,探索分析,数据质量验证;

    3. 数据准备:筛选数据,数据清洗,整合数据,变量衍生;

    4. 建立模型:模型选择,检验设计,模型建立,结果评估;

    5. 模型评估:分析结果和业务目标匹配度确认,检查1-4步的执行过程,确定下一步行动;

    6. 结果部署:规划部署方案、监控和维护方案,输出项目报告,项目复盘;

    e.g. 一个报表上线的基本步骤如下:

    需求登记 --> 方案规划 --> 需求排期 --> 数据ETL--> 代码编写 --> 数据验证 --> 报表上线

     

    1.2

    分步转化

     

    要连续完成多个步骤,有的人“浅尝辄止”,有的人“半途而废”,有的人则是“善始善终”。

    产品转化的每个步骤都会有用户流失,好比100个人参加有9个关卡的淘汰游戏,每个关卡会淘汰10个人,整个游戏最终会剩下10个获胜者,把这个游戏看作产品,那么该产品的全流程转化率就是10%(游戏获胜率)。

     

    注:电商APP一般的转化漏斗

     

    e.g. 常见的电商流程如下:

    注册-->登录-->浏览商品-->加购物车-->支付-->售后

    将上述步骤整理成鱼骨图,每个大步骤下还可以拆分更细的小步骤;

    比如“支付环节”可以拆分为:

    收货地址确认--> 选择优惠 --> 选择支付方式 --> 输入短信验证码-->返回支付结果(成功或失败)

    e.g. 在用户运营理念中有这样一个转化公式:路人-->用户-->粉丝-->员工,先把围观的感兴趣的路人转化为用户,轻度用户是产品的使用者,中度用户是产品的“追随者”,重度用户则会主动参与产品的功能反馈和改进建议,在这个转化过程中用户的参与度逐步提高。

     

    1.3

    闭环迭代

     

    一般的闭环流程包括3部分:事前方案规划,事中执行监控,事后复盘总结。

    e.g. 营销活动

    事前:确定目标,选定用户,制定方案,确定检验标准等;

    事中:实时数据监控(是否达到预期),不同方案赛马,备用方案启用等;

    事后:对整个流程复盘,总结经验,CSS归类(Continue做先前已验证的正确的事,Stop做错误的事,Start做新的正确的事)

    常用的闭环迭代框架是PDCA,通过计划(P)、实施(D)、检查(C)、总结(A)4个步骤,循环迭代,螺旋上升。

     

     

    另外还要注意,在使用流程化思维时,除了常见的正向思考,也要逆向思考。

     

    02

    分类

     

    互联网时代最核心的经营理念是深耕客群,通过差异化运营提升ARPU值(Average Revenue Per User,每用户平均收入),而分类无疑是开展这项工作的重要前提。

    主要有4种分类方法:

    二分法,非此即彼,e.g. 网站新客、老客,贷款审批结果分为通过申请、拒绝申请等;

    并列分类,多个分类(子集)构成一个全集,e.g. 用户地域可以按省份划分,按年龄可以将用户分为70后、80后、90后、00后等,女性用户群体可以分为时尚丽人、都市白领、家庭主妇等;

    等级分类,e.g. 会员等级——铁牌、铜牌、银牌、金牌、钻石、皇冠,城市等级——一线、二线、三线、四线;

    矩阵象限,e.g. 波士顿矩阵,RFM象限

     

    注:图片来自网络

     

    分类的规则大致有两类:

    按主体分类,

    e.g. 按社会关系模型,用户角色可以是父母、配偶、子女、朋友等;

    e.g. 按照群体划分,可以分为一般情况和特殊情况、二八原则等;

    按属性分类,依据主体(比如用户)的属性进行类别划分。

    e.g. 用户画像时可以考虑以下属性:

    1. 社会属性:收入水平、学历、职业、婚姻情况等

    2. 位置属性:居住地、工作地、从手机端还是PC端登录等

    3. 生物属性:年龄、性别、种族等

    4. 心理属性:品牌偏好、购买行为、优惠偏好等

     

    03

    对比

     

    “痛苦来自比较之中”(没有比较就没有伤害),其实幸福也来自比较之中,痛苦还是幸福,取决于选择的参照点是高于还是低于你。

    对比就是找一个参照点,来发现两个数据间的差异量Δ大小如何。

    对比可以分为两类:横向对比、纵向对比。

     

    3.1

    横向对比

     

     

    和同类(竞品)比较,e.g. 对比不同品牌的女装的销售情况,不同销售渠道(地区)的交易情况;

    实验对比,设置实验组和对比组,对比两组或多组之间的差异,以确定人为干预(实验、方案)的效应。

    e.g. 比较不同的产品或运营方案的效果差异时,常采用AB Test,需要确保对比的两组或者多组在数量和结构上要具有可比性(e.g. 用户的来源、等级等需要匹配);

    和整体比较,e.g. 华东地区的销售情况和全国总体销售比较;

    做组间比较时,一定要确保样本的可比性(无论是在数量级还是在群体结构上),e.g. 对比两个时间段的交易情况,建议剔除掉大促和节假日(这些交易日的数据波动很大)。

     

    有两类不易察觉的样本错误尤其要提防:

    “辛普森悖论”,即两个样本单独得到的结论和样本合并后得到的结论相反。

    e.g. 如下表所示,单独看APP端和PC端,新客的转化率都是低于老客的,但是,整体新客的转化率却高于老客。

     

    注:以上数据仅作为说明概念使用,不代表真实场景

     

    “幸存者偏差”,即样本已经被容易忽略的因素筛选过。

    e.g. 问卷调查中,那些愿意填写问卷的用户本身就是对产品有高认可度;

    e.g. 产品漏斗转化流程中,处在不同环节的用户一般不能进行对比

     

    3.2

    纵向对比

     

    横向是和其他对象比较,纵向则是和自己的历史数据对比。

    常见的纵向对比有同比和环比,对比的周期根据实际情况可以按日、周、月、季、年等。

     

    注:一个常用的多组对比柱状图

     

    对比的时候,除了比较相对量,也要看绝对量,以合理地评估数据差异的大小。

    e.g. 0.5%的波动是大还是小,需要找参考点,如果历史波动最高也就0.1%,那么这个波动就很大。

    e.g. 公众号关注人数昨日环比增长20%(看着还不错),实际上才增加4个人,截止前天也就20个人。

     

    04

    关联

     

    看数据指标不要只看一个“点”,还要看一条“线”上的前后连接的环节,进而从“面”或“体”的角度去看整个大环境中都有哪些因素相互作用。

    对现象的分析可以参考简单的调节模型:

     

     

    其中:X是自变量,Y是因变量,M是调节变量。

    寻找关联关系时,不仅仅要找出对Y有直接影响的X(一个或者多个),还要找出影响X对Y作用的调节因素M。

     

    关联也可以分为同时关联延时关联两类。

     

    4.1

    同时关联

     

    即多个因素(X)同时发生作用一起促成了现象(Y)的发生。

    e.g. 电商网站销售的变化可能考虑的因素:

    用户:用户结构是否发生变化,是否有新的注册渠道,新渠道导流进来的用户质量如何;

    商品:品类结构是否有变化,e.g. 随着四季变化,服装类的种类也会发生变化;

    产品:多少用户使用旧版本或者新版本,产品某个环节有没有改版,产品的策略(商品推荐策略等)是否有变化;

    运营:前期的线上或者线下预热,商城的优惠力度,优惠涉及的人群等;

     

    4.2

    延时关联

     

    现象的产生可能存在延迟效应,要考虑当前现象(环节)的前置的“因”和后置的“果”。

    e.g. 今天上线的营销方案可能在几天甚至几十天后才会有显著的效应,今天交易量上出现的波动也可能是因为一段时间前产品或者运营策略上有改动。

     

    05

    层级

     

    要有结构化、系统化的思维,对影响因素自上而下的拆解和自下而上的组合。

     

     

    5.1

    自上而下的拆解

     

    可以理解为“分级钻取”,如同金字塔结构一样,先从总体看到二级分支,然后再看更细的分支。

    e.g. 支付成功率的影响,可以对新老客、订单来源、支付方式、银行通道一层一层拆解,细化各个分支对整体变化的贡献率;

     

     

    e.g. 销售额 = 下单人数*客单价 (a)

    从登录到下单是层层转化后的,所以

    下单人数 = 访客人数*浏览转化率*购物车转化率*支付转化率 (b)

    公式(b)代入公式(a),得到:

    销售额 = 访客人数*浏览转化率*购物车转化率*支付转化率*客单价

     

    5.2

    自下而上的组合

     

    就是将个体组成群体,将小的指标组合成一个综合指标。

    e.g. 用户的标签分为基础标签和复合标签,基础标签就是单个用户属性来定义的(例如性别、婚否等),复合标签则是考虑多个基础标签的组合(例如,某个典型的用户群体画像是:女性+单身+白领+一线城市);

    e.g. 规划用户标签时,先用头脑风暴想出一批指标,然后进行归类、筛选、组合;

    e.g. 风控业务中累计坏账计提的计算,是将不同的逾期资金规定不同的风险计提比例,最后再把所有类别的风险计提资金汇总起来,作为公司所有贷出款项的风险计提资金,从而对公司贷款业务风险进行评估;

    举个形象的例子,自上而下好比国家财政拨款,从中央到省会再到各市县区;自下而上则像是国家征税,就是从各市县区、各企业层层汇总,直到报送国库。

     

    06

    优化

     

    分析的最终目标无非两种:寻找解决方案,寻找更好的解决方案。第一步是保证数据的准确性和稳定性,第二步就是优化,提高准确性、提高效率和效益。

    优化包含两部分的内容:缩小当前和目标的差距,直到达成并超越目标;在成本或者预算固定的前提下,使收益最大化。

     

    6.1

    缩小当前和目标的差距

     

    e.g. 全公司各部门各业务线的同事们都在追逐和超越KPI的路上;

    e.g. 机器学习建模时,尝试多种方案,调试各种参数,使模型的精确度逐渐提高

     

     

    6.2

    成本固定,最大化收益

     

     

    e.g. 对于信用贷款产品而言,如果把“最安全”放在首位,那么极端的方式就是不给任何人发放贷款,这样就不会出现坏账了。正确的信贷模型思维是将坏账控制在业务上可以接受的范围内,并使利息覆盖坏账,进而最大化收益。

    任何商业模式都是追逐利益的,首要目标是收益最大化,参考如下公式:

    利润 = 收入 - 投入成本 - 风险损失

    优化的过程就是寻找利润最大化的过程。

     

    小结:

    以上总结了常见的6种数据分析思路,涉及具体的业务场景还要结合业务特点适当变通。精通方法,深入业务,勤于实践,多加总结,最终就能踏上描述-->解释-->预测-->控制,步步高升的数据分析师精进之路。

     

    展开全文
  • 分析国有煤炭企业集团面临的形势和环境出发,查找企业集团内部管控中存在的问题和困难,提出煤炭企业集团内部管控体系的构建思路及建议,认为通过科学确定管控体系框架、建立合理的集团组织结构设计、强化煤炭企业...
  • 战略分析思路——沙盘推演逻辑

    千次阅读 2021-03-11 00:33:53
    本文笔者会继续沿用这一思路方法,从企业和个人增长的角度分析战略整体架构,并在这一架构的基础上介绍一个用于环境分析和机会定位的方法——沙盘推演。 战略分析架构 战略分析是一个基于大局观的分析方法,其自身...


    公众号后台回复“图书“,了解更多号主新书内容

    作者:livan

    来源:数据python与算法

    前言

    在上一篇文章中,笔者用三个维度粗略描述了行业地图的样式,并将行业的层级结构与人的基本需求建立关系。在企业眼中,人的衣、食、住、行等需求最终是通过人流、物流、信息流和资金流的方式得到满足,而企业的发展,多以创始人的思维模式为底色,所以企业以何种方式满足用户需求,与创始人的思维模式有极大的关系。

    (图一)

    在这一分析的基础上,笔者融合企业动态演化的过程,梳理了企业战略思维与个人增长模式的关系,得出企业就是人的结论:企业的发展经验可以从人的身上窥见一斑,而人的增长模式也可以在企业发展中找到借鉴,有兴趣的小伙伴可以回看一下上文《战略分析思路——企业就是人》。

    本文笔者会继续沿用这一思路方法,从企业和个人增长的角度分析战略整体架构,并在这一架构的基础上介绍一个用于环境分析和机会定位的方法——沙盘推演。

    战略分析架构

    战略分析是一个基于大局观的分析方法,其自身存在着较为严密的分析思路和架构,面对如此复杂的商业环境,最理性的方法是像服务器一样遍历所有信息,并得出最优结论,计算机的基本数据处理方法就是如此。

    但是,这一思路应用与人的决策却极不现实,因为人的脑力有限,很难有一个人能够看清整个行业环境,大多数决策都是基于不完全信息做出的,一个人是如此,一个企业也是如此。而且,如果没有具体的分析思路,大片的行业信息扑面而来,决策者很难作出有效的决策,最终只能根据自己以往的经验硬上一套方案,这一方案是否符合当下的问题?不一定,运气好成功了,运气不好没有效果,靠天吃饭,半半之数。

    有限的信息+指标提炼+逻辑延伸”成为决策过程中弥补信息不足的有效方法。

    指标的价值就在于提炼出环境中的关键规律,用几个很简单的数据反映我们所关心的一大片环境,以小见大、简单高效,例如:转化率,我们计算出用户从一个节点到另一个节点的变动;留存率,我们计算出当下位置,用户去而复返的频率;国家也会基于指标进行决策,例如:GDP、基尼系数等,充分衡量国民水平。指标的背后是一个个方案,构建并调整我们关心的指标是企业最常见的行动指南。不过随着数据量的增加,对指标的计算愈发困难,因此出现了细分,有专门取数的,有专门计算的,甚至有专门形成PPT的,细分极容易导致大局观的缺失,知其然不知其所以然,结果可想而知——内卷。

    战略决策需要有一个完整的思路,协助提炼大局观,完善逻辑推演。

    梁宁老师在《增长思维三十讲》中给出了一套较为宏观的战略分析思路,本节借用这一架构,聊一聊在企业和个人决策过程中常规的思维流程。

    笔者梳理了增长战略分析的基本逻辑图,如下:

    (图二)

       如果我们以一个武林高手的修炼之路来作比较,增长战略架构也有“练功夫”“走江湖”的区分,借用一些指标、工具,企业在战略地图中纵横拆解,找寻生存所需的生态位。所谓生态位是指在战略地图中确定出适合自己的位置,并基于此延伸战略,其本质上是一个战略定位的问题。

    在生态位的基础上,构建商业模式和竞争模式,并在当下环境和需求中优化组织结构,设计产品和运营逻辑,这些就是企业“练功夫”的过程。练好功夫是企业发展的基础,除此之外,关注市场机会,寻找破局点,并以破局点为支点,沿战略目标搭建杠杆,顺势而为,完成生命周期的跨越。在与市场的博弈中完善自己,就是企业“走江湖”的过程。

    流程的梳理不是为了形成定式,而是为了构建一个基本的思维认知,本文我们会借用沙盘推演寻找企业战略定位的方法,解决上面机会定位的问题。

    沙盘地图

    在介绍沙盘推演之前,我们先来了解两个场景:其一是《亮剑》中李云龙打仗的场景,每次作战他都有看地图的习惯;其二是《康熙王朝》中周培公为康熙绘制了全国地图,康熙为其守灵一夜的场景。两个场景中地图都是重要元素。

    在一场战争中,将领借助全景地图切分敌我态势,并依据自身的经验和方法论分析敌军接下来的动作,以做好应对之策,这一过程即为沙盘推演的过程(如下图):

    (图三)

       一场战争如此,一个公司更是如此,决策者心中首先要有的是如上“地图”,只不过公司眼中的地图不是由地形组成,而是各种市场元素,决策者要做的就是基于地图把控全局。上一篇文章笔者尝试构建了行业全景图以及用户的需求全景图,如下:

    (图四)

       两个图形是非常抽象的,在增长的角度上,我们加入了基于时间维度的经济周期以及空间维度的行业全貌,结合两个维度构建了如下立体图形,作为商业环境下沙盘推演的地图全景:

    (图五)

    上图中的资源和信息会伴随着经济周期、当下形势和技术发展有规律的流动。资源分配和信息流动往往存在两个趋势:熵增聚集。自然规律中事物的扩散总是倾向于熵增,不均匀就会产生势能,有序就会耗费能量,均匀无序意味着耗费能量最低,也是最稳定的状态,之前听到有些企业家的讨论:管理就是克服熵增,让组织变得有序的过程,而这个过程注定是反自然规律的。

    聚集是当资源的配置和信息的流动达到一定规模之后,会形成一定的马太效应,即:多的会越来越多,少的会越来越少,也就是说一个人越有钱就会得到更多的钱,信息越多就会得到更多的信息。想想不无道理,因为很多人的决策是在不完全信息的环境下作出的,而解决这一问题的最简单方法就是找寻市场上资源最多、信息最多的人并与之合作,久而久之,拥有资源和信息的人会获得更多的资源和信息,而资源和信息不足的人,只能依附别人或者无人问津。

    这也正是品牌重要的原因,他的价值不仅仅是让大家认识你,更多的是建立一套信任机制,让大家能够以最小的能耗,作出最正确的决策。市场中的企业总会面临这样一个拉力过程,一边是熵增阻止企业信息和资源的聚集,一边是马太效应形成对巨头企业的依赖。企业的产品如果无法让消费者减小决策能耗,推广起来会异常困难,更不要提建立品牌。从消费者的角度看,趋向于减小能耗的决策就是基于人惰性的决策,越简单的产品越受欢迎。

    商业的机会点大多是从这一纵一横的比较中确定出来:信息来不及传播到的地方,能产生更低能耗的地方,资源配置较少的地方,往往是企业生长的沃土。

    所以,何时熵增?如何聚集?是沙盘推演过程中重要的思考点。

    决策模型

    基于沙盘地图,我们会对市场有一个全面的了解,但是如果我们的认知只局限在这一个层面也就只能吹嘘胡侃,我们要做的是梳理市场与我们的关系,在行业和市场中找寻到自己的生态位,这其中涉及决策模型的问题,即如何做出决策。

    我们先聊一个场景:大家有没有喝醉酒的经历呢?三杯下肚,天旋地转,不知身在何方,最需要做的就是先确定我们脚踩在哪里?家在哪里?有多少力气可以支撑我们回家?

    看到这个场景有没有一些带入感?我相信大家都曾有喝醉过的经历,那种头脑中狂风暴雨,肠胃里万马奔腾的感觉简直刻骨铭心,这种情况下想要确定自己在哪里是非常困难的,而在信息决策中我们所处的状态也有过之而无不及,市场规模无限大,信息更新非常快,某个人甚至某个企业很难实时在线,获取全量信息,再加上信息的保密和实效性,决策者有时不得不用1%的信息,应对100%的市场,在这样的情景下做市场定位其效果无异于醉酒走夜路,非常困难:脑袋不清晰、眼睛看不见,偶尔听到声音,却未必分得清来自哪里。如果设身处地的思考决策的过程,内心有没有一种狂风暴雨,万马奔腾的感觉?

    这就是现阶段我们个人决策面临的问题,也是企业决策面临的问题。

    很疯狂但是很真实~

    信息不完整又必须做决策,我们所拥有的决策模型就变的非常重要。正如上文(图五)所示:如何探寻信息的广度?如何确定市场的深度?如何梳理经济的规律?决定了我们对资源的调配和方向的把控。梁宁老师在课程中提到阿里的决策四人组:马云负责信息的广度,四处与高人沟通,做最大的信息发散;彭蕾关心组织,把组织能力和价值落实到企业深处;曾鸣基于经济规律,着眼未来,做战略收敛;张勇基于业务和财务方面的能力,将决策落地;这是一个经过历史磨合形成的决策组合,也是对我们个人决策有足够启发的决策模型:

    (图六)

    如上图即为我们在面对沙盘地图时头脑中的念想:梳理事件的发展规律,在有限的信息中做最深度的逻辑思考,最终实现方案落地。

    做决策时还会牵扯一种比较微妙的心态,就是置身其中还是脱离现实:梳理好心中的地图,并与现实环境形成关联,将思维置身环境中,这种大局观下的思考方式是做出合理决策的基础,而对于喝醉酒的人而言,恐怕最关心的是自己的脚在哪里,大局观全无,没有大局观的决策,往往脱离现实,无异于猜。

    沙盘推演

    现阶段的我们处在一个“三浪并发”的时代,市场中出现大量S2B2C(平台-企业-客户)的企业结构,既有着眼未来,ALL in智能的未来企业;也有立根现状,拥抱互联网的创新企业;同时也有紧握传统,稳定成熟的传统企业。这样的状态在我们平时的工作中也有映射,既有高瞻远瞩的大佬,也有兢兢业业的菜鸟,更有立足当下的黄牛,而我们要做的就是看清现状,做最擅长的事情,从最熟悉的地方开始,找寻破局点。

    做最擅长的事情,与个人而言是生存之道,与企业而言是核心竞争力。

    核心竞争力分析是沙盘推演的半壁江山,最主要的竞争力即为:输出的产品和利益相关人。

    (图七)

    我们回到刚才说的“练功夫”和“走江湖”的比喻,企业和个人的功夫即为核心竞争力,核心竞争力的构建不仅要关心能拿出什么样的产品,而且需要强化“利益相关人地图”,增长的过程本质上就是建立新的联系的过程。“习得文武艺,仗剑走天下”,一个武林高手在不断的实践和应用过程中提升自己的武力值,提一柄长剑行侠仗义,提升技能,编织社会关系,这些技能和社会关系就是一个人生存和发展所依存的核心竞争力,与企业而言,这两者即为输出的产品和利益相关人。

    腾讯在创业之初研发了QQ软件,建立了与电信、游戏甚至与手机硬件的关系,凭借合乎需求的产品和良好的体验一举成为巨头公司,但是过于封闭的武打招数很快给腾讯带来危机,模仿对手的产品,并凭借自身的流量优势压倒对方,这样的武功无异于江湖中的“吸星大法”,注定成为武林公敌。“3Q大战”之后腾讯幡然醒悟,开放流量,做连接器,广结利益相关人,微信的面世使腾讯在社会关系中变得牢不可破,自此,腾讯核心竞争力趋向完整——左手微信QQ,右手开放投资,开宗立派,雄霸一方。

    沙盘推演的另一半江山即为了解“江湖”。

    “走江湖”首先是一种开放心态,是“睁眼看世界”,衡量自己的优势和市场趋势,在犬牙交错的行业地图中梳理市场元素,发现其中的规律,找寻属于自己的生态位。李彦宏擅长技术,顺应市场开创了百度;马云能言善辩,阿里长于运营;张一鸣熟练算法,字节落地推荐系统,这中间存在一个机会的问题。

    还记不记得(图五)中的内容,资源调配、信息流动、经济周期以及科技发展都是机会产生的地方,信息无限与认知有限的矛盾造就了搜索和推荐,也成就了李彦宏与张一鸣等人,梳理市场元素,探索行业机会,最终在行业地图中扎根发芽。

    对于企业而言,政策、消费者、竞争对手与合作伙伴组成了市场的整体框架,近期热播的《大江大河2》集中体现了在我国的环境下政策对经济的影响,电视剧中国有企业的改革、私营经济的发展、集体经济的变迁无一不受政策趋势的影响,合乎政策则迅猛发展,否则逐渐落寞,可见政策在中国经济中的主导作用。

    而对于竞争对手和合作伙伴,波特曾在五力模型中详细的描述了他们的关系:

    (图八)

       有没有感慨前辈们的智慧,站在巨人的肩头可以让我们更有效的聚焦于自身的领域,历史给我们留下了一个个工具,灵活应用则事半功倍。五力模型不仅协助我们分析和了解行业地图,同时也是一个完善的利益相关人地图,在上图中对利益相关人“利益—影响力”的权衡会是局势稳定的重中之重。行业地图中的形式是不断变化的,供方、买方、竞品、替代品层出不穷,瞬息万变,在五力模型的底色中聚焦自身和利益相关人的成本和收益,持续进行SWOT分析,便是沙盘推演的逻辑所在

    (图九)

    基于行业地图,结合(图九)中的方法,形成了一个完整的商业沙盘推演思路,政策圈定了可运作范围,经济规律让我们的眼界穿透了历史,需求指明了战略方向和行业潜力,五力模型反映了市场竞争,结构相对清晰。

    讲到这里我们还缺少一个需求分析,上文中我们通过衣、食、住、行等方面对用户的需求做了简单的了解,接下来我们借用马斯洛的需求层次理论完善上文的结构:

    (图十)

    行业的基础来自于需求,五花八门的企业其根本是围绕着人在转动,人的不同阶段产生不同的需求,也就需要不同的行业,同一需求的人多了就形成了市场趋势。近几年第三空间、自习室、茶馆风靡一时,很多人喜欢找一个家庭、工作之外的环境,归根结底是快速变化的环境、工作的压力和家庭的琐碎让大家想找个安静的地方“充充电”或者休息一下,这样的需求多了自然就产生了行业。出于各种原因,人的需求会在生存、归属、成长的需求层级中循环,而行业也在需求的变化中此起彼伏。

    如果说输出的产品和利益相关人是企业的“功夫”,那么,政策解读、竞争分析、需求分析即为企业的“见识”,练好功夫,看清江湖,然后做出良好的决策,并推算对应的结果,沙盘的价值,不过如此了。随着行业的变迁,企业对需求、对用户的了解越来越深,近几年企业从流量思维到用户思维的变化说明,行业发展趋向于精细化,抓住人才是抓住了整个市场。

    市场洞察是一个非常庞大的体系,在不同的人眼里往往会有不同的方法论,自然会产生不同的认知,无所谓谁高谁下。“黑天鹅”和“灰犀牛”的背后往往会有严密的逻辑,只有持开放心态,从不同的角度深入的分解,才会逐渐趋向于真相。笔者梳理这一思路权作抛砖引玉,欢迎大家讨论平时是用什么方法和思路做出形势判断的?

    ◆ ◆ ◆  ◆ ◆麟哥新书已经在当当上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的:
    
    
    
    数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。
    管理员二维码:
    猜你喜欢
    ● 卧槽!原来爬取B站弹幕这么简单● 厉害了!麟哥新书登顶京东销量排行榜!● 笑死人不偿命的知乎沙雕问题排行榜
    ● 用Python扒出B站那些“惊为天人”的阿婆主!● 你相信逛B站也能学编程吗
    
    展开全文
  • 对煤炭企业现行环境成本相关理论及部分专家的科研成果进行了分析与研究,在此基础上,从环境成本的核算与控制两个方面出发,通过归集环境成本费用项目并对其进行计量,进而从事前、事中、事后三个阶段实施环境成本控制,...
  • 企业信息族谱分析 组类 A 本科及以上 赛题简介介绍整个赛题的思路和整体要求 赛题业务场景描述赛题相关的真实企业业务背景从真实场景中适当简化或者提炼出适合比赛的赛题场景 功能性需求 非功能性需求 其他限制条件...
  • 文章从企业的环境管理实践与环境绩效的关系、环境管理与经济绩效的关系、环境绩效与企业经济绩效的关系以及环境绩效的测量与评估等四个方面对国外学者关于企业环境管理绩效的研究进行了归纳总结,发现在研究方法上,...
  • 导读:企业当前需要什么样的数据分析人才?这些人才应该具备怎样的能力和素质?数据分析师挣多少钱?下面的分析过程正在试图给你答案。希望本文能够为你今后的学习和求职提供指导,也...

    640?wx_fmt=gif&wxfrom=5&wx_lazy=1

    导读:企业当前需要什么样的数据分析人才?这些人才应该具备怎样的能力和素质?数据分析师挣多少钱?下面的分析过程正在试图给你答案。希望本文能够为你今后的学习和求职提供指导,也为正在学习数据分析和找工作的朋友们提供一定的参考价值。


    640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1



    01 项目背景


    在学习数据分析的路上,少不了经常逛知乎,写这篇文章的启发来源于@BigCarrey 的一篇文章《数据分析师挣多少钱?“黑”了招聘网站告诉你!》,该文章给了我一些帮助,让我了解了数据分析岗位相关的信息,但同样也留给我一些疑问,该文章分析的数据分析师所需技能的结果丝毫没有R的踪影,尽管是一年前的分析,我觉得应该不可能不存在。


    因此,抱着证实R语言这款工具的想法,以及希望了解当前企业对数据分析岗位的需求,开始了一次针对招聘网站的数据分析岗位招聘数据的分析与挖掘实践,避免自己所学习的方向与企业实际需求脱轨。


    此实例采用R语言作为分析工具,下面展现的是我整个分析过程。



    02 目标


    1. 了解企业当前需要什么样的数据分析人才,以及应该具备的能力和素质。

    2. 分析的结果为今后的学习和求职提供指导,也为正在学习数据分析和找工作的朋友们提供一定的参考价值。



    03 问题的分解


    1. 不同地区,数据分析岗位的需求分布以及对应的薪资分布

    2. 不同经验,数据分析岗位的需求分布以及对应的薪资分布

    3. 不同学历,数据分析岗位的需求分布以及对应的薪资分布

    4. 不同企业规模,数据分析岗位的需求分布以及对应的薪资分布

    5. 探索数据分析岗位对应的工具型技能与对应的薪资水平

    6. 探索数据分析岗位对应非工具型能力的需求



    04 数据集的定义


    640?wx_fmt=jpeg

    ▲表1:数据分析岗位信息表


    640?wx_fmt=jpeg

    ▲表2:数据分析岗位技能关键词表



    05 数据获取


    数据来源:拉勾网

    数据范围:互联网行业、数据分析岗位

    数据集:全国数据分析岗位招聘信息数据集(采集样本量:449)

    工具:爬虫

    时间:所有数据截止2018年3月12日

    数据集获取方式:请关注公众号数说物语(ID:DataTalk_)回复【拉勾网】即可获取下载链接和密码



    06 数据处理


    步骤1:加载原始数据


    640?wx_fmt=jpeg


    步骤2:识别缺失值


    640?wx_fmt=jpeg

    640?wx_fmt=jpeg

    图1. aggr缺失值识别图


    幸运的是该数据集不存在缺失值,这是很少遇到的情况。


    步骤3:数据清洗


    640?wx_fmt=jpeg

    640?wx_fmt=jpeg


    步骤4:文本挖掘


    文本挖掘工具:jiebaR包


    说明:


    在进行正式挖掘之前测试了一下jiebaR的关键词(keywords)分词器,测试的结果发现SQL,Python等词在jiebaR词典中的IDF值均为11.7392,但“R”这个字符无论如何(即使自定义了用户字典,或者在idf字典中添加R的idf值)都无法被分词器识别为关键词,猜测可能是默认R的词性标注或者算法实现方法的原因。但因为R是数据分析师的重要工具,识别不出来是不可容忍的,因此要另求出路。


    测试代码如下:


    640?wx_fmt=jpeg


    结果如下:


    640?wx_fmt=png


    解决办法:


    关键词算法的实现原理是TF-IDF算法,TF为词频,IDF为逆文档率(词的权重),因此TF-IDF=TF*IDF为衡量是否关键词的指标,若控制IDF,则TF-IDF的值与TF值成正比关系,简单来说TF值可以代替TF-IDF值。


    由于此次分析的是数据分析师的工具和技能,因此只考虑SQL,PYTHON,R,SAS等常用且类似的词的分析,又因为该类词在jiebaR分词器识别出来的IDF值均是同级别的(即使可能存在有差异也在此假设其等值),因此这部分词汇的关键指标的衡量可以简化为出现的词频,即TF值,这个可以通过jiebaR的默认分词器(不是关键词分词器)来处理即可,最终解决R关键词识别的问题。


    文本挖掘思路:


    1、工具型技能的关键词:采用默认分词器的词频TF值

    2、非工具型能力或素质的关键词:采用关键词分词器的TF-IDF值

    代码如下:


    640?wx_fmt=jpeg

    640?wx_fmt=jpeg

    640?wx_fmt=jpeg


    到此数据处理的过程基本完成,处理后干净的数据如下:


    640?wx_fmt=jpeg



    07 分析的结果


    数据分析代码:


    具体代码可以前往该链接查看整个过程:RPubs - 分析实例:企业需要什么样的数据分析人才http://rpubs.com/Joffy_Z/DA_analysis


    描述统计信息:


    640?wx_fmt=jpeg


    问题一:不同地区,数据分析岗位的需求分布以及对应的薪资分布


    640?wx_fmt=jpeg

    640?wx_fmt=jpeg


    • 总的来说数据分析师的平均薪资比较好,工作1年以上拿到10k月薪的机会还是比较大

    • 在需求量前5的城市中,北京和深圳的平均薪资是最高的,广州的平均薪资最低

    • 需求量在第二梯度的城市中,长沙和成都的平均薪资较低,但武汉、厦门、郑州也有不错的薪资表现,二线城市也是一个可以考虑的选择

    • 需要注意的是苏州的需求量相对于其他城市是非常低的,但其平均薪酬接近深圳,是可以值得关注的城市


    问题二:不同经验,数据分析岗位的需求分布以及对应的薪资分布


    640?wx_fmt=jpeg


    • 跟预想的差不多,薪资随工作经验的增加而有一个稳定的增长

    • 但企业对最大的数据求集中在3-5年经验的数据分析师,这对于转型进入数据分析的人来说不是一个好的消息

    • 转行需要更有充足的准备,且要不断寻找能够积累经验的项目来做。


    问题三:不同学历,数据分析岗位的需求分布以及对应的薪资分布


    640?wx_fmt=jpeg


    • 企业似乎更加注重分析师的实践经验,而不是学历的高低,但至少需要具备本科以上的学历,数据分析还是需要具备一定的理论基础

    • 在薪资方面,相对与本科来说,硕士及以上学历在获取高薪方面并没有太大的优势,能够解决实际问题才是数据分析师拿高薪的关键,而非深奥的理论知识

    • 大专学历的分析师还是有机会,重点在于增加自己的工作经验才是本质上与其他分析师拉开距离的关键,当然,理论知识也不能落下


    问题四:不同企业规模,数据分析岗位的需求分布以及对应的薪资分布


    640?wx_fmt=jpeg

    640?wx_fmt=jpeg


    • 150人规模以下的企业需求量较少,但给出的薪资较高(甚至有异常的高薪),该类企业可能处于快速融资且高速的发展阶段,需要有丰富经验的数据分析专家来建设整个数据体系

    • 50~150人规模的企业适合有足够经验的分析师且想要创业的人,对自己职位以及薪酬均会有明显的提升,但最大的风险就是该类企业容易失败,特别在互联网行业,因此更不建议作为转型新人的首选

    • 对于转型的新人,尽可能往大企业走,越大规模的企业,整个体系越成熟,因此可以在150人以上的规模从上往下选择自己合适的企业才是比较科学的方式,且需求量巨大


    问题五:数据分析岗位对应的工具型技能与对应的薪资水平


    640?wx_fmt=jpeg

    640?wx_fmt=jpeg

    640?wx_fmt=jpeg


    • SQL和Excel几乎是每个数据分析师要掌握的基础技能,大多数企业都有自己的数据库体系或者系统平台,因此企业工作人员读取和处理数据还是以数据库和Excel为主

    • R,Python是两个最热门的开源数据分析工具,且当前R语言在需求仍然不低,因此核心掌握两门语言的其中一门都会让数据分析师具备有力的竞争优势

    • 除此之外工作经验较低的数据分析师还需要掌握一些BI可视化分析工具

    • 工作经验较高的数据分析师需要掌握主流的关系型数据库系统和NoSQL,以及Hadoop,Hive,Spark等大数据工具

    • 掌握Hadoop,Hive,Spark,R,Python等技能是获取高薪必备条件


    问题六:数据分析岗位对应非工具型能力的需求


    声明:此处数据涉及到岗位细分和难以衡量的原因,并没有进行深入分析,词云本身不具备太高的数据分析价值,仅作为可视化关键词的分布情况的工具;阅读者需要根据自身岗位以及所处的工作定位查看关键词的情况,这里的大小表示关键词出现的频次。


    640?wx_fmt=jpeg


    通过资料的收集,了解到数据分析岗位主要有偏工程方向和偏业务方向两个类型,透过词云可以大概了解到如下信息:


    • 偏工程方向的数据分析师对“数据挖掘”、“数据建模”、“模型分析”等能力要求较高

    • 偏业务方向的数据分析师对“业务分析”、“运营分析”、“产品分析”、“用户分析”等能力要求较高

    • 两个类型共同需要“逻辑思维”、“沟通”、“分析报告”、“统计分析”、“团队合作”等关键能力



    08 总结


    1. 从地域来看,北京、深圳、上海、杭州、广州应该是数据分析师的首选城市,苏州是一个值得关注的城市,外部数据了解到苏州的GDP仅次于一线城市,此处结果平均薪资接近北京和深圳,但需求量较低,想要苏州发展的朋友可以关注其动态。

    2. 从总体需求来看,企业更加需要具备多年工作经验,且动手能力强、解决实际问题的分析人才,随着工作经验的增加,其对应的薪资也有可观的增长。

    3. 从大环境看,外部资料了解到,自助式分析工具的逐步完善与人工智能技术的突破,也可能使得企业现有业务人员能够上手基础的分析工作,导致企业对经验较低的分析师需求减少。

    4. 从企业规模看,150人以上规模的企业更加适合新人进去锻炼,一方面企业已经完成了基本的数据体系架构,且越大的企业数据量级越大,另一方面,企业需要逐步培养强大的数据分析团队来支撑业务的增长。

    5. 从分析师个人的角度,则需要更加关注自身成功项目经验的积累,这是升职加薪的必备条件,且需要思考未来自身的发展路径,提前做好准备,相对于业务方向,大数据工程师方向会有更可观的薪资。

    6. 从能力的角度,数据分析师需要掌握SQL,Excel,R,Python四个必备的工具(R和Python可以选择其一为主要工具),新人可以注重BI,PPT等office工具的技能,如果是大数据挖掘,越往后则需要更加关注hadoop,Hive,Spark等工具;

    7. 数据分析师个人还需要注重逻辑思维、表达沟通、分析报告等关键能力



    09 建议


    1. 对于想要转型的数据分析师新人,转型之前尽可能做好项目经验的积累,尽量做到跨岗不跨行,在自己熟悉的领域学习数据分析

    2. 企业比较看重经验和动手能力,面试的时候尽可能展示你的作品或者案例,如果当前没有,则需要在日常学习,练习,积累

    3. 可以掌握一些可视化工具和数据可视化的思维,熟练掌握报告和表达的技巧,数据分析的工具多样,方式多样,只有能够正确解读数据且让对方看懂听懂才是有价值的



    10 不足


    本次分析并没有按照分析报告的方式来呈现,文章中以个人的整个分析过程来撰写,希望能够与各位朋友一起交流学习,如果你不同意我文章中的观点,欢迎指正交流。


    文章中我附上了我的数据集以及分析的代码链接,有兴趣的朋友可以重复我的过程,甚至做更加深入有趣的分析,如果有新的发现和观点,希望也能让我知道,向你们学习。



    11 局限


    数据仅采集到449份样本,数据量相对少一点,因此数据分析的结果需要大家用怀疑的心态来看待,且仅局限在互联网行业,相对于其他行业,本文章的分析结果只能作为一个参考。


    感谢您的阅读,您的建议和留言会让我做得更好。


    作者:乔飞(Joffy Zhong):咨询顾问 写作爱好者 数据分析 互联网创业者 R语言中文社区专栏作者

    来源:数说物语(ID:DataTalk_)


    推荐阅读


    日本老爷爷坚持17年用Excel作画,我可能用了假的Excel···

    看完此文再不懂区块链算我输:手把手教你用Python从零开始创建区块链

    为什么要学数学?因为这是一场战略性的投资

    180页PPT,讲解人工智能技术与产业发展



    Q: 数据分析师所需的技能,你get到了吗?

    欢迎留言与大家分享

    觉得不错,请把这篇文章分享给你的朋友

    转载 / 投稿请联系:baiyu@hzbook.com

    更多精彩文章,请在公众号后台点击“历史文章”查看

    640?wx_fmt=jpeg

    展开全文
  • 价值百万的企业大数据分析报告是如何炼成的?

    千次阅读 多人点赞 2017-03-15 14:08:43
    很多企业往往会花高额价钱来请咨询公司对企业的整体经营情况做一个分析,生成一个报告。但是对于多数已经有数据管理的企业,可以针对一个具体企业、一个具体问题开展针对性的数据分析,从点到面地解决问题。现如今...
  • 确定分析思路需要以营销、管理等理论为指导,把这些跟数据分析相关的营销、管理等理论统称为数据分析方法论。 数据分析方法论主要用来指导数据分析师进行一次完整的数据分析,更多的是指数据分析思路,如从哪方面...
  • 数据分析的六种方法论和八种思路

    千次阅读 2020-03-04 16:03:05
    估计很多人都听过数据分析,但是真正做起来却不是那么一回事了。要么胡子眉毛一把抓,要么无从下手。这说明缺少理论知识的支持,那么本文就将盘点一下数据...只有弄清楚了分析的目的是什么,才能准确定位分析因子,...
  • 数据分析方法论(6种方法,8个思路

    万次阅读 多人点赞 2020-02-26 17:23:05
    在介绍数据分析方法论和思路之前,我们还是先不厌其烦地看一下数据分析的流程,简单来说分为以下六个步骤: 1、明确分析的目的,提出问题。只有弄清楚了分析的目的是什么,才能准确定位分析因子,提出有价值的问题...
  • 今天给大家介绍几个数据分析模型吧 一、用户价值模型 1、RFM模型 RFM分析是客户关系分析中一种简单实用客户分析方法,他将最近一次消费、消费频率、消费金额这三个要素构成了数据分析最好的指标,衡量客户价值和...
  • 什么是数据分析方法论

    万次阅读 2018-09-04 09:26:21
    确定分析思路需要以营销、管理等理论为指导。这些 跟数据分析相 关的营销、管理等理论统称为数据分析方法论。可以把方法论理解为指南针,在分析方法论的指导下我们才去开展数据分析,这样分析的结果才具有指导意义,...
  • 民营科技企业是推进我国科技、经济发展的重要力量...通过阐述法律环境与民营科技企业之间的作用机理,分析当前我国民营科技企业发展的法律环境问题,援引LLSV理论假说对如何优化我国民营科技企业法律环境提出一些思路
  • 企业大数据平台下数仓建设思路

    千次阅读 2017-03-15 11:06:40
    介然(李金波),阿里云高级技术专家,现任阿里云大数据数仓解决方案总架构师。8年以上互联网数据仓库经历,对系统架构、数据...介然之前在一家软件公司给企业客户做软件开发和数仓开发实施,数仓开发和实施都是基于
  • 故事一:一位在互联网行业做数据库架构多年的同事一起吃饭,问起我现在在说什么,我说自己在做医疗方面数据分析,同事笑,说:你有很多资源啊,只要你能拿到电子病例的数据,就能分析很多东西了……我脸上的微笑表情...
  • 顶象企业版加固逆向分析

    千次阅读 2018-03-03 16:36:08
    1. 首先进行免费版转换把dex中对应的方法通过JNI反射转换为cpp文件(当然这里企业版比免费版转换的方法要多,免费版中的内部类MainActivity$1就没有进行转换); 2. 然后就是独有工具链的编译,猜测很有可能是基于...
  • 企业服务总线ESB是什么

    万次阅读 2018-01-17 18:25:14
    在探讨信息系统的SOA架构概念时,一个非常重要的概念是:企业服务总线(ESB)。可以说,企业服务总线也是SOA的核心构成部分。要真正实现应用架构完善的SOA结构,简化SOA构件间的关系,就一定要建设好信息系统的企业级...
  • 在这个数据为王的时代,作为一个产品经理或者增长黑客,数据...要进行一次完整的数据分析,首先要明确数据分析思路,如从那几个方面开展数据分析,各方面都包含什么内容或指标。是分析框架,给出分析工作的宏观框架...
  • PM2.5环境检测系统的设计与分析

    千次阅读 2018-03-17 12:45:00
    PM2.5环境检测系统的设计与分析 摘要: 大气颗粒物污染对人类健康和生态环境造成了很大的影响,这让人们逐渐重视起对细颗粒物PM2.5检测技术的研究。本文阐述了PM2.5浓度检测的五种方法,在对上述各方法分析...
  • 摘要:在阿里巴巴在线在线技术峰会上的第三天,来自阿里云高级技术专家李金波为大家题为《企业大数据平台仓库架构建设思路》。本次分享中,李金波主要从总体思路、模型设计、数加架构、数据治理四个方面介绍了如何...
  • 随着企业信息化建设的发展,选择一个能快速满足个性化需求并灵活稳健的系统架构是企业信息化建设成功的基础,这已经成为一个不争的事实。工作流平台软件作为一个中间件产品,在企业信息系统架构中对于业务流程管理、...
  • 测试点设计及编写思路

    万次阅读 多人点赞 2019-04-19 18:30:02
    我认为对于一般的企业测试来说,这四个方法足够了。编写测试用例的策略:先点后面,先局部再整体,最忌讳的是点和面混在一起,局部和整体不明。 在测试点设计的时候,需要思考如下几点: 1、测试操作的难度; ...
  • 环境信息化是政府信息化建设的重要组成... 本文开发一套系统应用于环境企业的差异化表单填报与用户权限分配的实际场景,可以有效提升系统的管理与业务数据的汇总和分析。 本文完成的主要工作如下: 1.通过对当前业界
  • 企业内刊的定位与功能分析

    千次阅读 2010-12-18 21:13:00
    究其原因,除了优厚的政策、良好的市场环境企业家自身的努力等因素以外,越来越多的企业家对企业文化建设的充分重视也是其得以快速发展的主要原因之一。随着社会发展和市场经济秩序的逐步完善,企业要想做大、做强...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 60,317
精华内容 24,126
关键字:

企业的环境分析思路是什么