精华内容
下载资源
问答
  • 很多同学表示:从0到1的文章很多,可面对复杂问题,该怎么搭建数据分析思路呢?首先,“复杂”一词在不同等级的数据分析师里含义不同。对小白而言,领导传达命令的时候,有“模型”俩字的就是复杂问...

    很多同学表示:从0到1的文章很多,可面对复杂问题,该怎么搭建数据分析思路呢?首先,“复杂”一词在不同等级的数据分析师里含义不同。对小白而言,领导传达命令的时候,有“模型”俩字的就是复杂问题,一听“模型”,新人就开始狂翻《西瓜书》《统计学习》《机器学习》誓要与“模型”血战300回合。而有经验的同学都知道,企业里真正复杂的才不是这些。来看个具体例子:

      

    场景:电商行业(纸质书、视频光盘等商品为主),客服领导对物流领导意见非常大,认为物流问题影响了客户满意度。但物流领导表示:所有发货不及时,发货过程中包装破损等问题已经被处理了,怎么可能还有物流问题。现在有一份分析需求,要求:建立全面、细致的客户满意度评估指标体系。


    PART 01

    什么是真正的复杂问题

     

    问题1:收到这个需求,你会百度哪个关键词?

    1. 评估指标

    2. 客户满意度指标

    3. 客服客户满意度指标

    4. 物流客户满意度指标

     

    很多新人一看这种问题就觉得:简单。不就是建个评估指标吗,这种文章网上一天能见8篇。而且“客户满意度”这个词我也熟悉,又不是私域流量,精准画像这种玄乎词。于是开始百度上边四个关键字,找一个看起来可行的就开始干了。可关键问题是:眼前的问题,是大家不知道客户满意度怎么考核吗?

     

    不是!眼前的问题是客服跟物流俩部门干上了!这才是大问题。所谓“客户满意度”只是两边干架的一个由头。如果“客户满意度”的标准不能让两边共识,那不管书本上是怎么定义的,只要你甩出来,都会被其中一方喷到死。这才是第一大难题。所以这一题根本就不该选。第一步要干的事,是先了解具体不满的点在哪里。

     

    又有新人表示:既然是客服对物流不满,那客服记录用户来电里,有“客户投诉”这一项,直接把这个指标拿出来不就完了(如下图)

     

    这就涉及到第二个难题:客户满意度,是个含义丰富,但采集数据非常难的指标。

    • 到底啥算满意?

    • 客户不满意是不是就一定投诉?

    • 是不是客户满意了就不会投诉?

     

    都不一定!特别是涉及物流问题:

    • 可能客户假装发脾气,只是为了让客服处理速度快一点。

    • 也可能客户闷声不响,但是最后退货!退货!退货!

    • 更有可能客户拨打的是咨询/建议,但是发脾气:为啥还不

    只靠一个字段:投诉,是无法真实反映情况的。比如客服领导给出来的“客户不满意”是以下场景(如下图)

     

    这又涉及第三个问题:如何在各种庞杂数据里,真正识别出客户投诉/非投诉。如果按客户领导的说法,得把所有客户来电都转文字记录+关键词过滤一遍才能识别情况。可显然这么干太费时费力,得找个简单的处理办法。

     

    然而这又涉及到第四个问题:客服的工作流程得调整。不调工作流程,依然会有大量真真假假的投诉混杂在其他来电里,后续还是没法跟踪,客服依然会无休无止的抱怨,物流依然不知道自己错在哪。然而,调流程这事,又涉及业务部门能不能、肯不肯、想不想的问题。这时候如果有个人冒出来,说:“你们做数据的不是会人工智能大数据吗,就不能我们照常干,你们Duang一下就分析的一清二楚吗。肯定是你能力不行”……是不是你也想打爆他的狗头了。

     

    凸(艹皿艹 )

     

    部门利益有冲突

    指标含义不清楚

    原始数据内容乱

    相关流程要改动

     

    这些才是老鸟眼中真正难解决的问题。然而这也是企业真实的经营场景,那种数据完美,含义清晰,静静躺在excel表里等着被建模的事,只存在于网上文章里。现实就是各种利益纠葛,数据混杂,流程不清,咋弄呢???

    PART 02

    如何建立分析思路

     

    总结下本次的问题。表面上看,是:客服反馈物流问题多,客户满意度低。可往深入看,客服与物流对客户满意度口径不统一,导致无法解决问题。再往深入看,客户的很多问题并非物流引起,却都怪到物流头上,客服自己没有做区分,而是一股脑打上门来。

     

    这种场面下,有三种解决思路:

     

    第一:中立判官。如果得到了更高层授权,或者两个部门能平心静气谈,希望数据部门站在中间当判官,可以用这种思路。这时候可以围绕客服反馈的客户不满意问题,逐级梳理,把哪些是真问题,哪些是假抱怨一层层剥清楚:

     

    第二:故作小白。如果两个部门打的不可开交,铁了心要吵架的话,可以用这个思路。数据部门好像一只人畜无伤的小白兔,表示:“你看我们也不懂物流业务,也不懂客服业务,如果有需要区分哪些来电是不满意的,可以业务给具体的区分规则,我们按规则去提取数据”。

     

    是滴,让两家自己吵架,定清楚了到底什么算不满意、从哪里、依照什么标准提数,数据部门就当个跑数机。并且只给数据,不给判断。这样是看着很怂,但是能在部门混战里先保护好自己。

     

    第三:解决问题。注意,客户总是想多占点好处,所以客户真真假假的抱怨是避免不了的。但物流提高配送能力却是结结实实要花钱的。就像所有的老板都说要提高客户满意度,可你问他花100个亿来提高满意度——十有八九就不同意了。

     

    所以站在解决问题的角度,第一步并非建立客户满意度指标,而是先定义物流的服务原则,比如最长发货时间是多久,比如发货破损率控制在多少,等等。有了这个标准,第二步就能推动客服,在应对客户投诉的时候,先区分有没有违背服务原则。如果有就是物流执行没到位,转物流处理;如果没有,就得靠客服努力,或者安抚客户,或者向客户解释原则。这样大家都能在有限的成本内,最大化解决问题。

     

    如果用问题解决思路,需要的分析就不1个建立客户满意度指标体系,而是3个相互配合的分析

    1. 依据物流原则,目前执行不到位的客户情况分析

    2. 基于物流原则,客户真实不满意、假不满意的分析

    3. 基于现有客服安抚方式,客户真/假不满意最终处理情况分析

    分析的复杂度大大提高。实际上,解决问题导向的分析逻辑都很复杂,并且依赖于数据分析师的业务处理能力。

    PART 03

    小结

    你会发现:

    一般网络文章里的数据分析思路都是中立判官式的,作者都喜欢把自己当成最大的老板,指点江山,真他妈爽。

    一般现实工作中,都是故作小白的搞法。“请业务自己想清楚”“我就是个跑数据的,我啥也不懂”——到头来经常被人骂“没有用”“你分析了啥”。

    一般老板们解决问题的时候,会用问题解决型思路,可丢给数据分析师的,是三份独立的取数表。跑数的同学还是不知道在干啥

    其实三种做法,单独看都没错,难的不是做某一种方法,而是审时度势,结合真实的问题点,系统数据现状,处理问题的决心,选择一个贴合实际的做法。这就要求数据分析师们,如果真想参与解决问题的话,就得从问题沟通、开会、聊天就开始观察情势,构建思路,而不是像开篇那样,上来抓个关键词就百度走起了。

     

    历史好文推荐

    1. 数据分析为什么火了

    2. 如何入门数据分析?

    3. 你是分析师,还是“提数机”?

    4. 谈谈ETL中的数据质量

    展开全文
  • 1.学习《利用Python进行数据分析》第二章的时候,处理1880-2010年间全美婴儿姓名数据,有句代码总是报错: total_births = names.pivot_table('births', rows='year', cl=ols = 'sex', aggfunc = sum)报错信息如下:...

    </pre><span style="font-size:18px">1.<span style="color:rgb(85,85,85); font-family:'microsoft yahei'; line-height:35px">学习《利用</span><a target=_blank target="_blank" href="http://lib.csdn.net/base/python" class="replace_word" title="Python知识库" style="text-decoration:none; color:rgb(223,52,52); font-family:'microsoft yahei'; line-height:35px; font-weight:bold">Python</a><span style="color:rgb(85,85,85); font-family:'microsoft yahei'; line-height:35px">进行数据分析》第二章的时候,处理1880-2010年间全美婴儿姓名数据,有句代码总是报错:</span></span><p></p><pre name="code" class="python">total_births = names.pivot_table('births', rows='year', cl=ols = 'sex', aggfunc = sum)
    报错信息如下:
    TypeError: pivot_table() got an unexpected keyword argument 'rows'
    解决方法,将代码改为
    total_births = names.pivot_table('births', index='year', columns='sex', aggfunc=sum)

    2、同样第二章,如何在Pycharm中显示图像的问题,解决的方法是在代码前面加上

    import matplotlib.pyplot as plt
    然后调用plt.show()显示图像

    plt.show()
    最后的图像如下图所示:




    展开全文
  • 摘要:解决csv文件向mysql导入含有中文数据,导入后中文出现乱码问题。结论,在导入含中文字符时注意两个问题:第一,告诉Mysql文件的编码是什么?第二,数据库表中的列编码要设置成支持中文的字符集。导入源数据SQL...

    MYSQL

    摘要:解决csv文件向mysql导入含有中文数据,导入后中文出现乱码问题。结论,在导入含中文字符时注意两个问题:第一,告诉Mysql文件的编码是什么?第二,数据库表中的列编码要设置成支持中文的字符集。

    导入源数据

    mysql

    SQL代码

    LOAD DATA LOCAL INFILE 'E:\\stocks.csv' 
    INTO TABLE `stock_info_tb` 
    FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"' ESCAPED BY '"' 
    LINES TERMINATED BY '\r\n'

    乱码结果

    mysql

    修改SQL

    LOAD DATA LOCAL INFILE 'E:\\stocks.csv' 
    INTO TABLE `stock_info_tb` CHARACTER SET utf8
    FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"' ESCAPED BY '"' 
    LINES TERMINATED BY '\r\n'

    这个utf8是根据导入的csv文件编码来决定的,可以通过文本编辑器把要导入的数据修改一个自己喜欢的编码,然后这个一致就OK。
    这样修改后,仍然是乱码,有些崩溃的。

    查看与修改表信息

    表对中文是否支持运行:

    SHOW FULL COLUMNS FROM `stock_info_tb`;SHOW CREATE TABLE `stock_info_tb`;

    结果显示:

    CREATE TABLE `stock_info_tb` (
      `type` varchar(10) CHARACTER SET latin1 DEFAULT NULL,
      `bourse` varchar(2) CHARACTER SET latin1 DEFAULT NULL,
      `stock_id` int(11) NOT NULL,
      `stock_name` varchar(10) CHARACTER SET latin1  DEFAULT NULL,
      PRIMARY KEY (`stock_id`)
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin

    发现要导入来的type,stock_name两个列为latin1字符集,修改为utf8为:

    /*DDL 信息*/------------
    CREATE TABLE `stock_info_tb` (
      `type` varchar(10) COLLATE utf8_bin DEFAULT NULL,
      `bourse` varchar(2) CHARACTER SET latin1 DEFAULT NULL,
      `stock_id` int(11) NOT NULL,
      `stock_name` varchar(10) COLLATE utf8_bin DEFAULT NULL,
      PRIMARY KEY (`stock_id`)
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin

    再运行

    LOAD DATA LOCAL INFILE 'E:\\stocks.csv' 
    INTO TABLE `stock_info_tb` CHARACTER SET utf8
    FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"' ESCAPED BY '"' 
    LINES TERMINATED BY '\r\n'

    结果

    mysql
    喜欢这个样的结果。

    【作者:happyprince, http://blog.csdn.net/ld326/article/details/78123282

    展开全文
  • 我们可能会遇到当我们向list集合中运用add()方法循环添加map集合时会出现后添加的map集合数据覆盖前面添加的数据问题,最终让添加的数据都一样且都是最后一条数据,接下来我就对此问题进行原因分析以及解决方法。...

    我们可能会遇到当我们向list集合中运用add()方法循环添加map集合时会出现后添加的map集合数据覆盖前面添加的数据问题,最终让添加的数据都一样且都是最后一条数据,接下来我就对此问题进行原因分析以及解决方法。

    • 问题展现
      不多说,先放向list集合添加map集合时出现问题的代码
    		String[] s ={"12","13","14","11"};
            List list = new ArrayList<Map<String, Object>>();
    
            Map map = new HashMap<String, Object>();
    
            for (int i = 0; i <s.length ; i++) {
                map.put("值",s[i]);
                list.add(map);
            }
    
    此时我们在控制台打印结果如下:list=[{值=11}, {值=11}, {值=11}, {值=11}]
    
    • 问题原因
      显然可见,这并不是我们所需要的结果,出现了后添加的map集合覆盖之前map数据问题,具体原因是因为我们在new的一个map集合是在for循环外,这样map集合其地址值是同一个,在进行向map集合添加时就等于我们向同一地址值的map添加数据,由此就会出现覆盖之前map数据的问题。
    • 解决问题
      解决此问题主要从根源上让list在添加map集合时,使其map集合地址值不同,这样我们添加时就实现了添加不同的map到list集合中,我的做法是将new的map集合放在for循环里面,这样我们在每次执行for循环时都会新new了一个map集合,保证了其map地址值不同就可以了。
      其演示如下:
    		String[] s ={"12","13","14","11"};
            List list = new ArrayList<Map<String, Object>>();
            
            for (int i = 0; i <s.length ; i++) {
    //          将new的map集合放在for循环里面
                Map map = new HashMap<String, Object>();
                map.put("值",s[i]);
                list.add(map);
            }
    
    此时控制台打印结果如下:list=[{值=12}, {值=13}, {值=14}, {值=11}]
    

    由此list添加map集合时覆盖问题就解决了。

    展开全文
  • 数据分析-数据分析报告

    千次阅读 2015-12-01 14:13:36
     数据分析报告是数据分析原理和方法,运用数据来反映、研究和分析某项事物的现状、问题、原因、本质和规律,并得出结论,提出解决办法的一种分析应用文体。  1.2数据分析报告的写作原则  1.3数据分析报告...
  • 数据分析中常见问题

    千次阅读 2018-12-06 20:13:54
    1. 如何检验数据是否服从正态分布? 一、图示法 (1)P-P图。以样本的累积频率作为横坐标,以安装正太分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点,如果服从正太分布,则样本点围绕第一...
  • 数据挖掘是如何解决问题

    千次阅读 2013-04-08 11:18:13
    数据挖掘是如何解决问题的 本节通过几个数据挖掘实际案例来诠释如何通过数据挖掘解决商业中遇到的问题。2.1.1节中关于“啤酒和尿不湿”的故事是数据挖掘中最经典的案例。而Target公司通过“怀孕预测指数”来预测女...
  • 数据挖掘与数据分析

    万次阅读 多人点赞 2018-05-28 13:58:14
    一、数据挖掘和数据分析概述 数据挖掘和数据分析都是从数据中提取一些有价值的信息,二者有很多联系,但是二者的侧重点和实现手法有所区分。 数据挖掘和数据分析的不同之处: 1、在应用工具上,数据挖掘一般要通过...
  • 根据这个问题做以下解释和解决方法:首先:我们最常用的数据导入方法是将EXCEL做为OLEDB数据源,然后把所有数据填充到DATASET中。 数据源连接方式: string strConn="Provider=Microsoft.Jet.OLEDB.4.0;
  • 通常spss读入xls的数据通常第一行是变量名,数据格式都是默认第一条数据(第二行)格式,把第二行的数据小数点设置好,后面就都默认了。 2.在SPSS中做多个因素的方差分析时,为什么确定按钮用不了 多变量方差分析,...
  • 最近的项目前端用到vue+elementui框架,在使用过程中遇到很多问题,在后几篇文章中会一一列出,有解决的,有没解决的。 先说关于select下拉框的问题:(项目原因无法截图) 具体现象是在某个下拉框下面会在显示完...
  • 数据分析数据预处理、分析建模、可视化

    万次阅读 多人点赞 2020-08-08 15:03:21
    概述:简介、思路、发展...数据分析方法:描述统计、假设检验、信度分析、相关分析、方差分析、回归分析、聚类分析、判别分析、主成分分析、因子分析、时间序列分析等; 数据可视化:Excel、PowerBI、Tableau、Python;
  • 从一个什么都不懂的小白,到现在字节跳动的数据分析师,我用了大概1年的时间,在这里想给大家分享一下我的转行经历,希望能有一些帮助。 出于隐私考虑,我就全部打码了。。。先说一下个人背景,本科是工科相关,非...
  • 数据统计分析(1):数据分析流程

    千次阅读 多人点赞 2019-04-08 16:44:38
    首先,数据分析能力是一项综合性的能力。...通过这次数据分析我要解决什么问题?只有明确数据分析的目标,数据分析才不会偏离方向,否则得出的数据分析结果不仅仅没有指导意义,甚至可能将决策者...
  • Python数据分析与挖掘

    万人学习 2018-01-08 11:17:45
    本课程共包含五大模块: 一、先导篇: 通过分析数据分析师的一天,让学员了解全面了解成为一个数据分析师的所有必修功法,对数据分析师不在迷惑。   二、基础篇: 围绕Python基础语法介绍、数据预处理、数据...
  • Python数据分析:股票数据分析案例

    万次阅读 多人点赞 2019-05-01 15:54:26
    Python数据分析:股票数据分析案例 步骤: 准备数据 可视化数据、审查数据 处理数据 根据ACF、PACF定阶 拟合ARIMA模型 预测 import pandas as pd import pandas_datareader import datetime import matplotlib....
  • 使用Python进行数据分析时,中文是显示不了的, 那么怎么使matplotlib可视化是能够显示中文呢? 你需要具备的知识:matplotlib基本操作,linux基本操作,IPython 解决方法如下:# 解决中文显示问题# 先安装中文...
  • 怎么解决数据倾斜问题

    千次阅读 2019-04-19 14:35:32
    本文面向的读者是从事数据分析数据处理(ETL)等相关工作的朋友们,相信大家在工作中一定遇到过数据倾斜的问题,读完本文,你会了解到数据倾斜的定义及其危害、产生的原因及应对措施、常见倾斜场景及解决办法等...
  • 如何用数据解决实际问题-读书笔记

    千次阅读 2019-12-10 00:31:09
    目录 序 我们常说将数据应用于实际业务,但具体要怎样做呢?根据不同的阶段和水平,我们所需的能力可以分为以下4种: ... 将各种方法或思维方式有机结合起来,形成具有整体一贯性的解决问题的故事 高级分...
  • 电商用户行为数据分析

    万次阅读 多人点赞 2019-05-15 20:00:54
    前言 本文针对淘宝app的运营数据,以行业常见指标对用户行为进行分析,包括 一、提出问题 ...本次想通过对淘宝用户行为数据分析解决以下业务问题: 以下为分析逻辑和用到适用的业务指标: ...
  • Python数据分析数据可视化案例

    万次阅读 多人点赞 2019-04-29 21:35:42
    Python数据分析数据可视化案例 import pandas as pd import matplotlib.pyplot as plt from matplotlib import style style.use('ggplot') # 设置图片显示的主题样式 # 解决matplotlib显示中文问题 plt.rcParams...
  • 系列一:《python数据分析基础与实践》 章节1Python概况 课时2Python简介 章节2Python安装 课时3安装Anaconda 课时4使用Anaconda 章节3数据准备 课时5数据类型 – 布尔型 课时6数据类型 – 数值型 课时7数据类型 – ...
  • 如何入门数据分析

    万次阅读 2020-05-16 12:54:41
    如果你刚开始学习数据分析,那么怎么入门呢?其实各大招聘网站的数据分析职位就是一个很好的参考。那么数据分析师究竟需要哪些技能呢? 数据分析必备技能: Excel SQL Python或者R 数据可视化 机器学习 PPT 逻辑...
  • 数据分析思路

    万次阅读 多人点赞 2018-09-14 16:08:06
    数据分析是在当今每个企业都所需要涉及的一门学科,数据分析的书随便一搜就会有太多教大家如何的去使用。大致能把搜到的书分为两类:第一类讲数据理论统计学相关的,第二类就是数据分析工具应用类型的。而大部分我们...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,324,193
精华内容 529,677
关键字:

怎样分析数据解决问题