精华内容
下载资源
问答
  • 数据分析面试

    2021-03-29 15:58:54
    一、什么是p值 P值是用来判定假设检验结果的一个参数,P值就是当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率...二、常用的数据分析步骤 收集数据、数据预处理、数据分析、数据可视化、报告撰写。 ...

    一、什么是p值

    P值是用来判定假设检验结果的一个参数,P值就是当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率。当p值很小的时候要拒绝原假设,一般取p值为0.01或0.05。

    二、常用的数据分析步骤

    收集数据、数据预处理、数据分析、数据可视化、报告撰写。

    三、常用的数据特征

    偏度、峰度、预测值的具体频数、类别特征的unique分布。

    四、特征工程包括哪些

    异常值处理:箱形图
    特征归一化
    数据分桶:数据离散化处理
    缺失值处理:中位数、平均数、分箱
    特征构造:时间、地理、非线性变换等
    特征筛选:相关系数法、卡方检验
    降维:主成分分析法

    五、模型调参

    线性回归模型调参:最小二乘法、梯度下降法(要用到损失函数)

    展开全文
  • 数据分析面试

    万次阅读 多人点赞 2018-12-14 12:46:24
    数据分析面试题 1.一家超市的顾客数据,将数据可视化并分析销售额和年龄、收入的关系并给出营销建议 年龄 收入 销售额 34 350 123 40 450 114 37 169 135 30 189 139 44 183 117 36 80 121 32 ...

    数据分析面试题

    1.一家超市的顾客数据,将数据可视化并分析销售额和年龄、收入的关系并给出营销建议

    年龄 收入 销售额
    34 350 123
    40 450 114
    37 169 135
    30 189 139
    44 183 117
    36 80 121
    32 166 133
    26 120 140
    32 75 133
    36 40 133

    答案:

    import matplotlib.pyplot as plt
    # 年龄
    age = [34,40,37,30,44,36,32,26,32,36]
    # 收入
    income = [350,450,169,189,183,80,166,120,75,40]
    # 销售额
    sales = [123,114,135,139,117,121,133,140,133,133]
    # 年龄,销售额 散点图
    plt.scatter(age,sales)
    plt.show()
    

    在这里插入图片描述

     # 收入,销售额 散点图
    plt.scatter(income,sales)
    
    <matplotlib.collections.PathCollection at 0x7e87550>
    

    在这里插入图片描述

    可视化结论:

    • 顾客年龄和销售额负相关,年龄越大销售额越低
    • 顾客收入和销售额也呈负相关,收入越高销售额越低

    建议:

    • 营销针对人群应是一般收入100-200之间,年龄20-37之间的人群,这样营销效果更好

    2.使用原生Python代码和Numpy并行计算分别求解下面的y值

    x1 = [1,2,3,4,5]

    x2 = [3,5,2,9,10]

    y = x12 + x23

    求y值:原生Python实现

    x1 = [1,2,3,4,5]
    x2 = [3,5,2,9,10]
    y = []
    for i in range(len(x1)):
        y.append(x1[i]**22 + x2[i]**33)
    print(y)
    
    [5559060566555524, 116415321826934818647429, 39970994201, 30903154382632612379512827847945, 1000000000000000002384185791015625]
    

    Numpy实现

    import numpy as np
    x1 = np.array([1,2,3,4,5])
    x2 = np.array([3,5,2,9,10])
    y = x1 ** 22 + x2 ** 33
    print(y)
    
    [-1504003196 -1667191419  1316288537  1165272329 -2094601527]
    

    3.返回下表中所有同学语文成绩最低的1次考试成绩

    chinese english math name test
    75 69 36 张三
    68 85 87 李四
    54 42 59 王五
    55 57 63 李四
    59 35 92 王五
    45 63 92 王五
    61 53 76 赵六
    import pandas as pd
    df = pd.read_csv('data/1.class.csv', encoding='gbk')
    df
    
    chinese english math name test
    0 75 69 36 张三
    1 68 85 87 李四
    2 54 42 59 王五
    3 55 57 63 李四
    4 59 35 92 王五
    5 45 63 92 王五
    6 61 53 76 赵六
    #自定义函数
    def top(x,n=1,column='chinese'):
            return x.sort_values(by=column)[:1]
    df.groupby('name').apply(top)
    
    chinese english math name test
    name
    张三 0 75 69 36 张三
    李四 3 55 57 63 李四
    王五 5 45 63 92 王五
    赵六 6 61 53 76 赵六

    4.创建三角级数类,阅读下列代码回答问题

    import numpy as np
    import matplotlib.pyplot as plt
    class trigonometric_function:
        tra_1 = 6
        tra_2 = 12
        def __init__(self,a,k,l):
            self.const1 = a
            self.const2 = k
            self.const3 = l
        def Additive_term(self,x):
            self.summand_s = np.sin(self.const2*x + self.tra_1)
            self.summand_c = np.cos(self.const3*x + self.tra_2)
        def trigon_sum(self,m,n):
            sum_1 = sum([sum([self.const1*(self.summand_s**i)*(self.summand_c**j) for i in range(m)]) for j in range(n)])
            return sum_1
        def draw_pic(self,data):
            fig,axes_1 = plt.subplots(1,1,dpi=140,figsize=(6,4))
            axes_1.plot(x,data)
            plt.show()
        
    

    a.请在代码中找出类变量、实例变量、方法、对象

    类变量:tra1,tra2,const1,const2,const3,summand_s,summand_c

    实例变量:x,a,k,l,m,n,data(通常前面没有self.。)

    方法(属性): Additive_term、trigon_sum、draw_pic

    对象:方法、类变量和实例变量

    b.请写出程序中所涉及到的三角级数

    c.self 什么意思?

    self 代表类的实例,self 在定义类的方法时是必须有的,虽然在调用时不必传入相应的参数。

    d.请阐述下列代码运行后会有什么结果

    f1=trigonometric_function(3,4,6)
    #类的实例化
    #对类进行初始化
    x=np.linspace(-5,5,500)
    #生成500个-5到5之间的点
    f1.Additive_term(x)
    #生成普通三角函数sin和cos
    data=f1.trigon_sum(4,5)
    #生成三角级数数据
    f1.draw_pic(data)
    #绘图
    

    在这里插入图片描述

    5.Python数据分析通常使用的环境、工具和库都有哪些?库功能是什么?

    基础环境一般为Anaconda,

    编辑器多用Ipython或JupyterNotebook,

    常用库有:

    • Numpy:数值计算
    • Matplotlib:数据可视化
    • Pandas:数据预处理和数据分析
    • scikit-learn:机器学习算法建模预测

    6.数据分析的一般流程是什么

    基本流程

    1. 提出问题(明确分析目的)
    2. 准备数据
    3. 分析数据
    4. 洞察结论

    详细流程

    1. 需求层
      目标确定
    2. 数据层
      • 数据获取
      • 数据规整(清洗)
    3. 分析层
      • 描述性分析
        • 指标计算
        • 数据可视化
      • 探索性分析
        • 建模分析
        • 模型验证
        • 迭代优化
    4. 输出层
      • 数据分析报告
      • 总结结论
      • 提出建议并实施

    7.常用的数据分析方法有哪些?

    现状分析

    • 对比分析:
      • 定义:对比两个或以上数据,发现并分析差异,最终从中得出数据差异所代表的含义和规律。
      • 目的:通过比较某个或某些指标,直观的发现事物在某方面的差异与变化,且差异和变化可被准确量化。
      • 分类:横向比较和纵向比较
    • 平均
      • 通过计算平均数来反映总体在一定时间、地点条件下某一数量特征的一般水平。但由于其忽略了个体间可能存在的巨大差异,有时候并不一定反映出某一指标的一般水平。因此,很多时候平均分析法是不可取的。
    • 综合评定
      • 人们通过实践总结,逐步形成了一系列运用多个指标对多个参评单位进行评价的方法,称之为综合评价法。
      • 综合评价法的本质是把多指标转化为一个能够反映综合情况的量(比如评分,通常不再是统计指标)来进行分析

    ……

    原因分析

    • 分组:
      • 定义:根据数据特征,按照一定的指标,把数据划分为不同的群组进行研究,以求揭示各群组间的内在联系和规律。
      • 目的:通常为了对比,按照一定指标把总体中不同性质的个体区分开,把性质相同的个体合并在一起,保证组内个体属性差别最小,组与组之间属性差异最大。
    • 结构
      • 定义:被分析总体内的各部分与总体进行对比的分析方法,即部分数量除以总体数量,换句话说,部分占总体的比例,属于相对指标
    • 交叉
      • 交叉分析法又称立体分析法,是在纵向分析法和横向分析法的基础上,从交叉、立体的角度出发,由浅入深、由低级到高级的一种分析方法。这种方法虽然复杂,但它弥补了“各自为政”分析方法所带来的偏差。
      • 交叉分析可通过交叉分析表来实现:透视表和交叉表
    • 杜邦分析
      • 金字塔结构层层分析法,各层存在明确的因果关系,更多时候是严格的函数关系
    • 漏斗图
      • 漏斗图适用于业务流程比较规范、周期长、环节多的流程分析,通过漏斗各环节业务数据的比较,能够直观地发现和说明问题所在。在网站分析中,通常用于转化率比较,它不仅能展示用户从进入网站到实现购买的最终转化率,还可以展示每个步骤的转化率。
    • 聚类
      ……

    预测分析

    • 回归
    • 判别式分析
    • 神经网络
    • 决策树

    8.数据分析中常见的统计学概念有哪些?

    • 相对数与绝对数:
      • 绝对数描述客观事物总体在一定时间和地点条件下的总规模,总水平的指标。
      • 相对数是指两个相关事物的比值。
    • 百分数和百分点:
      • 男生占班级总人数的90%,男生人数比上一年增长7个百分点,百分数表示个体占总体的程度。百分点表示相同事物不同时期的增幅。
    • 频数频率:
      • 频数是绝对数,频率是相对数。
      • 频数指某种事物或现象在其所在总体出里出现的次数。比如班级有两个女生,我们就可以说女生出现的频数是2.
      • 频率(注:不要和物理频率搞混),个体出现的总次数与总体出现的总次数的比值。
    • 比例和比率:
      • 比例指个体数值在总体数值中的占比。比如一个班级10个人,男生4个,女生6个,则男生的所占比例是4 :10;女生所占比例是6 :10。
      • 比率是总体中各个体数值之间的对比。男女比率是:4 :6
    • 倍数与番数:
      • 倍数是一个数除以另一个数所得的商。比如3是1.5的二倍。
      • 番数指的是某种事物总数的二的n次方倍
    • 同比与环比:
      • 同比是指与历史同时期进行比较得到的数值;环比是指与前一个统计期比较所得到的数值。
      • 这个产品的销售额与上一年相比,同比增长40%;
      • 这个商品的销售额与上个月相比,环比增长30%。

    9.归一化

    • 归一化方法:

    • 归一化作用:

      • 作用1:消除量纲,在多指标评价体系中,由于各评价指标的性质不同,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。因此,为了保证结果的可靠性,需要对原始指标数据进行标准化处理。
      • 作用2:提升模型的收敛速度,狭长的标量场经过标准化后变得比较圆,这样会大大提升计算的收敛速度。

    10.常见数据分析方法论

    • PEST:是研究宏观环境对企业或团体影响的一种分析方法(典型案例:海外投资)
      • PEST来自四个英文单词的首字母。这四个因为单词分别是Political Economic Social Technological,四者是组成宏观环境的基本要素。当然它们仅仅基本要素,真正的宏观环境要复杂得多。所以说在实际操作中,往往根据行业和企业的自身特点以及经营需求在此四者基础之上进行适当改变。
    • 5W2H:
      • 来源于7个用来提问英文单词的第一个字母,这7个英文单词分别为why、what、who、when、where、how、how much,用这7个单词进行提问,然后回答提问,在回答中发现解决问题的方法。
    • 逻辑树分析法:
      • 对一个主问题提出几个小问题,然后对每个小问题又可以提出几个问题,依次类推,层层推进,逐渐形成树状结构。
    • 4P营销理论:
      • 由4类因素共同影响销售业务,这四类因素分别为:产品、价格、渠道、促销
    • 客户行为理论:
      • 用户行为主要说的是用户使用行为,就是用户为获取、使用物品或服务所采取的一系列行动,这些行动可总结性地分为:认知、熟悉、试用、使用、忠诚。该理论主要用于网站分析。

    11.什么叫数据分析?

    数据分析是指的是通过统计学方法对采集来的数据进行整理分析,从中提取有用信息并最终得出结论的过程。

    某些学者认为,数据分析分为三类,入门级的描述性数据分析,其方法主要有对比、平均、交叉分析法。高级的探索、和验证数据分析,分析方法有主要有相关分析,回归分析,因子分析。这样的提法有它自己的道理。在我看来,实际上就两类:描述性统计分析和计算性数据分析。

    展开全文
  • 数据挖掘数据分析面试题,实用便捷,有一定参考价值,网上搞来的
  • 原标题:面试题 | 腾讯数据分析面试题分享 annatx | 作者高级农民工 | 来源今天给各位分享两道数据分析试题, 这是腾讯数据分析面试官在面试时考察候选人喜欢出的题,属于硬性技能考察题目,特别好用。如果你想投鹅...

    原标题:面试题 | 腾讯数据分析面试题分享

    annatx | 作者

    高级农民工 | 来源

    今天给各位分享两道数据分析试题, 这是腾讯数据分析面试官在面试时考察候选人喜欢出的题,属于硬性技能考察题目,特别好用。

    如果你想投鹅厂的数据分析师岗位,强烈建议看看。刷题做实战题目是王道,刷一道顶得上在网上刷百道。

    以下是面试官在面试候选人时的思考。

    面试都有固定的流程,通常是自我介绍,硬性技能考察,项目经历追问和Q&A环节。

    之所以把硬性技能考察紧跟自我介绍后面,是因为不管简历包装的有多好, 招来的小伙伴始终要能get hands dirty,如果一些必须的技能不ok,那就没啥给机会的必要了。

    我们团队这边比较关注的还是 SQL和Python技能,所以但凡学生声称自己熟练掌握SQL和Python的,都会详细考察一下实际能力。所以两道题目,一道是SQL题,一道是Python题。

    1

    SQL题目

    这道题目还挺舍不得分享出来的,不过我自己用下来是真的觉得堪称 SQL试金石。不仅是校招生,就算是写了好多年SQL的人,也不一定真的能快速想出来答案,但被告知答案了又会觉得真的其实蛮简单的。因为题目都是我工作时候遇到觉得很有趣记录下来的case,所以可能是百度orGoogle也搜不出来的珍藏私货。

    1.题目

    有一张用户签到表【t_user_attendence】,标记每天用户是否签到(说明:该表包含所有用户所有工作日的出勤记录) ,包含三个字段:

    日期【fdate】

    用户id【fuser_id】

    用户当天是否签到【fis_sign_in:0否1是】

    问题1:请计算截至当前每个用户已经连续签到的天数 (输出表仅包含当天签到的所有用户,计算其连续签到天数)

    输出表【t_user_consecutive_days】:

    用户id【fuser_id】

    用户连续签到天数【fconsecutive_days】

    解答逻辑非常简单, 只需要用max和datediff。实际答案就 留在文末好了。

    问题2:请计算每个用户历史以来最大的连续签到天数(输出表为用户签到表中所有出现过的用户,计算其历史最大连续签到天数)

    输出表【t_user_max_days】:

    用户id【fuser_id】

    用户最大连续签到天数【fmax_days】

    这个乍看不太是SQL能解决的问题,但仔细想想就有思路。我的答案可能也不是最佳答案,但暂时还没问到过别的答案吧。

    2

    Python题目

    1.题目

    针对股票的最大回撤率指标定义,给出代码实现思路。给定的是产品所有交易日的净值序列,且其净值序列已按照日期排序。

    最大回撤率:在选定周期内任一历史时点往后推,产品净值走到最低点时的收益率回撤幅度的最大值。

    追问:如何在提升计算效率?

    这道题类似的题目其实在leecode也有,这个大概是变化但类似版本(可以搜leecode股票最大回报);因为团队里处理比较多金融资产数据, 这个指标是策略中最常见的指标之一,所以也是一道工作中攒下来的题目。这个指标的计算优化问题真的非常值得问,我后面会列几个版本的代码思路和实现代码。

    通常最简单的计算实现, 会需要O(n2)的计算复杂度;可以针对如何降低计算复杂度,专门追问。

    其实这俩题目,核心考察的都不是语言能力,因为语言永远都在更新,始终可以通过写得多来提升熟悉度; 核心考察的其实都是逻辑和算法能力,就算忘记核心函数或者语法,回归到问题本身, 有逻辑的candidate还是能给出思路和步骤,那当然如果语法和函数都非常熟悉,那就更完美了,可以马上写出来答案。

    很多硬性技能考察题,核心一样,题面可以一直换,比如: 签到可以变成用户活跃,用户充值次数之类的,可以换成候选人项目经历里熟悉的context,有些候选人比较紧张,换点熟悉的场景,似乎就脑子转的快一点。如果候选人最简单的版本能快速给出思路,可以一层层追问,了解ta的思考过程,更全面考察逻辑能力。

    3

    参考解答

    感觉要是不给参考答案的话,分享题目还是有点耍流氓的意思,就还是给几个答案参考参考。

    1.SQL题目答案

    问题1答案:

    思路:先找用户最近一次未签到日期,再用今天减那个日期

    createtablet_user_consecutive_days as

    selectfuser_id

    , datediff( '20200322',fdate_max) fconsecutive_days

    from

    ( selectfuser_id

    , max(fdate) fdate_max

    fromt_user_attendence

    wherefis_sign_in = 0

    groupbyfuser_id

    ) t1

    ;

    问题2答案:把用户所有签到记录转化成一条0-1字符串序列, 用0做split切割,计算切出来的1序列组中的最大长度

    createtablet_user_max_days as

    selectfuser_id

    , max( length(cut_fsign_record)) asfmax_days

    ( selectfuser_id

    ,fsign_record

    ,cut_fsign_record

    from

    ( selectfuser_id

    ,wm_concat(fis_sign_in) fsign_record

    fromt_user_attendence

    groupbyfuser_id

    ) t1

    lateral viewexplode( split(fsign_record, '0')) t ascut_fsign_record

    ) t2

    wherecut_fsign_record<> ''

    groupbyfuser_id

    ;

    2.Python题目

    最大回撤率:输入参数都是按照日期降序排列的净值序列

    基础实现版本:

    defmax_drawdown(accnavArr):

    mdd = 0

    fori inrange( 0, len(accnavArr)):

    forj inrange(i + 1, len(accnavArr)):

    drawdown = accnavArr[i] / accnavArr[j] - 1

    ifdrawdown < mdd:

    mdd = drawdown

    returnmdd

    空间换时间实现版本:

    把每个时间点计算的最大值都存到一个列表结构中,最大回撤的计算只需要再依赖这个列表进行多一次循环计算。

    defmaxDrawdownGainCal(accnavArr):# 默认accnavArr按日期降序排列

    maxDrawdown = 10000

    maxGain = 0

    arr_len = len(accnavArr)

    maxList = [ 0.0] * arr_len

    minList = [ 0.0] * arr_len

    maxList[arr_len -1] = accnavArr[arr_len -1]

    minList[arr_len -1] = accnavArr[arr_len -1]

    fori inrange(arr_len -2, -1, -1):

    ifaccnavArr[i] > maxList[i+ 1]:

    maxList[i] = accnavArr[i]

    else:

    maxList[i] = maxList[i+ 1]

    ifaccnavArr[i] < minList[i+ 1]:

    minList[i] = accnavArr[i]

    else:

    minList[i] = minList[i+ 1]

    fori inrange( 0,arr_len):

    mdd = (accnavArr[i]/maxList[i] -1)

    mg = (accnavArr[i]/minList[i] -1)

    ifmdd < maxDrawdown : maxDrawdown = mdd

    ifmg > maxGain : maxGain = mg

    returnmaxDrawdown,maxGain

    当前最优版本:

    defmaxDrawdownGainCal(accnavArr):# 默认accnavArr按日期降序排列

    maxDrawdown = 10000

    maxGain = 0

    arrLen = len(accnavArr)

    startMdd = accnavArr[arrLen -1]

    startGain = accnavArr[arrLen -1]

    fori inrange(arrLen -2, -1, -1):

    ifaccnavArr[i] > startMdd:

    startMdd = accnavArr[i]

    mdd = (accnavArr[i]/startMdd -1)

    ifaccnavArr[i] < startGain:

    startGain = accnavArr[i]

    mg = (accnavArr[i]/startGain -1)

    ifmdd < maxDrawdown : maxDrawdown = mdd

    ifmg > maxGain : maxGain = mg

    returnmaxDrawdown,maxGain

    每个时间点同时更新最大值和最大回撤,两个指标, 不需要额外空间,且只做一次列表循环计算。返回搜狐,查看更多

    责任编辑:

    展开全文
  • 想要成功进入数据分析行业,就必须得通过数据分析面试,面试应该准备什么,怎么准备,各位小伙伴都知道吗? 1.简历 大家都知道面试一定要带简历,那么怎样才能制作出一份让面试官满意的简历呢。这里小编建议大家可以...

    2020年6月求职季,虽然受到疫情的影响,但是也挡不住各位小伙伴,找工作的热情。目前,数据分析行业大火,相信很多小伙伴都想去这一行业试试水。想要成功进入数据分析行业,就必须得通过数据分析面试,面试应该准备什么,怎么准备,各位小伙伴都知道吗?

    1.简历

    大家都知道面试一定要带简历,那么怎样才能制作出一份让面试官满意的简历呢。这里小编建议大家可以试试STAR法则,可以着重凸显出自己在数据分析项目中取得的成绩。

    另外简历一定要结合招聘要求来制作,与招聘要求的匹配度越高才更容易被hr发现,不要偷懒,用一份简历打天下。

    2.投递

    投递简历最好不要海投。如果中意一家公司,可以选择多平台投递。

    3.面试

    终于到了最关键的环节了。

    大体上介绍一下自己接触过的项目,这样做的好处是,留有余地,一般面试官都会根据你的介绍来展开提问,如果说得过于详细,面试官有可能会问一些深层次的问题,答不上来就尴尬了。

    数据分析面试都会有技术性问题,Excel+SQL+python/R这几样工具都是必考,关于这几样工具的理论、实操大家一定要详细掌握。数据分析的目的就是促进企业的业务增长,关于公司的业务方面,大家也要多多了解,一般面试官会根据公司业务做一个假设案例让你来进行数据分析。

    展开全文
  • 拼多多2020届数据分析面试题合集

    千次阅读 2020-09-15 10:17:00
    来源整理自公众号:胖里的日常第一家公司的2020届数据分析面试题整理就从拼多多开始吧~招聘总共分为学霸批、寻梦批、正式批三批,面试题合集并没有按照批次进行整理,毕竟也没啥规律可循。本人...
  • 腾讯最爱考的2道数据分析面试

    千次阅读 2020-07-03 17:16:45
    今天给各位分享两道数据分析试题,这是腾讯数据分析面试官在面试时考察候选人喜欢出的题,属于硬性技能考察题目,特别好用。 如果你想投鹅厂的数据分析师岗位,强烈建议看看。刷题做实战题目是王道,刷一道顶得上在...
  • 作者:腾讯数据分析师 annatx今天给各位分享两道数据分析试题,这是腾讯数据分析面试官在面试时考察候选人喜欢出的题,属于硬性技能考察题目,特别好用。如...
  • 本文结构:前言面经分享数据分析面试知识体系统计知识(AB实验)SQL面试题整理业务场景其他一.前言(包括实习经验) 由于疫情原因,我已经宅家2个多月了,期间一直想动手写博客,记录下自己的学习与读书所得,输出倒逼...
  • 有很多朋友问数据分析面试官都会问哪些问题?那其实企业给我们留下的信息并不多,一个是冰冷的JD,写满了各种岗位要求;一个是公司涉猎的业务,密密麻麻很多字。那有经验的分析师能猜出面试题吗?有经...
  • 数据分析面试经验(给自己一个梳理的过程)

    千次阅读 多人点赞 2019-06-22 21:11:52
    数据分析与数据运营、数据挖掘是数据整个开发生命中的一小章节。 数据挖掘的门槛当然比数据分析高,涉及到较多的算法与调优以及如何将某个一个模型...将近一个月的数据分析面试经验,我感受到了不同公司的氛围。大厂...
  • 数据分析面试题总结

    千次阅读 多人点赞 2020-04-07 13:37:04
    主要针对数据分析的常见题型,概率与统计、业务问题、机器学习、python、个人剖析题进行总结。 vivo: 业务方面 微信红包和转账有啥区别? 利润下降怎么分析? 点击量下降怎么分析? 新客户和老客户流失分析上有...
  • 1.你做的数据分析有什么用? 回答1: 填补了空白 解答了疑问 验证了假设 提升了效率 回答2: 发现了业务机会 发现了业务问题 讲清楚分析的基础、各种分析方法的配合、业务配合条件 数据分析助力业务的路径: 先...
  • ya~老amy来了,今儿给大家分享一个朋友面试数据分析的实战项目,建议大家也可以独立的做一做。 需求如下: 看完这,可能第一反应就是头都大了。原始数据?结果数据?标准数据?但是冷静下来,对数据进行观察之后,...
  • 杭州某公司的数据分析面试
  • python数据分析面试

    万次阅读 多人点赞 2019-04-02 22:11:14
    数据分析 编程题 1.一家超市的顾客数据, 将数据可视化并分析销售额和年龄、收入的关系 并给出营销建议 年龄 收入 销售额 34 350 123 40 450 114 37 169 135 30 189 139 44 183 117 36 80 121 32 166 133 26 120 140...
  • 数据分析面试 数据库基本概念知识点 目录数据分析面试概念补充规则事务MySQL数据库文件介绍基本语句建表主键外键查询 概念 数据库服务器(多个数据库(多个表(信息))) 服务器是不是mysql: 国际上有sql标准规定...
  • 本文结构:前言面经分享数据分析面试知识体系统计知识(AB实验)SQL面试题整理业务场景其他一.前言(包括实习经验) 由于疫情原因,我已经宅家2个多月了,期间一直想动手写博客,记录下自己的学习与读书所得,输出倒逼...
  • 在群里看到不少旁友讨论数据面试相关问题,于是乎,今天分享这篇文章,内容既相关,又很干(有题目,又有解答):主要是关于两道数据分析试题,这是腾讯数据分析面试官在面试时考察候选人喜欢出的题...
  • 7道常见的数据分析面试

    万次阅读 多人点赞 2019-02-27 10:32:20
    今天,我们就来聊聊面试数据分析师的那些事。 其实,数据分析能力是每个互联网人的必备技能,哪怕你没有转行数据分析师的计划,也推荐你看看这个专题,提升你的数据能力。 数据分析的能力要求 与数据分析相关的工作...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 9,399
精华内容 3,759
关键字:

数据分析面试