• ## 数据分析面试题

万次阅读 多人点赞 2018-12-14 12:46:24
数据分析面试题 1.一家超市的顾客数据，将数据可视化并分析销售额和年龄、收入的关系并给出营销建议 年龄 收入 销售额 34 350 123 40 450 114 37 169 135 30 189 139 44 183 117 36 80 121 32 ...
数据分析面试题
1.一家超市的顾客数据，将数据可视化并分析销售额和年龄、收入的关系并给出营销建议
年龄收入销售额34350123404501143716913530189139441831173680121321661332612014032751333640133
答案:
import matplotlib.pyplot as plt
# 年龄
age = [34,40,37,30,44,36,32,26,32,36]
# 收入
income = [350,450,169,189,183,80,166,120,75,40]
# 销售额
sales = [123,114,135,139,117,121,133,140,133,133]
# 年龄，销售额 散点图
plt.scatter(age,sales)
plt.show()


 # 收入，销售额 散点图
plt.scatter(income,sales)

<matplotlib.collections.PathCollection at 0x7e87550>


可视化结论：
顾客年龄和销售额负相关，年龄越大销售额越低顾客收入和销售额也呈负相关，收入越高销售额越低
建议：
营销针对人群应是一般收入100-200之间，年龄20-37之间的人群，这样营销效果更好
2.使用原生Python代码和Numpy并行计算分别求解下面的y值
x1 = [1,2,3,4,5]
x2 = [3,5,2,9,10]
y = x12 + x23
求y值：原生Python实现
x1 = [1,2,3,4,5]
x2 = [3,5,2,9,10]
y = []
for i in range(len(x1)):
y.append(x1[i]**22 + x2[i]**33)
print(y)

[5559060566555524, 116415321826934818647429, 39970994201, 30903154382632612379512827847945, 1000000000000000002384185791015625]

Numpy实现
import numpy as np
x1 = np.array([1,2,3,4,5])
x2 = np.array([3,5,2,9,10])
y = x1 ** 22 + x2 ** 33
print(y)

[-1504003196 -1667191419  1316288537  1165272329 -2094601527]

3.返回下表中所有同学语文成绩最低的1次考试成绩
chineseenglishmathnametest756936张三一688587李四一544259王五一555763李四二593592王五二456392王五三615376赵六一
import pandas as pd
df


chineseenglishmathnametest0756936张三一1688587李四一2544259王五一3555763李四二4593592王五二5456392王五三6615376赵六一
#自定义函数
def top(x,n=1,column='chinese'):
return x.sort_values(by=column)[:1]
df.groupby('name').apply(top)


chineseenglishmathnametestname张三0756936张三一李四3555763李四二王五5456392王五三赵六6615376赵六一
4.创建三角级数类,阅读下列代码回答问题
import numpy as np
import matplotlib.pyplot as plt
class trigonometric_function:
tra_1 = 6
tra_2 = 12
def __init__(self,a,k,l):
self.const1 = a
self.const2 = k
self.const3 = l
self.summand_s = np.sin(self.const2*x + self.tra_1)
self.summand_c = np.cos(self.const3*x + self.tra_2)
def trigon_sum(self,m,n):
sum_1 = sum([sum([self.const1*(self.summand_s**i)*(self.summand_c**j) for i in range(m)]) for j in range(n)])
return sum_1
def draw_pic(self,data):
fig,axes_1 = plt.subplots(1,1,dpi=140,figsize=(6,4))
axes_1.plot(x,data)
plt.show()


a.请在代码中找出类变量、实例变量、方法、对象
类变量：tra1,tra2,const1,const2,const3,summand_s,summand_c
实例变量：x,a,k,l,m,n,data(通常前面没有self.。)
对象：方法、类变量和实例变量
b.请写出程序中所涉及到的三角级数
c.self 什么意思？
self 代表类的实例，self 在定义类的方法时是必须有的，虽然在调用时不必传入相应的参数。
d.请阐述下列代码运行后会有什么结果
f1=trigonometric_function(3,4,6)
#类的实例化
#对类进行初始化
x=np.linspace(-5,5,500)
#生成500个-5到5之间的点
#生成普通三角函数sin和cos
data=f1.trigon_sum(4,5)
#生成三角级数数据
f1.draw_pic(data)
#绘图


5.Python数据分析通常使用的环境、工具和库都有哪些？库功能是什么？
基础环境一般为Anaconda，
编辑器多用Ipython或JupyterNotebook，
常用库有:
Numpy：数值计算Matplotlib：数据可视化Pandas：数据预处理和数据分析scikit-learn：机器学习算法建模预测
6.数据分析的一般流程是什么
基本流程
提出问题(明确分析目的)准备数据分析数据洞察结论
详细流程
需求层 目标确定数据层
数据获取数据规整（清洗） 分析层
描述性分析
指标计算数据可视化 探索性分析
建模分析模型验证迭代优化  输出层
数据分析报告总结结论提出建议并实施
7.常用的数据分析方法有哪些？
现状分析
对比分析：
定义：对比两个或以上数据，发现并分析差异，最终从中得出数据差异所代表的含义和规律。目的：通过比较某个或某些指标，直观的发现事物在某方面的差异与变化，且差异和变化可被准确量化。分类：横向比较和纵向比较 平均
通过计算平均数来反映总体在一定时间、地点条件下某一数量特征的一般水平。但由于其忽略了个体间可能存在的巨大差异，有时候并不一定反映出某一指标的一般水平。因此，很多时候平均分析法是不可取的。 综合评定
人们通过实践总结，逐步形成了一系列运用多个指标对多个参评单位进行评价的方法，称之为综合评价法。综合评价法的本质是把多指标转化为一个能够反映综合情况的量（比如评分，通常不再是统计指标）来进行分析
……
原因分析
分组:
定义：根据数据特征，按照一定的指标，把数据划分为不同的群组进行研究，以求揭示各群组间的内在联系和规律。目的：通常为了对比，按照一定指标把总体中不同性质的个体区分开，把性质相同的个体合并在一起，保证组内个体属性差别最小，组与组之间属性差异最大。 结构
定义:被分析总体内的各部分与总体进行对比的分析方法，即部分数量除以总体数量，换句话说，部分占总体的比例，属于相对指标 交叉
交叉分析法又称立体分析法，是在纵向分析法和横向分析法的基础上，从交叉、立体的角度出发，由浅入深、由低级到高级的一种分析方法。这种方法虽然复杂，但它弥补了“各自为政”分析方法所带来的偏差。交叉分析可通过交叉分析表来实现：透视表和交叉表 杜邦分析
金字塔结构层层分析法，各层存在明确的因果关系，更多时候是严格的函数关系 漏斗图
漏斗图适用于业务流程比较规范、周期长、环节多的流程分析，通过漏斗各环节业务数据的比较，能够直观地发现和说明问题所在。在网站分析中，通常用于转化率比较，它不仅能展示用户从进入网站到实现购买的最终转化率，还可以展示每个步骤的转化率。 聚类 ……
预测分析
回归判别式分析神经网络决策树
8.数据分析中常见的统计学概念有哪些?
相对数与绝对数：
绝对数描述客观事物总体在一定时间和地点条件下的总规模，总水平的指标。相对数是指两个相关事物的比值。 百分数和百分点：
男生占班级总人数的90%，男生人数比上一年增长7个百分点，百分数表示个体占总体的程度。百分点表示相同事物不同时期的增幅。 频数频率：
频数是绝对数，频率是相对数。频数指某种事物或现象在其所在总体出里出现的次数。比如班级有两个女生，我们就可以说女生出现的频数是2.频率（注：不要和物理频率搞混），个体出现的总次数与总体出现的总次数的比值。 比例和比率：
比例指个体数值在总体数值中的占比。比如一个班级10个人，男生4个，女生6个，则男生的所占比例是4 ：10；女生所占比例是6 ：10。比率是总体中各个体数值之间的对比。男女比率是：4 ：6 倍数与番数：
倍数是一个数除以另一个数所得的商。比如3是1.5的二倍。番数指的是某种事物总数的二的n次方倍 同比与环比：
同比是指与历史同时期进行比较得到的数值；环比是指与前一个统计期比较所得到的数值。这个产品的销售额与上一年相比，同比增长40%；这个商品的销售额与上个月相比，环比增长30%。
9.归一化
归一化方法:  归一化作用:
作用1：消除量纲，在多指标评价体系中，由于各评价指标的性质不同，通常具有不同的量纲和数量级。当各指标间的水平相差很大时，如果直接用原始指标值进行分析，就会突出数值较高的指标在综合分析中的作用，相对削弱数值水平较低指标的作用。因此，为了保证结果的可靠性，需要对原始指标数据进行标准化处理。作用2：提升模型的收敛速度,狭长的标量场经过标准化后变得比较圆，这样会大大提升计算的收敛速度。
10.常见数据分析方法论
PEST：是研究宏观环境对企业或团体影响的一种分析方法（典型案例：海外投资）
PEST来自四个英文单词的首字母。这四个因为单词分别是Political Economic Social Technological，四者是组成宏观环境的基本要素。当然它们仅仅基本要素，真正的宏观环境要复杂得多。所以说在实际操作中，往往根据行业和企业的自身特点以及经营需求在此四者基础之上进行适当改变。 5W2H：
来源于7个用来提问英文单词的第一个字母，这7个英文单词分别为why、what、who、when、where、how、how much，用这7个单词进行提问，然后回答提问，在回答中发现解决问题的方法。 逻辑树分析法：
对一个主问题提出几个小问题，然后对每个小问题又可以提出几个问题，依次类推，层层推进，逐渐形成树状结构。 4P营销理论：
由4类因素共同影响销售业务，这四类因素分别为：产品、价格、渠道、促销 客户行为理论：
用户行为主要说的是用户使用行为，就是用户为获取、使用物品或服务所采取的一系列行动，这些行动可总结性地分为：认知、熟悉、试用、使用、忠诚。该理论主要用于网站分析。
11.什么叫数据分析？
数据分析是指的是通过统计学方法对采集来的数据进行整理分析，从中提取有用信息并最终得出结论的过程。
某些学者认为，数据分析分为三类，入门级的描述性数据分析，其方法主要有对比、平均、交叉分析法。高级的探索、和验证数据分析，分析方法有主要有相关分析，回归分析，因子分析。这样的提法有它自己的道理。在我看来，实际上就两类：描述性统计分析和计算性数据分析。
展开全文
• 数据分析与数据运营、数据挖掘是数据整个开发生命中的一小章节。 数据挖掘的门槛当然比数据分析高，涉及到较多的算法与调优以及如何将某个一个模型...将近一个月的数据分析面试经验，我感受到了不同公司的氛围。大厂...
数据分析与数据运营、数据挖掘是数据整个开发生命中的一小章节。 数据挖掘的门槛当然比数据分析高，涉及到较多的算法与调优以及如何将某个一个模型运用到实际当中。 数据分析则是根据业务的需求，去挖掘数据中存在的有价值的信息，再使用合适的工具（比如excel、tableau、echarts等可视化工具，将数据中蕴含的价值变成表、图、文字等形式）。 将近一个月的数据分析面试经验，我感受到了不同公司的氛围。大厂小厂都有自己的风格，小厂讲究效率至上，大厂则尽量完美，我自己数据梳理一下这一个月面试的过程。 常规问题： 1.做个自我介绍 2.你的工作经验，你主要负责哪一部分的工作内容，取得什么结果，对你有什么帮助，遇到了哪些困难，如何解决。 3.为什么从上家公司离职 4.你的优点和缺点是什么？ 5.你对加班和出差有什么看法？ 6.你有什么职业规划吗？ 7.找工作最看重什么？为什么？ 8.对我们公司有了解吗？如果你成为公司的一员，在这个岗位上，你如何开展工作？ 9.你对薪资有什么要求吗？
场景问题： 1.面试官会根据公司的业务具体给出一个场景，需要你进行场景的分析，给出原因或者是建议（答不答对不要紧，重点是需要逻辑清晰，说话清楚，能够让面试官明白你的意思） 2.对数据库要求较为严格的会当场让你写代码，sql多练练就好了，最基本的都要会，比如连接、子查询、触发器、存储过程，可以多写sql面试题。 3.说话要不卑不亢，问到不会的也不要慌张，说出自己的想法就ok，最后再表明自己会在完成工作的情况下还会不断的学习，让自己的技术更加饱满完整，为公司创造价值。 先写到这里吧，以后再补。
展开全文
• 转自|爱数据原统计网11行代码实现1到100的和？分析：这题考察的是对Python内置函数的了解程度，Python常见的内置函数有。图片中我框选的是比较常用的一些，你可能见过，这题考...

转自 | 爱数据原统计网
1
1行代码实现1到100的和？
分析：这题考察的是对Python内置函数的了解程度，Python常见的内置函数有。

图片中我框选的是比较常用的一些，你可能见过，这题考察的是sum也就是求和具体的使用

sum(iterable[, start])
iterable – 可迭代对象，如：列表、元组、集合。start – 指定相加的参数，如果没有设置这个值，默认为0。

例如
sum([1,2,3]) # 结果为6
sum([1,2,3],5) # 结果为11

python一行代码如何实现1~100的和
还要用到第二个内置函数 range()
range(start, stop[, step])
start: 计数从 start 开始。默认是从 0 开始。例如range（5）等价于range（0， 5）;stop: 计数到 stop 结束，但不包括 stop。例如：range（0， 5） 是[0, 1, 2, 3, 4]没有5step：步长，默认为1。例如：range（0， 5） 等价于 range(0, 5, 1)
解答：
sum(range(1,101))

2
使用Python输出[斐波那契数列]Fibonacci

斐波那契数列（Fibonacci sequence），又称黄金分割数列、因数学家列昂纳多·斐波那契（Leonardoda Fibonacci）以兔子繁殖为例子而引入，故又称为“兔子数列”。

例子：1、1、2、3、5、8、13、21、34、……
解法1：
100以内的斐波那契数列
x=1
y=1
print(x,end=" ")
print(y,end=" ")
while(True):
z=x+y
x=y
y=z
if(z>100):   #当z>100的时候，终止循环
break

print(z,end=" ")

解法2：
递归的办法，这个需要数学公式的记忆了

在数学上，斐波纳契数列以如下被以递归的方法定义：F(1)=1，F(2)=1, F(n)=F(n-1)+F(n-2)（n>=2，n∈N*）

#递归
def fibo(n):

if n <= 1:
return n
else:
return (fibo(n - 1) + fibo(n - 2))

m = int(input("打印前多少项?"))
if m <= 0:
print("请输入正整数！")
else:
print("fibo:")
for i in range(1,m):
print(fibo(i))

解法3：
迭代，用递归当数据大的时候，会出现效率问题
def fibo(max):
n, a, b = 0, 0, 1
while n < max:
yield b
a, b = b, a + b
n = n + 1  # 退出标识
for n in fibo(5):
print (n)

经过试验，比迭代速度快很多time.clock()说明
cpu 的运行机制：cpu是多任务的，例如在多进程的执行过程中，一段时间内会有对各进程被处理。一个进程从从开始到结束其实是在这期间的一些列时间片断上断断续续执行的。所以这就引出了程序执行的cpu时间（该程序单纯在cpu上运行所需时间）和墙上时钟wall time。
time.time()是统计的wall time(即墙上时钟)，也就是系统时钟的时间戳（1970纪元后经过的浮点秒数）。所以两次调用的时间差即为系统经过的总时间。
time.clock()是统计cpu时间 的工具，这在统计某一程序或函数的执行速度最为合适。两次调用time.clock()函数的插值即为程序运行的cpu时间。
import time
def fibo(max):
n, a, b = 0, 0, 1
while n < max:
yield b
a, b = b, a + b
n = n + 1
t1 = time.clock()
for n in fibo(100):
print (n)

t2 = time.clock()

print(t2-t1)

解法4：使用列表查看一下速度
import time
def fibo(n):

result_list = []
a, b = 0, 1
while n > 0:
result_list.append(b)
a, b = b, a + b
n -= 1
return result_list

t1 = time.clock()
print(fibo(1000))
t2 = time.clock()
print(t2-t1)

3
列出几个python标准库
你先明确的是什么是Python标准库

Python标准库(standard library)。标准库会随着Python解释器，一起安装在你的电脑中的。它是Python的一个组成部分。这些标准库是Python为你准备好的利器，可以让编程事半功倍。

os模块re模块pickle 模块datetime模块time模块math模块

4
下面Python代码的运行结果是？
这种题目，考察的是代码默读能力
def f(x,l=[]):
for i in range(x):
l.append(i*i)
print(l)
f(2)
f(3,[3,2,1])
f(3)

f(2)
def f(2,l=[]):
for i in range(2): # i=0,1
l.append(i*i) # [0,1]
print(l)

f(3,[3,2,1])
def f(3,l=[3,2,1]):
for i in range(3): # i=0,1,2
l.append(i*i) # [3,2,1,0,1,4]
print(l)

f(3)
def f(3,l=[]):
for i in range(3): # i=0,1,2
l.append(i*i) # [0,1,4] ???对吗？
print(l)

这个地方，你需要避免踩坑，一定要注意列表是可变的，如果单独的写没有任何问题，但是函数调用的三行代码放在一起就有点意思了
f(3,[3,2,1]) 将l进行了重新赋值。但是第三次调用函数使用的依旧是第一次的l,所以避免踩坑哦~~~~
f(3)运行的正确结果是[0,1,0,1,4]

5
Python实现列表去重的方法？
简单直接的办法，集合里面的元素不可以重复
my_list = [1,1,2,2,3,3,5,6,7,88]
my_set = set(my_list)
my_list = [x for x in my_set]
my_list

循环判断去重
ids = [1,1,2,2,3,3,5,6,7,88]
news_ids = []
for id in ids:
if id not in news_ids:
news_ids.append(id)
print(news_ids)

字典的fromkeys方法实现
my_list=[1,1,2,2,3,3,5,6,7,88]
d = {}.fromkeys(my_list)
print(d.keys())


展开全文
• 有很多朋友问数据分析面试官都会问哪些问题？那其实企业给我们留下的信息并不多，一个是冰冷的JD，写满了各种岗位要求；一个是公司涉猎的业务，密密麻麻很多字。那有经验的分析师能猜出面试题吗？有经...

有很多朋友问数据分析面试官都会问哪些问题？那其实企业给我们留下的信息并不多，一个是冰冷的JD，写满了各种岗位要求；一个是公司涉猎的业务，密密麻麻很多字。
那有经验的分析师能猜出面试题吗？有经验的分析师是可以猜出来，因为他们了解这个行业、了解数据分析的流程、能感知到分析师的共性和突破口、甚至未来的方向，所以不用质疑，可以的，虽然不能100%猜出，但80%还是有的
正所谓知己知彼、百战不殆，我们一定要具备这种能力。每个人都有会因各种原因跳槽，参加面试，如果你在所从事的行业，没有这种能力，那你的职场会受到很多因素的制约，双方认可的才叫能力，自己认可的那叫感觉。
下来我说说，假如我是面试官，我问关注哪些能力？
1、学习的能力，不能与行业脱节
一般面试结束的的时候都会聊几句，数据分析是一个日新月异的职业，即使你以前的能力再强，也不能与行业目前关注的热点、新潮的营销玩法、创意的业务模式有所脱节，一定要保持学习的状态。
其实大家都知道，数据分析的底层都是一样的，万变不离其宗，但用的人不一样，效果差异是很大的，而且你会发现那些高手，每天都会坚持学习。
那其实大家思考一下，要是你要判断这个人的学习能力，你会问哪些问题？简单列一下：
1、过去，都看过什么书，关注过哪些事情？
2、现在，你每天都坚持做的事情有哪些？
3、未来，你对未来的成长有没有什么学习计划？
2、是否具备一定的商业分析
大家都知道，数据分析的核心是分析的逻辑，许多人是看别人这么说的，只是自己还没有开窍，有点人一点就通，有的人是需要自己磨练后，才能打通领悟。
商业分析的逻辑不是一个专门的技能，而是一种综合能力的表现，其核心就是把复杂的问题进行有效的分解、制定分析的准则、采用严谨的量化方式进行洞察，并给出改进或者提高的可行性意见。
再看看商业分析，所有商业分析的出发点都是业务，说到底，分析师的工作其实就是通过数据来发现、改善业务的，比如产品做的好不好？为什么不好？你判断的标准是什么？
那其实大家思考一下，要是你要判断这个人的商业分析能力，你会问哪些问题？简单列一下：
1、寻找问题，比如我们DAU下降了30%，原因是什么？
2、解决问题，最近用户复购率的表现不够好，下个月要提高到XX%
3、预测问题，我想知道我们未来1年的GMV表现？提前做好资源调配
3、工具掌握程度
常言道，工善其事 必利其器，比如SQL、excel、python、PBI等等，这个没什么可讲的，保险起见，平时没事都学习一下，面试前看对方的要求，重点突破就行
例如很多刚入职的分析师特别看重SQL的能力，面试题基本都是围绕SQL进行，其他类的问题问的相对较少，并不是不需要你这个能力，而是这和目前岗位的定位和企业的预期有很大的关系，但我们总要为自己以后好好想一想。
一般会从几个方向设计问题，数据合并、数据处理、数据统计、可视化等，有的是针对性问某一个环节，有的是给你一个数据，让你现场干
那其实大家思考一下，要是你要判断这个人的工具掌握程度，你会问哪些问题？简单列一下：
1、深度，问一些工具操作的细节
2、广度，问你都会哪些工具？常用的工具有哪些
3、融度，要是做一份专题分析，你都会用哪些工具？什么情况下会用？为什么？
4、统计学的掌握
很多时候大家做的那些统计分析都是最最基本的，我只是说最基本，并没有说最基本的并非最有效，这是二个事情
业务复杂，监督的指标体系就会变的多样性，如果只会简单的统计分析有时候并不能深度的发现问题的本质，这时的你如果能更好的掌握数据的降维技术、分类技术、预测技术则可以将一些复杂的问题简单化
那其实大家思考一下，要是你要判断这个人的统计学掌握，你会问哪些问题？简单列一下：
1、误区，相关与因果、偏差
2、场景，什么商业问题，你会用什么算法去解决？
3、算法，做模型时你如何选择变量，如何评估模型的理论效果？
5、写作与讲故事能力
见过好多的分析师玩的一手好数据，而且思维也很出众，可写过和讲故事的能力缺很一般，好的输出可以让我们的观点与洞察变的更加清晰，也会让分析的价值得到很好的传递，这个仁者见仁智者见智，没有统一的标准，主要是看你能不能说清楚，对方能不能听听清楚
那其实大家思考一下，要是你要判断这个人的写作与讲故事能力，你会问哪些问题？简单列一下：
1、写作，你经常写分析报告吗？都写过那些分析报告
2、故事，你都做过哪些项目，这个项目的过程和结果能不能分享一下
3、框架，你如何理解数据分析师的输出，最重要的有哪些？能否举例描述？
6、自我修行能力
人无完人，每个人都有自己的特点和强项，对于分析师来讲也可以一样的，有的人擅长工具，有的人擅长算法，有的人擅长思维，其实这些技能是可以互补的。
比如有一家公司想要偏技术的能力，但你的思维和算法很出众，他们也会考虑，再比如你的报告撰写能力很强，但工具很渣，也会考虑，因为在一个团队中，你的缺陷是可以用别人的优势来互补的，但并不代表你以后不要去学习，只是你的优势可以让别人暂时忽略你的缺点而已。
那其实大家思考一下，要是你要判断这个人的自我修行能力，你会问哪些问题？简单列一下：
1、短板，你认为自己的短板有哪些？未来采用什么方式来修行自己的短板
2、擅长，在分析的流程中，你最擅长的有哪些？你为什么觉得你这些方向擅长
3、未来，你对自己未来的规划是什么样子的？你如何看待数据分析师这个职位。
7、其他能力，比如沟通、协调、职业道德等，这些都是隐形的能力，从你以上6个问题的回答，面试官基本可以感受到，要是面试官还是无法确定的化，一般会加几个问题进行验证
1、协调，给你一个分析项目，你如何在最短的时间内，让分析有成果？会采用那些方式，需要那些资源？
2、沟通，当领导给你一个不可能完成的任务时，你是如何委婉拒绝的？
3、道德，现在有一家竞争对手让你兼职做一个分析的项目，给你不菲的报酬，你如何思考要不要做？
面试可能遇到的问题都有了，接下来该你思考答案了。如果觉得不错，来个分享、点赞、在看三连趴～

·················END·················

点分享

点收藏

点点赞

点在看

展开全文
• 一面 20201111 一共有三面。...快手使用的明细数据表。 表格样式。 uid 用户 pid 视频 date 时间 uid用户在date时间观看了pid视频。 001 xyz 20201030 001 xyz 202010
• ：博主是正在学习数据分析的一员，博客记录的是在学习过程中一些总结，也希望和大家一起进步，在记录之时，未免存在很多疏漏和不全，如有问题，还请私聊博主指正。 博客地址：天阑之蓝的博客，学习过程中不免有困难...
• ## 7道常见的数据分析面试题

万次阅读 多人点赞 2019-02-27 10:32:20
今天，我们就来聊聊面试数据分析师的那些事。 其实，数据分析能力是每个互联网人的必备技能，哪怕你没有转行数据分析师的计划，也推荐你看看这个专题，提升你的数据能力。 数据分析的能力要求 与数据分析相关的工作...
• ​ 注：数据分析主要侧重产品sence与Hive使用，也会有少量数据结构、大数据架构与算法相关内容（会放至其它相应篇中）。以下试题为作者面试过程中被经常问到以及日常整理的通用高频面经，包含题目，答案与参考文章，...
• 题目 问题 1.订单的应答率、完单率分别是多少？...观察表中时间相关数据结合题目，要做出2步数据预处理 【1】将时间相关列转换格式 【2】按巴西比中国慢11小时，将表中北京时间转换为巴西时间。 --...
• 作者：腾讯数据分析师 annatx今天给各位分享两道数据分析试题，这是腾讯数据分析面试官在面试时考察候选人喜欢出的题，属于硬性技能考察题目，特别好用。如...
• 可乐的数据分析之路 |来源1用颜色标记重复值1.选中上述单元格，点击开始–>条件格式2.当出现如下界面，选择“重复”，同时设置“填充色”注意：从上图可以看出，我们既可以标记“...
• ## 数据分析面试题总结

千次阅读 多人点赞 2020-04-07 13:37:04
主要针对数据分析的常见题型，概率与统计、业务问题、机器学习、python、个人剖析题进行总结。 vivo： 业务方面 微信红包和转账有啥区别？ 利润下降怎么分析？ 点击量下降怎么分析？ 新客户和老客户流失分析上有...
• ）好了，言归正传，下面看面试题，因为这个公司偏向于用Python来处理数据和挖掘数据，所以面试的问题也都是跟Python数据分析相关的。 如何查找字典中value最大值对应的key？ 方法一：可以用max...
• 接着昨天的面试题，今天解决五六七八题： 新建属性列，提取日期中的月份 根据id和月份，做数据透视表；分别求出每个id在不同月份的消费笔数、消费总额 合并信息表和数据透视表；按id合并 数据脱敏，将文本信息匿名...
• 有幸去某大型商业银行信用卡中心面试数据分析师一职，题目涉及oracle数据库，shell，机器学习相关知识，现将资源分享，请忽略题中答案
• ## python数据分析面试题

万次阅读 多人点赞 2019-04-02 22:11:14
数据分析 编程题 1.一家超市的顾客数据， 将数据可视化并分析销售额和年龄、收入的关系 并给出营销建议 年龄 收入 销售额 34 350 123 40 450 114 37 169 135 30 189 139 44 183 117 36 80 121 32 166 133 26 120 140...
• https://blog.csdn.net/wypersist/article/details/80114709 (海量数据处理问题) 怎么做恶意刷单检测 分类问题用机器学习方法建模解决，我想到的特征有： 1）商家特征：商家历史销量、信用、产品类别、发货快递...
•   3、用数据条标记销售员的流水数值   4、类似"包小二1131423544"文本中单独提取QQ号码   5、将下列地址中的省（直辖市）、市（地区）、区（县）分别提取出来   6、高级筛选应用操作(很重要的功能)   7、...
• 业务：参考人人都是产品经理，精益数据分析 业务特征回答模板：基础+附加 基础：用户+商业变现 附加：产品具体特征（准备方向：电商、内容、游戏、风控） 细分业务模块指标表达 有清晰逻辑线 用户行为逻辑：判....
• ## 数据分析面试中的业务问题

万次阅读 多人点赞 2019-09-03 23:19:36
首先，这类估算问题会经常出现在数据分析、产品、咨询类岗位，统称为费米问题。分析这类问题可以 分别从两个角度展开。 根据情况，可以采用 Top down bottom up 法则 ，即 先从宏观层面， 自上而下推，再由某个点...
• 作者 |数据管道责编 | 徐威龙封图|CSDN 下载于视觉中国SQL中有一类函数叫聚合函数，比如count、sum、avg、min、max等，这些...
• ：博主是正在进行数据分析师求职的一员，博客记录的是在学习和求职过程中一些总结，也希望和大家一起进步，在记录之时，未免存在很多疏漏和不全，如有问题，还请私聊博主指正。 博客地址：天阑之蓝的博客，学习过程...
• 无论是秋招、春招或者是实习，sql都是面试官考察的重点，拿刚刚过去的19秋招来说，搜狐、网易、京东等在数据分析师岗位面试时都考了sql，而拼多多在数据分析笔试时就安排了四到五道复杂的sql题，虽然实习的难度会比...
• （一般面试中采用这种方法，即费米估计问题，可以参考《这也能想到?——巧妙解答无厘头问题》） 从数字到数字：如果有前几年新生儿出生数量数据，建立时间序列模型（需要考虑到二胎放开的突变事件）进行预测 找...
• 数据挖掘数据分析面试题，实用便捷，有一定参考价值,网上搞来的
• 近日刷一波数据分析面试题，学习别人的建议，总结和提升自己的思维。 01 自己思路 1.恶意刷单什么意思？是竞争对手恶意购买产品进行差评？ 2.刷单：就是找人购买、评价、好评、晒图、差评； 3.选择因素：销量、...
• ## 华为数据分析师技术面试

千次阅读 多人点赞 2020-01-19 11:44:01
华为数据分析师技术面试感受 前言 年末华为的各个部门好像都在招人。笔者收到了个面试邀请，是数据分析师的。好像只有三个步骤，投递简历，技术面试，业务面试。就其中可能是大家最想知道的技术面试和大家分享一下。...
• 作为面试者来说，简历上有的项目可能是你半年前，一年前的工作，如果你对你的记忆力以及表达能力没有百分百自信的话，建议还是提前准备一下，包括你在这个项目中承担的角色，最后做出的效果，以及面试官可能会针对你...
• 来源整理自公众号：胖里的日常第一家公司的2020届数据分析面试题整理就从拼多多开始吧~招聘总共分为学霸批、寻梦批、正式批三批，面试题合集并没有按照批次进行整理，毕竟也没啥规律可循。本人...

...