精华内容
下载资源
问答
  • 本人总结的人工智能问题,目前已经找到工作,现在将总结的面试问题分享,顺便赚点积分,没分下资源了,呜呜
  • 面经 |算法工程师面试题汇总分享

    千次阅读 2019-10-17 21:05:42
    面经 |算法工程师面试题汇总分享 来源:https://github.com/PPshrimpGo/AIinterview 0 导读 本文汇总了 深度学习(模型评估方法、基本方法、优化方法、深度学习基础、CNN、RNN)、机器学习(基础、集成学习、模型 ...

    面经 |算法工程师面试题汇总分享

    来源:https://github.com/PPshrimpGo/AIinterview
    

    0 导读
    本文汇总了 深度学习(模型评估方法、基本方法、优化方法、深度学习基础、CNN、RNN)、机器学习(基础、集成学习、模型 、特征工程)、数据结构与算法(二叉树类、搜索回溯、概率题、动态规划、字符串)、数组、二分、快排系列(链表、排序)、海量数据题等各类型算法岗面试题。

    1 深度学习

    模型评估方法
    1)Accuracy作为指标有哪些局限性?

    2)ROC曲线和PR曲线各是什么?

    3)编程实现AUC的计算,并指出复杂度?

    4)AUC指标有什么特点?放缩结果对AUC是否有影响?

    5)余弦距离与欧式距离有什么特点?

    基本方法
    1)如何划分训练集?如何选取验证集?

    2)什么是偏差和方差?

    3)什么是过拟合?深度学习解决过拟合的方法有哪

    4)解决欠拟合的方法有哪些?

    5)深度模型参数调整的一般方法论?

    优化方法
    1)简述了解的优化器,发展综述?

    2)常用的损失函数有哪些?分别适用于什么场景?

    3)梯度下降与拟牛顿法的异同?

    4)L1和L2正则分别有什么特点?为何L1稀疏?

    深度学习基础
    1)以一层隐层的神经网络,relu激活,MSE作为损失函数推导反向传播

    2)NN的权重参数能否初始化为0?

    3)什么是梯度消失和梯度爆炸?

    4)常用的激活函数,导数?

    5)relu的有优点?又有什么局限性?他们的系列改进方法是啥?

    6)sigmoid和tanh为什么会导致梯度消失?

    7)一个隐层需要多少节点能实现包含n元输入的任意布尔函数?

    8)多个隐层实现包含n元输入的任意布尔函数,需要多少节点和网络层?

    9)dropout为何能防止过拟合?

    10)dropout和BN 在前向传播和方向传播阶段的区别?

    CNN
    1)给定卷积核的尺寸,特征图大小计算方法?

    2)网络容量计算方法

    3)共享参数有什么优点

    4)常用的池化操作有哪些?有什么特点?

    5)CNN如何用于文本分类?

    6)resnet提出的背景和核心理论是?

    7)空洞卷积是什么?有什么应用场景?

    RNN
    1)简述RNN,LSTM,GRU的区别和联系

    2)画出lstm的结构图,写出公式

    3)RNN的梯度消失问题?如何解决?

    4)lstm中是否可以用relu作为激活函数?

    5)lstm各个门分别使用什么激活函数?

    6)简述seq2seq模型?

    7)seq2seq在解码时候有哪些方法?

    8)Attention机制是什么?

    2 机器学习

    基础
    1)样本不均衡如何处理?

    2)什么是生成模型什么是判别模型?

    集成学习
    1)集成学习的分类?有什么代表性的模型和方法?

    2)如何从偏差和方差的角度解释bagging和boosting的原理?

    3)GBDT的原理?和Xgboost的区别联系?

    4)adaboost和gbdt的区别联系?

    模型
    1)手推LR、Kmeans、SVM

    2)简述ridge和lasson的区别和联系

    3)树模型如何调参

    4)树模型如何剪枝?

    5)是否存一定存在参数,使得SVM的训练误差能到0

    6)逻辑回归如何处理多分类?

    7)决策树有哪些划分指标?区别与联系?

    8)简述SVD和PCA的区别和联系?

    9)如何使用梯度下降方法进行矩阵分解?

    10)LDA与PCA的区别与联系?

    特征工程
    1)常用的特征筛选方法有哪些?

    2)文本如何构造特征?

    3)类别变量如何构造特征?

    4)连续值变量如何构造特征?

    5)哪些模型需要对特征进行归一化?

    6)什么是组合特征?如何处理高维组合特征?

    其他(分方向)
    1)word2vec的原理,glove的原理,fasttext的原理?

    2)cbow和skipgram如何选择?

    3)了解elmo和bert吗?简述与word embedding的联系和区别

    4)图像和文本和语音数据各有哪些数据增强方法?

    5)rcnn、fatse rcnn、fatser rcnn、mask rcnn的原理?

    6)介绍resnet和GoogLeNet中的inception module的结构?

    7)介绍yolo和ssd ?

    8)介绍FM,FFM,deepFM,deepWide.

    9)机器翻译如何解决oov?

    等等

    3 数据结构与算法

    二叉树类
    1)前中后的非递归?

    2)层次遍历,之字遍历?

    3)二叉树的序列化与反序列化

    4)前中,后中遍历结果恢复二叉树

    5)排序二叉树的序列化

    6)二叉树的直径

    7)二叉树的路径和为定值的路径

    8)翻转、复制二叉树

    9)排序二叉树转双向链表

    10)判断二叉树是否相同?判断一棵树是不是另一棵树的子树?

    搜索回溯
    1)八皇后,全排列,组合

    2)重复数字的排列,重复数字的组合

    3)图的搜索

    4)A star

    概率题
    1)用rand7构造rand10

    2)轮盘赌

    3)三角形内等概论随机选点

    等等

    动态规划
    1)编辑距离

    2)背包

    3)LCS

    字符串
    1)给定字符串是否符合正则表达式XXX

    2)给定字符串是否是数字?

    3)KMP

    4)超大数相加

    数组、二分、快排系列
    1)旋转数组查找

    2)数组中的topk

    3)旋转打印数组

    4)行列递增矩阵查找数字

    5)查找出现超过一半的数字

    6)查找和为定值的两个数

    链表
    1)翻转链表

    2)两个链表是否有交点

    3)一个链表是否有环

    4)链表的倒数k个节点

    5)合并链表

    6)逆序打印链表

    排序
    1)各种排序的复杂度最优最差平均

    2)堆排序topk

    3)快排的变化

    海量数据题
    1)海量日志的出现最多的10个字符串

    2)10亿个1-10的数字排序

    3)trie树

    4)hashmap

    5)布隆过滤器

    6)bitmap

    等等

    -End-

    在这里插入图片描述

    (关注微信公众号“StrongerTang”,看更多文章,和小汤一起学习,一同进步!)
    展开全文
  • 算法工程师面试题

    2018-07-30 10:09:15
    八九月份就要开始找工作了,一直期待能够成为一名算法工程师,所以在这里总结一下算法工程师常见问题。期待9月秋招时能有一个好的结果。本篇博客会一直更新下去。   编程语言 基本算法 传统机器学习 常见...

    转载仅供学习:门https://blog.csdn.net/gzj_1101/article/details/79514902

     

    八九月份就要开始找工作了,一直期待能够成为一名算法工程师,所以在这里总结一下算法工程师常见问题。期待9月秋招时能有一个好的结果。本篇博客会一直更新下去。

     

     

    编程语言

    C++、python

    基本算法

    剑指offer+Leetcode基本就能解决 
    剑指offer算法实现

    传统机器学习

    常见机器学习问题

    1) 过拟合问题 
    2) 交叉验证问题 
    3) 模型融合问题 
    4) 模型选择问题

    面试常见问题

    1) 几种模型( SVM,LR,GBDT,EM )的原理以及公式推导; 
    2) RF,GBDT 的区别; GBDT,XgBoost的区别(烂大街的问题最好从底层原理去分析回答); 
    3) 决策树处理连续值的方法; 
    4) 特征选择的方法; 
    5) 过拟合的解决方法; 
    6) K-means 的原理,优缺点以及改进; 
    7) 常见分类模型( SVM ,决策树,贝叶斯等)的优缺点,适用场景以及如何选型; 
    8) SVM 为啥要引入拉格朗日的优化方法; 
    9) 假设面试官什么都不懂,详细解释 CNN 的原理; 
    10) 梯度下降的优缺点 
    11) EM与K-means的关系; 
    12) L1与L2的作用,区别以及如何解决L1求导困难; 
    13) 如何用尽可能少的样本训练模型同时又保证模型的性能; 
    14) ID3和C4.5的优缺点,树的融合(RF和GBDT) 
    15) 特征提取方法,如何判断特征是否重要 
    16) BP神经网络以及推导 
    17) HMM模型状态推导 
    18) 过拟合原因以及解决办法(深度学习同) 
    19) 常见损失函数 
    20)机器学习性能评价,准确率,召回率,ROC 
    22)降采样,PCA,LDA

    深度学习

    常见问题

    1)四种激活函数区别和作用 
    2)过拟合解决方法 
    3)(CNN)卷及神经网络各层作用 
    4)(RNN)循环神经网络 
    5)LSTM 
    6)梯度弥散 
    7)优化算法 adam,SGD等 
    8)分析Alexnet,VGG的网络结构以及各层作用 
    9)XgBoost(好像很多公司也面到了) 
    10)梯度下降的优化 
    12)卷积核参数计算 
    13)TensorFlow中的session是什么,session和interactivesession的区别

    展开全文
  • 1. 介绍目标检测网络yolo...小目标检测不好,我答可能是因为anchor太大,缩小anchor,面试官继续问,除了缩小anchor,还能如何改善? 语塞。。。。(望有识之士补充) yolov3加入了anchor机制(应该没说全) 2. 样..

    目录

     

    1. 介绍目标检测网络yolo系列以及ssd系列的原理。yolo对小目标检测不好的原因,除了缩小anchor外还可以如何改善?

    2. 如何防止过拟合?

    3. 样本中正负样本不平衡,如何解决?

    4. 使用什么手段尽量保证精度不损失压缩模型?

    5. RetinaNet了解吗?

    7. 面试官随便构造一个网络,现场计算感受野

    8. 简述GAN网络原理

    9. python中的生成器是做什么的?

    10. 进程和线程的区别,数组和链表的区别


    1. 介绍目标检测网络yolo系列以及ssd系列的原理。yolo对小目标检测不好的原因,除了缩小anchor外还可以如何改善?

    大概介绍了一下,yolo及ssd是one-stage目标检测网络的代表,以及他们各自的backbone、anchor box生成方式,最近整理了一下yolo系列的各种创新点,blog地址:https://blog.csdn.net/weixin_42486139/article/details/106695693,持续加更中。。

    解决小目标检测不好几种方法:

    增加输入图像分辨率

    混合多尺度特征

    设置更小更稠密的anchor

    卷积神经网络设计时尽量度采用步长为1,尽可能保留多的目标特征。

    2. 如何防止过拟合?

        在数据层面,做数据增广,筛选高质量的特征

        在网络层面,选择较简单的模型,网络剪枝,加入正则项,加drop out层,加BN层

        在训练操作层面,使用Early Stopping

    3. 样本中正负样本不平衡,如何解决?

        1.使用类平衡交叉熵损失函数

        2.对小样本做数据增广

        3.FOCAL LOSS(retinanet)

        4.OHEM(online hard example mining)策略,训练时通常保证正负样本1:3

    4. 使用什么手段尽量保证精度不损失压缩模型?

       1.模型参数量化:将float32型权重、激活映射到低bit位(int8、fp16,二值、三值...)存储

       2.模型剪枝

       3.知识蒸馏

       4.替换轻量化网络结构(mobilenet系列、shufflenet、squeezenet...)

     模型剪枝常用策略?

       层剪枝,根据bn层的gamma系数剪枝,bn层的gamma系数代表该层特征的方差,方差越大说明该层特征越明显,保留该层,     gamma系数小的网络层可以剪掉。

       通道剪枝,根据经验缩小通道系数,多次训练对比实验(------感觉这块回答得有点弱智,可我就是这么弱智地调参。。。。)

    5. RetinaNet了解吗?

    one-stage和two-stage的表现差异主要原因是大量前景背景类别不平衡导致。在双阶段算法中,候选框阶段,通过得分和nms筛选过滤掉了大量的负样本,然后再分类回归阶段又固定了正负样本比例,或者通过OHEM在线困难挖掘使得前景和背景相对平衡。而one-stage阶段需要产生约100k的候选位置,虽然有类似的采样,但是训练仍然被大量负样本所主导。所以设计了一个简单密集型网络RetinaNet来在保证速度的同时达到了精度最优。

    主要创新点:focal loss

    alpha系数平衡正负样本的重要性(正负样本本身的比例不均)

    gamma系数减少易分类样本的损失。使得更关注于困难的、错分的样本(前景背景类别不平衡导致)

    比如:例如gamma为2,对于正类样本而言,预测结果为0.95肯定是简单样本,所以(1-0.95)的gamma次方就会很小,这时损失函数值就变得更小。而预测概率为0.3的样本其损失相对很大。对于负类样本而言同样,预测0.1的结果应当远比预测0.7的样本损失值要小得多。对于预测概率为0.5时,损失只减少了0.25倍,所以更加关注于这种难以区分的样本。这样减少了简单样本的影响,大量预测概率很小的样本叠加起来后的效应才可能比较有效。

    6. mobilenet速度快的原因

        深度可分离卷积

    7. 面试官随便构造一个网络,现场计算感受野

        公式记不住不要慌,一层层卷积、pooling计算就好了。我的思路是网络末端用1*1的特征点往上反推。

    8. 简述GAN网络原理

        生成器判决器协调工作,balabala。。。内容太多,有需求自行百度,或者参考我的   blog https://blog.csdn.net/weixin_42486139/article/details/106076876

    9. python中的生成器是做什么的?

        不同于其他函数的return,生成器使用yield返回,训练数据可以边迭代边训练。不用一次性地加载所有数据,节省内存空间。

    10. 进程和线程的区别,数组和链表的区别

    进程:指在系统中正在运行的一个应用程序;程序一旦运行就是进程;进程-----资源分配的最小单位。

    线程:系统分配处理器时间资源的基本单元,或者说进程之内独立执行的一个单元执行流。线程——程序执行的最小单位

    展开全文
  • AI算法工程师面试题

    千次阅读 2018-04-09 18:04:14
    这份面试实录出自 算法channel 关注粉丝: 地球村长,感谢提供的材料,经过小编编辑后与大家一起分享。技术1面1 Java水平怎么样?2 问Python给自己打多少分?Python多线程怎么实现?3 线程和进程的区别?4 不同进程...

    这份面试实录出自 算法channel 关注粉丝: 地球村长,感谢提供的材料,经过小编编辑后与大家一起分享。


    技术1面


    1 Java水平怎么样?


    2 问Python给自己打多少分?Python多线程怎么实现?


    3 线程和进程的区别?


    4 不同进程之间数据能共享吗?


    5 Numpy和pandas做了什么?他们有什么优缺点?


    6 五行五列二维数组,手写代码输出每行每列的最大值、最小值、平均值、方差


    7 问Redis数据库知道多少?


    Redis数据类型有几种?


    MySQL和Redis有什么区别?


    8 怎么设置缓存实现时间(怎么清缓存?)


    9 Hadoop,spark用过吗?


    10 举了一个高维数据,怎么找出异常值? 


    技术2面


    二面面试官来了。是个算法大佬。是个专门做算法的。直接手出题,他说时间不多,就让我说思路。


    1.先是一个m*n矩阵图走迷宫共有多少条路径?


    需要用到动态规划,还有排列组合。


    2. 2-sum问题。这个答出来了,中间有用了一种方法,自己想的,虽然没有降低时间复杂度,但挺新颖的。


    3.问了最熟悉哪个机器学习算法。说逻辑回归,谈了下逻辑回归原理。问了为什么总Sigmod函数,而不是其他双曲函数或Rule函数。


    4.然后他说对Xgboost这个感兴趣,Xgboost比GBDT做了什么优化,他说了一点,问还有一点是在数据集遍历上的优化?


    5.问了随机森林,随机森林与决策树相比,有哪些更多的优化?


    6.问了信息熵,和信息增益,和信息增益率,现实中代表什么?


    信息增益率比信息增益解决了哪些问题?


    总结


    感受到大公司氛围就是挺好的。不管结果如何。都有所收获,至少知道了自己的优点和不足。

      1. 缺乏常规算法训练

      2. 没有很深究到机器学习原理的细节和底层具体推导。

    想进大厂,必须得加强算法训练(多刷题),机器学习算法掌握来龙去脉,熟知重要原理和应用及优化。


    以上面试问题,大家有自己的答案了吗?对自己拿不准的问题,欢迎大家留言,一起讨论。


    相关链接

    回归算法

        回归分析简介

        最小二乘法:背后的假设和原理(前篇)

        最小二乘法原理(后):梯度下降求权重参数

        线性回归:算法兑现为python代码

        线性回归:OLS 无偏估计及相关性python分析

        线性回归:谈谈多重共线性问题及相关算法

        机器学习:说说L1和L2正则化

        决策树回归:不调包源码实现


    分类算法

            逻辑回归| 原理解析及代码实现

            逻辑回归| 算法兑现为python代码

            决策树

            对决策树剪枝

            sklearn分类和回归

            提炼出分类器算法

            贝叶斯分类

            朴素贝叶斯分类器:例子解释

            朴素贝叶斯分类:拉普拉斯修正

            单词拼写纠正器python实现

            半朴素贝叶斯分类器

            支持向量机参数求解

            支持向量机之软间隔和核函数


    聚类算法

            期望最大算法:实例解析

            高斯混合模型:聚类原理分析

            高斯混合模型:聚类求解

            高斯混合模型:求解完整代码

            高斯混合模型:不调包多维数据聚类分析

            K-Means算法

            聚类算法之DBSCAN


    集成算法

        Adaboost算法

        提升树算法思想

        XGBoost思想

        XGBoost模型构造

        XGBoost 安装及实战应用   


    推荐算法

        关联规则Apriori算法

        PageRank算法原理

        海量数据求top K 之最小堆实现

        快速排序思想求topk

    展开全文
  • 疫情期间、工作越来越难找。只有不断提升自我,让自己变得更加优秀才行。...2.简述你熟悉的聚类算法并说明其优缺点。 (1)K-mean:优势:如果样本集是团簇密集状的,K-means聚类方法效果较好。 ...
  • 算法工程师 面试题与解答

    千次阅读 2019-08-08 17:07:41
    (4)深度学习基础 这部分的准备,我推荐花书(Bengio的Deep learning)和 @魏秀参 学长的《解析卷积神经网络-深度学习实践手册》 下面是我在面试中被问到过的问题: <1> 手推BP <2> 手推RNN和LSTM结构 <3> LSTM中...
  • 机器学习 算法工程师面试指南,它提供了完整的面试知识点、编程题及题解、各科技公司的面试题锦等内容。文件是markdown格式,便于编辑。其中从机器学习到数学主要提供的是笔记与面试知识点,读者可回顾整体的知识...
  • AIinterview-master'算法工程师面试题整理' ,下载前,请注意:只有题目,答案需要自己去查找。
  • 整理自牛客 在梯度下降法中,为什么梯度的负方向是函数下降最快的方向? 为什么引入Relu呢?...推导BP算法 Inverted Dropout BN:Internal Covariate Shift Inception v1 - v4 focal loss softnms ...
  • 图像处理算法工程师面试题

    万次阅读 2017-07-06 09:47:43
    简述你熟悉的聚类算法并说明其优缺点。 3. 请描述以下任一概念:SIFT/SURF LDA/PCA 4. 请说出使用过的分类器和实现原理。 5. Random Forest的随机性表现在哪里。 6. Graph-cut的基本原理和应用。 7. GMM的基本原理和...
  • 今天给大侠带来FPGA之通信算法工程师面试题3,话不多说,上货。 点「阅读原文」查看详情 http://mp.weixin.qq.com/s?__biz=MzIxMjM5OTQ5OA==&mid=100011624&idx=1&sn=bded6e4c1a648fab1c1301b896...
  • 8.用具体算法举例说明监督学习和非监督学习的区别。 数学知识: 1.贝叶斯全概率公式。 2.最小二乘拟合的公式推导和代码实现。 3.数论or组合数学。 白板编程: 1.图的遍历 思路:深度搜索DFS和广度...
  • 算法工程师面试基础题目及答案

    千次阅读 2020-10-13 21:58:57
    文章目录 深度学习 卷积类 深度学习基础 机器学习 计算机视觉 图像处理基础 数学基础 算法基础与数据结构 语言基础 python c++ 模型部署 HR面试 深度学习 卷积类 卷积神经网络的特点 权值共享 稀疏连接 局部感知 有...
  • 2021年的金三银四跳槽季已经来啦,根据著名招聘网站的数据,人工智能、机器学习岗位已经逐渐成为行业的刚需,但薪酬上涨的同时,竞争压力也会越来越大。那么,面对这样高薪岗位的面试,你真的准备好...
  • 算法工程师面试常见问题

    万次阅读 多人点赞 2018-03-11 11:45:53
    八九月份就要开始找工作了,一直期待能够成为一名算法工程师,所以在这里总结一下算法工程师常见问题。期待9月秋招时能有一个好的结果。本篇博客会一直更新下去。 编程语言 基本算法 传统机器学习 常见机器学习...
  • 该资源为2019年雷达算法工程师笔试,包含单选,多选,判断和问答。推荐需要应聘雷达算法岗的同学可以下载。
  • 算法工程师 -常见面试题

    千次阅读 2019-09-03 11:38:52
    首先将LDA 扩展到多类高维的情况,以和问题1 中PCA 的求解对应。假设有N 个类别,并需要最终将特征降维至d 维。因此,我们要找到一个d 维投影超平面,使得投影后的样本点满足LDA 的目标—最大化类间距离和最小化类内...
  • 牛客机器学习算法工程师面试题库.pdf
  • 机器学习算法工程师面试考点汇总

    千次阅读 多人点赞 2019-07-01 08:44:45
    2019-06-29 10:41:12 ...本篇根据各个公司的机器学习相关岗位面试中问的问题进行总结,后面还会更新面试中考察所占比例。 知识点思维导图 数学基础: 1、微积分 1、SGD,Momentum,Adagard,Adam原...
  • 最全常见算法工程师面试题目整理

    万次阅读 多人点赞 2018-03-14 21:49:23
    最全算法工程师面试题目整理(一)2017-10-26 slade_sal 人工智能LeadAI沙韬伟,苏宁易购高级算法工程师。曾任职于Hewlett-Packard、滴滴出行。数据学院特邀讲师。主要研究方向包括风控、推荐和半监督学习。目前专注...
  • 算法工程师面试准备

    万次阅读 2018-08-31 15:57:28
     首先需要收集问题资料,深入理解问题,明确业务,将问题抽象成机器学习可解决的问题,也就是输入是什么,也就是通常所说的特征,输出是什么,也就是预测值,通过分析首先确定这是一个需要预测(分类、回归)还是...
  • 目录算法工程师Github、牛客网、知乎、个人博客、微信公众号、其他机器学习面试问题、资料、代码实战深度学习面试、资料、代码实战Pytorch、代码实战TensorFlo...
  • 通往机器学习算法工程师的进阶之路是崎岖险阻的。《线性代数》《统计学习方法》《机器学习》《模式识别》《深度学习》,以及《颈椎病康复指南》,这些书籍将长久地伴随着你的工作生涯。 *编辑配图 除了拥有...
  • 2面试题大全   1-图像基础知识: 1.常用的图像空间。 2.简述你熟悉的聚类算法并说明其优缺点。 3.请描述以下任一概念:SIFT/SURF LDA/PCA 4.请说出使用过的分类器和实现原理。 5. Random Forest的...
  • 面试可能会问到的深度学习算法总结

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 59,651
精华内容 23,860
关键字:

算法工程师面试题