精华内容
下载资源
问答
  • 机器学习与应用雷明pdf
    2020-11-08 14:38:58

    学习笔记,仅供参考,有错必纠

    参考自:《机器学习与应用》–雷明




    机器学习中的数学知识


    偏导数与梯度


    多元函数的偏导数是一元函数导数的推广,假设有多元函数 f ( x 1 , x 2 , . . . ,

    更多相关内容
  • 机器学习与应用》是一本适合人门系统学习的教材,理论推导证明详细、深入,结构清晰,详细地调述主要算法的工程实现细节,配以著名开源库的源代码分析(包括libsvm 、liblinear 、OpenCV、Caffe等开源库),让...


    《机器学习与应用》是一本适合人门与系统学习的教材,理论推导与证明详细、深入,结构清晰,详细地调述主要算法的工程实现细节,配以著名开源库的源代码分析(包括libsvm 、liblinear 、OpenCV、Caffe等开源库),让读者不仅知其然,还知其所以然, 真正理解算法、学会使用算法。对于计算机、人工智能及相关专业的本科生和研究生,对于从事人工智能和机器学习产品研发的工程技术人员,具有很强的参考价值。

    下载: https://pan.baidu.com/s/1FHl5JuGd0ZYc2zNyFvGFYg
    提取码: 3mmr

    《机器学习与应用》高清PDF,589页,带书签目录,文字可以复制。雷明 著。

    《机器学习与应用》由21 章组成,共分为三大部分。
    第1 ~ 3 章为第一部分,介绍机器学习的基本原理、所需的数学知识(包括微积分、线性代数、概率论和最优化方法), 以及机器学习中的核心概念。
    第4 ~ 20 章为第二部分,是主体部分,介绍各种常用的有监督学习算法、无监督学习算法、半监督学习算法和强化学习算法。对于每种算法,从原理与推导、工程实现和实际应用3 个方面进行介绍,对于大多数算法都配有实验程序。
    第21章为第三部分,介绍机器学习和深度学习算法实际应用时面对的问题,并给出典型的解决方案。
    附录A 给出各种机器学习算法的总结, 附录B 给出梯度下降法的演化关系,附录C给出EM算法的推导。

    《机器学习与应用》是机器学习和深度学习领域的入门与提高教材,系统、深入地讲述机器学习与深度学习的主流方法与理论,并紧密结合工程实践与应用。

     

    《深度学习核心技术与实践》PDF,530页,带书签目录,文字可以复制。

    配套代码和资源链接。

    下载: https://pan.baidu.com/s/1Ij3wlFb8_wWBrKZbQ-JjcQ
    提取码: e8k5

    《深度学习核心技术与实践》适合深度学习从业人士或者相关研究生作为参考资料,也可以作为入门教程来大致了解深度学习的相关前沿技术。

    《深度学习核心技术与实践》主要介绍深度学习的核心算法,以及在计算机视觉、语音识别、自然语言处理中的相关应用。《深度学习核心技术与实践》的作者们都是业界一线的深度学习从业者,所以书中所写内容和业界联系紧密,所涵盖的深度学习相关知识点比较全面。

    《深度学习核心技术与实践》主要讲解原理,较少贴代码。

     《深度学习核心技术与实践》来自一直盛产人工智能黑科技的神秘之师,他们也是开源分布式系统ytk-learn和ytk-mp4j的作者。 用一线工程视角,透过关键概念、模型、算法原理和实践经验,为入坑者破解深度学习“炼金术”。 算法、代码容易获取,结合产品需求落地机器学习才是难题,本书旨在让算法真正在团队扎根长大。 胸怀全局、了如指掌才能在实践中少走弯路,用理论滋养创新能力,这也是本书导向的至臻境界。

     

    转载于:https://www.cnblogs.com/shuaizjz/p/10459158.html

    展开全文
  • 本书的前身为《机器学习与应用》,雷明著,清华大学出版社。在第一版的基础上做了大幅度优化,并经过反复校对,最终形成此书。由于之前是第一次写书,缺乏经验,导致了书的内容过多,里面存在大量开源库代码占据篇幅...

    为什么要写本书?

    本书的前身为《机器学习与应用》,雷明著,清华大学出版社。在第一版的基础上做了大幅度优化,并经过反复校对,最终形成此书。由于之前是第一次写书,缺乏经验,导致了书的内容过多,里面存在大量开源库代码占据篇幅。这一版改进了这些问题,且增加了不少新的内容,更为系统和全面,品质也得到了不小的提升。

    在这里插入图片描述

    SIGAI微信公众号自去年4月份发布第一篇文章“机器学习-波澜壮阔40年”起,到今天为止,已经累计发布文章164篇,在各个平台的阅读次数超过超过300万次,深受人工智能学习者和从业者的喜爱,其中不乏大量的精品文章。此公众号创立之初的目的是为了帮助大家学习和掌握人工智能技术,用于学术研究和产品研发,传播人工智能技术。

    作为公众号文章的早期的主要作者,我之前写了大量阅读量深受大家喜爱的文章,如:

    学好机器学习需要哪些数学知识?

    基于深度学习的目标检测算法综述

    用一张图理解SVM的脉络

    深度卷积神经网络演化历史及结构改进脉络

    理解梯度下降法

    用一句话总结常用的机器学习算法

    机器学习算法地图

    深度学习算法地图

    其他的不再一一列举。这些文章有一个共同的特点:脉络清晰,深入浅出,一针见血。它们将一些复杂的理论和算法用很浅显易懂的方式表达出来。这是我写作的初衷,读者真正需要的是能看懂,而不是看不懂!

    由于时间仓促,且不是正规的出版物,这些文章的质量无法得到完全的保证。为了让内容更为系统,准确,帮助大家学好机器学习与深度学习,我一直有写一本机器学习教材的想法。但是,市面上已经有不少这方面的经典教材,国外的如《PRML,Pattern Recognition and Machine Learning》,《ESL,The Elements of Statistical Learning》,《Pattern Classification》,《MLAPP,Machine Learning-A Probabilistic Perspective》,《Deep Learning》。国内的有大家耳熟能详的《机器学习 西瓜书》以及《统计学习方法》。这些经典教材经过了市场检验,其质量之高,是毋庸置疑的!既然已经有这么多经典教材,还有“重复造轮子”的必要吗?

    笔者的回答是有必要。这里面国外的经典教材,笔者当年基本上都读过,国内的教材,也大致翻了一遍。作为一个过来人,我觉得这些教材在如下方面还可以做出改进:

    1.内容是否系统性全面,是否老化。仔细读过这些教材的读者会发现,要真正做到这一点并不容易。机器学习和深度学习最近几年发展很快,新方法和理论层出不穷。若非频繁的更新,经典的教材要跟上时代的步伐绝非易事。另外,由于作者自己的知识面和偏好,能够全面覆盖机器学习和深度学习主要算法的书屈指可数。当然,是否要在一本书里同时讲机器学习和深度学习也是有争议的。

    2.表述是否浅显易懂而又不失深度。在这方面,PRML堪称优秀代表,作者语言朴实易懂,将各种算法和理论阐述的非常清晰。而有的教材,看上去则晦涩难懂,尤其是对初学者。

    3.对理论的讲述是否细致深入。这一点的优秀代表是《统计学习方法》和《PRML》,《ESL》以及《MLAPP》。要将算法的推导和证明做的很细,是非常耗费时间和精力的。

    4.对实际的应用是否有系统性的阐述。要知道,人工智能,乃至整个计算机科学,是偏实践和应用的学科。很多读者在学完机器学习之后并不知道怎么用的。而正式的教材,一般也不提及实际应用。这会造成很多困惑:这个算法到底有什么用?应该怎么用?

    笔者发现,市面上能同时满足这几点的经典教材目前还空缺,因此下定决心,写出一本系统而全面,让读者能够读懂,且知道怎么用的教材来。事实上,这一计划在2014年就开始了,本书的部分内容也始于这一年。笔者深感自己功力有限,为了不班门弄斧,在写此书之前阅读了大量经典论文,有不少都经过了反复推敲和锤炼。写书所耗费的时间和精力大幅度的超出了我的预期。

    为什么要选择这本书?

    本书适合作为高等学习本科,研究生的机器学习和深度学习教材,也可作为人工智能领域研发人员的参考书。作为一本机器学习、深度学习入门与提高,尤其是入门的教材,在笔者看来,需要具备以下特点:

    1.内容全面系统。作为教材,对一个领域的阐述必须是全面而系统的,而非支离破碎的知识点。本书做到了这一点,内容包括了有监督学习,无监督学习,强化学习的核心算法,共计54种。内容的组织合理,条理清晰。结合SIGAI的“机器学习算法地图”,“深度学习算法地图”使用,效果更佳。如果完整的学习本书,可以让你对机器学习和深度学习有全面而系统的理解。为了让读者理解数学公式,本书特意在第2章安排了数学知识的讲解。

    2.深入浅出。写书的目的是让读者能够看到,且更容易看懂,即将复杂的问题简单化,而不是相反。本书的内容在深度上与经典教材相当,在表述上下足了功夫,用浅显易懂的语言将复杂的机器学习算法阐述清楚。对于这一领域公认的难以理解的点,如SVM,EM算法,反向传播算法,流形学习等有非常清晰而易懂的讲述。化抽象为具体,变复杂为简单。对于很多关键点,一针见血,直指问题的本质。这是一本读者真正能够读懂的机器学习教材。

    3.理论讲述详细。对主要的机器学习算法和理论,从思想起源讲起,有详细的推导和证明,很多内容是市面上的教材所不曾有的。笔者亲手推导了几乎所有公式,证明了大量的核心结论。为了让读者对算法的实现不再困惑,对实现时的要点有系统性的阐述。

    4.系统的阐述了具体应用。对主要算法在机器视觉,语音识别,自然语言处理等领域的应用有详细的阐述,帮助读者理解算法的使用,养成实际建模的能力。

    5.配有大量实验程序源代码。对主要的机器学习算法,均配有实验程序,使用python语言编写,基于sklearn,libsvm,liblinear等开源库。为了节约篇幅,所有代码均不在书中出现,通过扫描二维码免费下载。通过实验程序可以更好的理解算法的原理,掌握算法和开源库的使用。

    6.配有大量讲解视频。对书中的难点,配有共计35个讲解视频,清晰而透彻。这些视频之前已经被国内外各层次的高校学生和老师大量使用,得到了广泛的好评。通过扫描二维码可以免费观看讲解视频。

    7.参考文献齐全。各章均列出了主要的参考文献,供读者进一步阅读。

    对于有意向将本书作为教材的高校,我们将在后续免费提供习题集和配套PPT。

    在这里插入图片描述

    本书的目录

    下面列出这本书的目录,供大家参考,全书共397页,23章。由基本概念与数学知识,主要的机器学习算法与理论,工程实践问题3部分构成。第一部分介绍了机器学习领域的基本概念与所需的核心数学知识点。第二部分内容含括了有监督学习,降维,聚类,半监督学习,强化学习的核心算法。第三部分内容讲述了工程实践中的若干重要问题。

    第一部分基本概念与数学知识

    第1章机器学习简介3

    1.1机器学习是什么3

    1.1.1一个简单的例子3

    1.1.2为什么需要机器学习5

    1.2典型应用7

    1.2.1语音识别7

    1.2.2人脸检测8

    1.2.3人机对弈9

    1.2.4机器翻译10

    1.2.5自动驾驶11

    1.3发展历程11

    1.3.1历史成就11

    1.3.2当前进展12

    1.4关于本书13

    参考文献13

    第2章数学知识15

    2.1微积分和线性代数15

    2.1.1导数15

    2.1.2向量与矩阵17

    2.1.3偏导数与梯度19

    2.1.4雅可比矩阵20

    2.1.5Hessian矩阵21

    2.1.6泰勒展开22

    2.1.7行列式22

    2.1.8特征值与特征向量23

    2.1.9奇异值分解24

    2.1.10二次型24

    2.1.11向量与矩阵求导24

    2.2最优化方法25

    2.2.1梯度下降法25

    2.2.2牛顿法26

    2.2.3坐标下降法27

    2.2.4拉格朗日乘数法28

    2.2.5凸优化28

    2.2.6拉格朗日对偶32

    2.2.7KKT条件34

    2.2.8拟牛顿法35

    2.2.9面临的问题36

    2.3概率论37

    2.3.1随机事件与概率37

    2.3.2条件概率37

    2.3.3随机变量38

    2.3.4数学期望与方差39

    2.3.5随机向量39

    2.3.6最大似然估计40

    参考文献41

    第3章基本概念42

    3.1算法分类42

    3.1.1监督信号42

    3.1.2分类问题与回归问题43

    3.1.3判别模型与生成模型45

    3.1.4强化学习45

    3.2模型评价指标46

    3.2.1精度与召回率46

    3.2.2ROC曲线46

    3.2.3混淆矩阵48

    3.2.4交叉验证48

    3.3模型选择48

    3.3.1过拟合与欠拟合48

    3.3.2偏差与方差分解49

    3.3.3正则化50

    参考文献52

    第二部分主要的机器学习算法与理论

    第4章贝叶斯分类器55

    4.1贝叶斯决策55

    4.2朴素贝叶斯分类器56

    4.2.1离散型特征56

    4.2.2连续型特征57

    4.3正态贝叶斯分类器57

    4.3.1训练算法57

    4.3.2预测算法58

    4.4实验程序59

    4.5应用61

    参考文献61

    第5章决策树62

    5.1树形决策过程62

    5.2分类与回归树63

    5.3训练算法64

    5.3.1递归分裂过程64

    5.3.2寻找最佳分裂64

    5.3.3叶子节点值的设定67

    5.3.4属性缺失问题67

    5.3.5剪枝算法68

    5.3.6训练算法的流程69

    5.3.7计算变量的重要性70

    5.4实验程序70

    5.5应用71

    参考文献71

    第6章k近邻算法72

    6.1基本概念72

    6.2预测算法72

    6.3距离定义73

    6.3.1常用距离定义74

    6.3.2距离度量学习74

    6.4实验程序75

    6.5应用76

    参考文献76

    第7章数据降维78

    7.1主成分分析78

    7.1.1数据降维问题78

    7.1.2计算投影矩阵78

    7.1.3向量降维81

    7.1.4向量重构81

    7.2流形学习81

    7.2.1局部线性嵌入82

    7.2.2拉普拉斯特征映射83

    7.2.3局部保持投影86

    7.2.4等距映射87

    7.2.5随机近邻嵌入88

    7.2.6t分布随机近邻嵌入89

    7.3实验程序90

    7.4应用91

    参考文献91

    第8章线性判别分析92

    8.1用投影进行分类92

    8.2投影矩阵92

    8.2.1一维的情况92

    8.2.2推广到高维94

    8.3实验程序96

    8.4应用96

    参考文献97

    第9章人工神经网络98

    9.1多层前馈型神经网络98

    9.1.1神经元98

    9.1.2网络结构99

    9.1.3正向传播算法100

    9.2反向传播算法101

    9.2.1一个简单的例子101

    9.2.2完整的算法105

    9.3实验程序109

    9.4理论解释110

    9.4.1数学性质110

    9.4.2与神经系统的关系111

    9.5面临的问题111

    9.5.1梯度消失111

    9.5.2退化111

    9.5.3局部极小值111

    9.5.4鞍点111

    9.6实现细节问题112

    9.6.1输入值与输出值112

    9.6.2网络规模112

    9.6.3激活函数112

    9.6.4损失函数113

    9.6.5权重初始化113

    9.6.6正则化113

    9.6.7学习率的设定114

    9.6.8动量项114

    9.7应用114

    参考文献115

    第10章支持向量机118

    10.1线性分类器118

    10.1.1线性分类器概述118

    10.1.2分类间隔118

    10.2线性可分的问题119

    10.2.1原问题119

    10.2.2对偶问题120

    10.3线性不可分的问题123

    10.3.1原问题123

    10.3.2对偶问题123

    10.4核映射与核函数126

    10.5SMO算法129

    10.5.1求解子问题129

    10.5.2优化变量的选择132

    10.6多分类问题133

    10.7实验程序134

    10.8libsvm简介136

    10.8.1求解算法137

    10.8.2库的使用140

    10.9应用142

    参考文献143

    第11章线性模型145

    11.1logistic回归145

    11.1.1第一种表述145

    11.1.2第二种表述147

    11.1.3L2正则化原问题148

    11.1.4L2正则化对偶问题151

    11.1.5L1正则化原问题152

    11.1.6实验程序154

    11.2线性支持向量机156

    11.2.1L2正则化L1loss SVC原问题156

    11.2.2L2正则化L2loss SVC原问题156

    11.2.3L2正则化SVC对偶问题157

    11.2.4L1正则化L2loss SVC原问题158

    11.2.5多类线性支持向量机158

    11.2.6实验程序160

    11.3liblinear简介160

    11.3.1求解的问题161

    11.3.2库的使用161

    11.4softmax回归162

    11.5应用164

    参考文献165

    第12章随机森林166

    12.1集成学习166

    12.1.1随机抽样166

    12.1.2Bagging算法167

    12.2随机森林概述167

    12.3训练算法167

    12.4变量的重要性168

    12.5实验程序169

    12.6应用169

    参考文献169

    第13章Boosting算法171

    13.1AdaBoost算法171

    13.1.1强分类器与弱分类器171

    13.1.2训练算法172

    13.1.3训练误差分析174

    13.2广义加法模型176

    13.3各种AdaBoost算法177

    13.3.1离散型AdaBoost177

    13.3.2实数型AdaBoost179

    13.3.3LogitBoost180

    13.3.4Gentle型AdaBoost181

    13.4实现细节问题182

    13.4.1弱分类器182

    13.4.2弱分类器的数量182

    13.4.3样本权重削减183

    13.5实验程序183

    13.6梯度提升算法183

    13.6.1梯度提升框架184

    13.6.2回归问题185

    13.6.3分类问题185

    13.6.4XGBoost187

    13.7应用——目标检测189

    13.7.1VJ框架的原理190

    13.7.2模型训练192

    参考文献193

    第14章深度学习概论195

    14.1机器学习面临的挑战195

    14.1.1人工特征196

    14.1.2机器学习算法197

    14.2深度学习技术197

    14.3进展与典型应用199

    14.3.1计算机视觉200

    14.3.2语音识别202

    14.3.3自然语言处理202

    14.3.4计算机图形学203

    14.3.5推荐系统203

    14.3.6深度强化学习204

    14.4自动编码器204

    14.4.1自动编码器简介204

    14.4.2去噪自动编码器205

    14.4.3稀疏自动编码器205

    14.4.4收缩自动编码器206

    14.4.5多层编码器206

    14.5受限玻尔兹曼机206

    14.5.1玻尔兹曼分布206

    14.5.2受限玻尔兹曼机结构207

    14.5.3训练算法209

    14.5.4深度玻尔兹曼机210

    14.5.5深度置信网210

    参考文献210

    第15章卷积神经网络218

    15.1网络结构218

    15.1.1卷积层219

    15.1.2池化层222

    15.1.3全连接层222

    15.2训练算法223

    15.2.1卷积层223

    15.2.2池化层226

    15.2.3随机梯度下降法227

    15.2.4迁移学习228

    15.3典型网络228

    15.3.1LeNet5网络228

    15.3.2AlexNet网络229

    15.3.3VGG网络230

    15.3.4GoogLeNet网络231

    15.4理论分析232

    15.4.1反卷积运算232

    15.4.2卷积层可视化233

    15.4.3理论解释235

    15.5挑战与改进措施236

    15.5.1卷积层236

    15.5.2池化层236

    15.5.3激活函数237

    15.5.4损失函数237

    15.5.5网络结构237

    15.5.6批量归一化241

    15.6实现细节242

    15.6.1卷积层242

    15.6.2激活函数244

    15.6.3内积层244

    15.6.4损失层245

    15.6.5求解器248

    15.7应用——计算机视觉251

    15.7.1人脸检测251

    15.7.2通用目标检测254

    15.7.3人脸关键点定位262

    15.7.4人脸识别263

    15.7.5图像分割265

    参考文献266

    第16章循环神经网络270

    16.1网络结构270

    16.1.1循环层270

    16.1.2输出层271

    16.1.3一个简单的例子272

    16.1.4深层网络272

    16.2网络的训练273

    16.2.1一个简单的例子273

    16.2.2完整的算法275

    16.3挑战与改进措施277

    16.3.1梯度消失277

    16.3.2长短期记忆模型278

    16.3.3门控循环单元279

    16.3.4双向网络279

    16.4序列预测问题280

    16.4.1序列标注问题280

    16.4.2连接主义时序分类281

    16.4.3序列到序列学习285

    16.5应用——语音识别287

    16.5.1语音识别问题287

    16.5.2GMM-HMM框架288

    16.5.3深度模型288

    16.6应用——自然语言处理291

    16.6.1中文分词292

    16.6.2词性标注293

    16.6.3命名实体识别293

    16.6.4文本分类294

    16.6.5自动摘要296

    16.6.6机器翻译296

    参考文献298

    第17章生成对抗网络302

    17.1随机数据生成302

    17.2生成对抗网络结构303

    17.2.1生成模型303

    17.2.2判别模型304

    17.3模型的训练304

    17.3.1目标函数304

    17.3.2训练算法305

    17.3.3理论分析306

    17.4应用与改进307

    17.4.1改进方案308

    17.4.2典型应用311

    参考文献313

    第18章聚类算法314

    18.1问题定义314

    18.2层次聚类315

    18.3基于质心的算法315

    18.4基于概率分布的算法316

    18.4.1高斯混合模型316

    18.4.2EM算法317

    18.5基于密度的算法322

    18.5.1DBSCAN算法322

    18.5.2OPTICS算法324

    18.5.3Mean Shift算法326

    18.6基于图的算法328

    18.7算法评价指标331

    18.7.1内部指标331

    18.7.2外部指标331

    18.8实验程序332

    18.9应用332

    参考文献332

    第19章半监督学习334

    19.1问题假设334

    19.1.1连续性假设334

    19.1.2聚类假设334

    19.1.3流形假设334

    19.1.4低密度分割假设334

    19.2启发式算法335

    19.2.1自训练335

    19.2.2协同训练335

    19.3生成模型335

    19.4低密度分割336

    19.5基于图的算法336

    19.6半监督深度学习337

    参考文献338

    第20章隐马尔可夫模型340

    20.1马尔可夫模型340

    20.2隐马尔可夫模型简介343

    20.2.1模型结构343

    20.2.2中文分词345

    20.3估值问题345

    20.4解码问题347

    20.5训练算法349

    20.6应用352

    参考文献352

    第21章条件随机场353

    21.1马尔可夫随机场353

    21.1.1概率图模型353

    21.1.2马尔可夫随机场354

    21.2条件随机场概述355

    21.2.1条件随机场简介355

    21.2.2线性链条件随机场355

    21.3推断算法357

    21.4训练算法359

    21.5应用360

    参考文献360

    第22章强化学习361

    22.1强化学习简介361

    22.1.1问题定义361

    22.1.2马尔可夫决策过程362

    22.2基于动态规划的算法366

    22.2.1策略迭代算法366

    22.2.2价值迭代算法368

    22.3蒙特卡洛算法369

    22.3.1算法简介369

    22.3.2状态价值函数估计370

    22.3.3动作价值函数估计371

    22.3.4蒙特卡洛控制371

    22.4时序差分学习372

    22.4.1Sarsa算法372

    22.4.2Q学习373

    22.5深度强化学习374

    22.5.1深度Q网络375

    22.5.2策略梯度算法378

    22.6应用381

    参考文献381

    第三部分工程实践问题

    第23章工程实践问题概述385

    23.1实现细节问题385

    23.1.1训练样本385

    23.1.2特征预处理386

    23.1.3模型选择386

    23.1.4过拟合问题386

    23.2安全性问题387

    23.2.1对抗样本387

    23.2.2形成原因分析389

    23.3实现成本问题390

    23.3.1训练样本量390

    23.3.2计算与存储成本390

    23.4深度模型优化391

    23.4.1剪枝与编码391

    23.4.2二值化网络392

    23.4.3卷积核分离396

    参考文献397

    如何使用本书

    学习本书需要读者具有大学本科理工科的数学基础,以及基本的程序设计知识。包括:

    微积分/高等数学

    线性代数

    概率论

    书中有大量涉及最优化方法,对于国内高校的大部分学生是没有学过这门课的,但通过阅读本书第2章,能够有效弥补这些知识。

    如果有至少一种程序设计语言的知识,已经数据结构和算法的基础知识,阅读起来会更为顺畅。要阅读和修改本书的实验程序则需要读者掌握python语言程序设计。

    对于要学机器学习或深度学习课程的同学,建议系统的阅读本书,以保证能够理解内容,知识系统。对于要实际使用机器学习或深度学习算法的工程技术人员,可以根据自己的需要进行裁剪,阅读所需的章节,以节约时间和精力。

    作者简介

    雷明,2009年毕业于清华大学计算机系,研究方向为机器学习,机器视觉。曾发表论文数篇。毕业后曾就职于百度,任高级软件工程师;zmodo/meshare,任CTO。有超过15年机器学习学术研究与产品研发经验。SIGAI微信公众号早期主要作者。

    如何购买本书

    在这里插入图片描述

    本书已经在京东预售,购买链接为:

    https://item.jd.com/12685964.html?dist=jd

    由于水平有限,时间仓促,书中难免会有错误。本书的勘误可以在:

    http://www.tensorinfinity.com/paper_78.html

    免费获取

    文中所提及的深受人民群众喜爱的机器学习算法地图和深度学习算法地图可以在:

    http://www.tensorinfinity.com/paper_158.html

    http://www.tensorinfinity.com/paper_18.html

    免费获取

    致谢

    本书在写作和优化过程中收到了大量读者和同事、同行的反馈。这本书的诞生凝聚了清华大学出版社白立军老师的大量心血,得到了出版社领导和老师的大力支持。数位热心读者为本书审稿。上海交通大学计算机系严骏驰教授为本书作序,哈佛大学数学中心教授、丘成桐先生的弟子顾险峰教授,前优酷首席科学家李卓桓师兄,笔者的好友刘彬先生,师弟欧阳鹏博士,张振博士为本书写推荐。

    在此一并表示感谢!

    展开全文
  • 那么你需要这样一本帮你解决学习机器学习的数学问题的书,首选《机器学习的数学》,本书覆盖了人工智能领域中与机器学习相关的数学知识体系,不仅囊括了微积分和线性代数等基本数学原理,还详细讲解了概率论、信息论...

     

    如何解决机器学习领域的数学问题,打下坚实的数学基础?是很多初学者乃至进阶者关心的话题。我们把这个问题拆解成下面几个问题:

    1. 为什么需要数学?

    2. 机器学习中究竟用到了哪些数学知识?

    3. 如何掌握这些数学知识?

     

    那么你需要这样一本帮你解决学习机器学习的数学问题的书,首选《机器学习的数学》,本书覆盖了人工智能领域中与机器学习相关的数学知识体系,不仅囊括了微积分和线性代数等基本数学原理,还详细讲解了概率论、信息论、最优化方法等诸多内容,这些知识是机器学习中的目标函数构造、模型优化以及各种机器学习算法的核心和基础。

    本书希望通过对数学知识的讲解帮助读者深刻理解算法背后的机理,并厘清各种算法之间的内在联系。 本书重视理论与实践相结合,在讲解数学知识的同时也对其在机器学习领域的实际应用进行了举例说明,方便读者更具象化地理解抽象的数学理论,同时对机器学习算法有更深刻的认识。 本书语言精练,条理清晰,内容翔实全面,公式推导严格周密,将理论与工程实践相结合, 展示了机器学习方法背后的数学原理,是集专业性与通俗性为一体的上乘之作。通过本书,初学 者可以奠定扎实的数学基础,从而为后续掌握机器学习的具体技术和应用铺平道路。从业者也可 以利用本书强化巩固基础知识,从技术背后的数学本质出发来解决工程问题。

     

    《机器学习的数学》

    第1章介绍一元函数微积分的核心知识,包括有关基础知识、一元函数微分学、一元函数积分学,以及常微分议程,它们是理解后面各章的基础。

    第2章介绍线性代数与矩阵论的核心知识,包括向量与矩阵、行列式、线性方程组、矩阵的特征值与特征向量、二次型,以及矩阵分解,它们是学习多元函数微积分、最优化方法、概率论,以及图论等知识的基础。

    第3章介绍多元函数微积分、包括多元函数微分、多元函数积分,以及无穷级数。

    第4章介绍最优化方法,侧重于连续化优问题,包括各种数值优化算法、凸优化问题、带约束的约化问题、多目标优化问题、变分法,以及目标函数的构造,它们在机器学习中处于核心地位。

    第5章介绍概率论的核心知识,包括随机事件与概率、随机变量与概率分布、极限定理、参数估计问题、在机器学习中常用的随机算法。以及采样算法。用概率论的观点对机器学习问题进行建模是一类重要的方法。

    第6章介绍信息论的知识,包括熵、交叉熵、KL散度等,它们被广泛用于构造目标函数,对机器学习算法进行理论分析。

    第7章介绍随机过程,包括马尔可夫过程与高斯过程,以及马尔可夫链采样算法。高斯过程回归是贝叶斯优化的基础。

    第8章介绍图论的核心知识,包括基本概念。机器学习中使用的各种典型的图、图的重要算法,以及谱图理论。它们于流于学习、谱聚类、概率图模型、图神经网络等机器学习算法。

    专业评论

    从机器学习的角度讲述数学,从数学的角度讲述机器学习。语言精炼,知识点密集,学习路线清晰,是一本帮助掌握数学知识和理解机器学习算法原理的好书,可以满足不同层次读者的需求。——知名Python讲师,16本Python 系列图书作者 董付国


    数学是很多读者学习机器学习、深度学习、强化学习感到困难的最主要原因之一,只有掌握了所需的数学知识,才能理解机器学习算法的原理。本书清晰地讲述了这些数学知识的原理,精准地覆盖了所需的数学知识。是一本帮助这一领域读者奠定基础的力作。——Yi+AI联合创始人兼CTO,前阿里巴巴和百度IDL深度学习算法专家 刘彬


    掌握数学知识是学好机器学习的前提,如何精确而系统地掌握机器学习所需的数学知识,是很多读者关注的问题。本书为此问题提供了一个很好的解决方案。全书用浅显易懂的语言讲述微积分、线性代数与矩阵论、最优化方法、概率论、信息论、随机过程、图论等核心的数学知识,并介绍了它们在机器学习领域的应用,做到了理论与应用的无缝衔接。推荐机器学习领域和广大数学爱好者阅读。——前优酷首席科学家,谷歌机器学习开发者专家 李卓桓

    目录

    第1 章一元函数微积分1

    1.1 极限与连续 1

    1.1.1 可数集与不可数集 1

    1.1.2 数列的极限 3

    1.1.3 函数的极限 7

    1.1.4 函数的连续性与间断点 9

    1.1.5 上确界与下确界 11

    1.1.6 李普希茨连续性 12

    1.1.7 无穷小量 13

    1.2 导数与微分 14

    1.2.1 一阶导数 14

    1.2.2 机器学习中的常用函数 20

    1.2.3 高阶导数 22

    1.2.4 微分 24

    1.2.5 导数与函数的单调性 25

    1.2.6 极值判别法则 26

    1.2.7 导数与函数的凹凸性 28

    1.3 微分中值定理 29

    1.3.1 罗尔中值定理 29

    1.3.2 拉格朗日中值定理 29

    1.3.3 柯西中值定理 31

    1.4 泰勒公式 31

    1.5 不定积分 33

    1.5.1 不定积分的定义与性质 33

    1.5.2 换元积分法 35

    1.5.3 分部积分法 36

    1.6 定积分 37

    1.6.1 定积分的定义与性质 38

    1.6.2 牛顿-莱布尼茨公式 39

    1.6.3 定积分的计算 40

    1.6.4 变上限积分 41

    1.6.5 定积分的应用 42

    1.6.6 广义积分 44

    1.7 常微分方程 45

    1.7.1 基本概念 45

    1.7.2 一阶线性微分方程 46

    第2 章线性代数与矩阵论49

    2.1 向量及其运算 49

    2.1.1 基本概念 49

    2.1.2 基本运算 51

    2.1.3 向量的范数 53

    2.1.4 解析几何 55

    2.1.5 线性相关性 57

    2.1.6 向量空间 58

    2.1.7 应用——线性回归 61

    2.1.8 应用——线性分类器与支持

    向量机 62

    2.2 矩阵及其运算 65

    2.2.1 基本概念 65

    2.2.2 基本运算 67

    2.2.3 逆矩阵 72

    2.2.4 矩阵的范数 78

    2.2.5 应用——人工神经网络 78

    2.2.6 线性变换 81

    2.3 行列式 82

    2.3.1 行列式的定义与性质 83

    2.3.2 计算方法 91

    2.4 线性方程组 92

    2.4.1 高斯消元法 92

    2.4.2 齐次方程组 93

    2.4.3 非齐次方程组 95

    2.5 特征值与特征向量 97

    2.5.1 特征值与特征向量 97

    2.5.2 相似变换 105

    2.5.3 正交变换 106

    2.5.4 QR 算法 110

    2.5.5 广义特征值 112

    2.5.6 瑞利商 112

    2.5.7 谱范数与特征值的关系 114

    2.5.8 条件数 114

    2.5.9 应用——谱归一化与谱正则化 115

    2.6 二次型 116

    2.6.1 基本概念 116

    2.6.2 正定二次型与正定矩阵 116

    2.6.3 标准型 119

    2.7 矩阵分解 121

    2.7.1 楚列斯基分解 121

    2.7.2 QR 分解 123

    2.7.3 特征值分解 127

    2.7.4 奇异值分解 128

    第3 章多元函数微积分133

    3.1 偏导数 133

    3.1.1 一阶偏导数 133

    3.1.2 高阶偏导数 134

    3.1.3 全微分 136

    3.1.4 链式法则 136

    3.2 梯度与方向导数 138

    3.2.1 梯度 138

    3.2.2 方向导数 139

    3.2.3 应用——边缘检测与HOG

    特征 139

    3.3 黑塞矩阵 140

    3.3.1 黑塞矩阵的定义与性质 141

    3.3.2 凹凸性 141

    3.3.3 极值判别法则 143

    3.3.4 应用——最小二乘法 145

    3.4 雅可比矩阵 146

    3.4.1 雅可比矩阵的定义和性质 146

    3.4.2 链式法则的矩阵形式 148

    3.5 向量与矩阵求导 150

    3.5.1 常用求导公式 150

    3.5.2 应用——反向传播算法 154

    3.6 微分算法 156

    3.6.1 符号微分 156

    3.6.2 数值微分 157

    3.6.3 自动微分 158

    3.7 泰勒公式 159

    3.8 多重积分 161

    3.8.1 二重积分 161

    3.8.2 三重积分 164

    3.8.3 n 重积分 167

    3.9 无穷级数 170

    3.9.1 常数项级数 170

    3.9.2 函数项级数 173

    第4 章最优化方法176

    4.1 基本概念 176

    4.1.1 问题定义 177

    4.1.2 迭代法的基本思想 179

    4.2 一阶优化算法 180

    4.2.1 梯度下降法 180

    4.2.2 最速下降法 183

    4.2.3 梯度下降法的改进 184

    4.2.4 随机梯度下降法 186

    4.2.5 应用——人工神经网络 187

    4.3 二阶优化算法 188

    4.3.1 牛顿法 188

    4.3.2 拟牛顿法 189

    4.4 分治法 193

    4.4.1 坐标下降法 193

    4.4.2 SMO 算法 194

    4.4.3 分阶段优化 195

    4.4.4 应用——logistic 回归 196

    4.5 凸优化问题 198

    4.5.1 数值优化算法面临的问题 198

    4.5.2 凸集 199

    4.5.3 凸优化问题及其性质 200

    4.5.4 机器学习中的凸优化问题 201

    4.6 带约束的优化问题 202

    4.6.1 拉格朗日乘数法 202

    4.6.2 应用——线性判别分析 204

    4.6.3 拉格朗日对偶 205

    4.6.4 KKT 条件 208

    4.6.5 应用——支持向量机 209

    4.7 多目标优化问题 213

    4.7.1 基本概念 213

    4.7.2 求解算法 215

    4.7.3 应用——多目标神经结构搜

    索 215

    4.8 泛函极值与变分法 216

    4.8.1 泛函与变分 217

    4.8.2 欧拉—拉格朗日方程 218

    4.8.3 应用——证明两点之间直线

    最短 220

    4.9 目标函数的构造 221

    4.9.1 有监督学习 221

    4.9.2 无监督学习 224

    4.9.3 强化学习 225

    第5 章概率论228

    5.1 随机事件与概率 229

    5.1.1 随机事件概率 229

    5.1.2 条件概率 233

    5.1.3 全概率公式 234

    5.1.4 贝叶斯公式 235

    5.1.5 条件独立 236

    5.2 随机变量 236

    5.2.1 离散型随机变量 236

    5.2.2 连续型随机变量 237

    5.2.3 数学期望 240

    5.2.4 方差与标准差 242

    5.2.5 Jensen 不等式 243

    5.3 常用概率分布 244

    5.3.1 均匀分布 244

    5.3.2 伯努利分布 246

    5.3.3 二项分布 247

    5.3.4 多项分布 248

    5.3.5 几何分布 249

    5.3.6 正态分布 250

    5.3.7 t 分布 252

    5.3.8 应用——颜色直方图 253

    5.3.9 应用——贝叶斯分类器 254

    5.4 分布变换 254

    5.4.1 随机变量函数 254

    5.4.2 逆变换采样算法 256

    5.5 随机向量 258

    5.5.1 离散型随机向量 258

    5.5.2 连续型随机向量 260

    5.5.3 数学期望 261

    5.5.4 协方差 262

    5.5.5 常用概率分布 265

    5.5.6 分布变换 268

    5.5.7 应用——高斯混合模型 269

    5.6 极限定理 271

    5.6.1 切比雪夫不等式 271

    5.6.2 大数定律 271

    5.6.3 中心极限定理 273

    5.7 参数估计 273

    5.7.1 最大似然估计 274

    5.7.2 最大后验概率估计 276

    5.7.3 贝叶斯估计 278

    5.7.4 核密度估计 278

    5.7.5 应用——logistic 回归 280

    5.7.6 应用——EM 算法 282

    5.7.7 应用——Mean Shift 算法 286

    5.8 随机算法 288

    5.8.1 基本随机数生成算法 288

    5.8.2 遗传算法 290

    5.8.3 蒙特卡洛算法 293

    5.9 采样算法 295

    5.9.1 拒绝采样 296

    5.9.2 重要性采样 297

    第6 章信息论298

    6.1 熵与联合熵 298

    6.1.1 信息量与熵 298

    6.1.2 熵的性质 300

    6.1.3 应用——决策树 302

    6.1.4 联合熵 303

    6.2 交叉熵 305

    6.2.1 交叉熵的定义 306

    6.2.2 交叉熵的性质 306

    6.2.3 应用——softmax 回归 307

    6.3 Kullback-Leibler 散度 309

    6.3.1 KL 散度的定义 309

    6.3.2 KL 散度的性质 311

    6.3.3 与交叉熵的关系 312

    6.3.4 应用——流形降维 312

    6.3.5 应用——变分推断 313

    6.4 Jensen-Shannon 散度 316

    6.4.1 JS 散度的定义 316

    6.4.2 JS 散度的性质 316

    6.4.3 应用——生成对抗网络 317

    6.5 互信息 320

    6.5.1 互信息的定义 320

    6.5.2 互信息的性质 321

    6.5.3 与熵的关系 322

    6.5.4 应用——特征选择 323

    6.6 条件熵 324

    6.6.1 条件熵定义 324

    6.6.2 条件熵的性质 325

    6.6.3 与熵以及互信息的关系 325

    6.7 总结 326

    第7 章随机过程328

    7.1 马尔可夫过程 328

    7.1.1 马尔可夫性 329

    7.1.2 马尔可夫链的基本概念 330

    7.1.3 状态的性质与分类 333

    7.1.4 平稳分布与极限分布 337

    7.1.5 细致平衡条件 342

    7.1.6 应用——隐马尔可夫模型 343

    7.1.7 应用——强化学习 345

    7.2 马尔可夫链采样算法 348

    7.2.1 基本马尔可夫链采样 349

    7.2.2 MCMC 采样算法 349

    7.2.3 Metropolis-Hastings 算法 351

    7.2.4 Gibbs 算法 353

    7.3 高斯过程 355

    7.3.1 高斯过程性质 355

    7.3.2 高斯过程回归 355

    7.3.3 应用——贝叶斯优化 358

    第8 章图论363

    8.1 图的基本概念 363

    8.1.1 基本概念 363

    8.1.2 应用——计算图与自动微分 365

    8.1.3 应用——概率图模型 370

    8.1.4 邻接矩阵与加权度矩阵 371

    8.1.5 应用——样本集的相似度图 372

    8.2 若干特殊的图 373

    8.2.1 联通图 373

    8.2.2 二部图 374

    8.2.3 应用——受限玻尔兹曼机 374

    8.2.4 有向无环图 376

    8.2.5 应用——神经结构搜索 376

    8.3 重要的算法 380

    8.3.1 遍历算法 380

    8.3.2 最短路径算法 381

    8.3.3 拓扑排序算法 382

    8.4 谱图理论 384

    8.4.1 拉普拉斯矩阵 385

    8.4.2 归一化拉普拉斯矩阵 388

    8.4.3 应用——流形降维 390

    机器学习的数学

     

    雷明 著

    本书的目标是帮助读者全面、系统地学习机器学习所必须的数学知识。全书由8章组成,力求精准、最小地覆盖机器学习的数学知识。包括微积分,线性代数与矩阵论,最优化方法,概率论,信息论,随机过程,以及图论。本书从机器学习的角度讲授这些数学知识,对它们在该领域的应用举例说明,使读者对某些抽象的数学知识和理论的实际应用有直观、具体的认识。 本书内容紧凑,结构清晰,深入浅出,讲解详细。可用作计算机、人工智能、电子工程、自动化、数学等相关专业的教材与教学参考书。对人工智能领域的工程技术人员与产品研发人员,本书也有很强的参考价值。对于广大数学与应用的数学爱好者,本书亦为适合自学的读本。

    展开全文
  • 纵观上周新书表现,机器学习、Python、linux书受到程序员们的喜爱,下面小编就来给你们盘点一下。顺序按榜单顺序排列。 1、机器学习的数学 雷明 著 人工智能深度学习领域经典教程,AI程序员的数学参考书 ...
  • 白话机器学习数学——梯度下降牛顿迭代 导言 预备知识 多元函数的泰勒展开式 梯度的概念 Hessian矩阵 梯度下降法 牛顿法 拓展-坐标下降法 总结 导言 机器学习中,我们为了得到最优结果,...
  • 7、机器学习的数学 雷明 著 人工智能深度学习领域教程,AI程序员的数学参考书,透彻理解机器学习算法,从数学层面搞懂核心算法原理的逻辑,python程序讲解 本书的目标是帮助读者全面、系统地学习机器学习所必须的...
  • 1.轻松入门:文笔流畅,通俗易懂,从Python基础、NumPy、Pandas、Matplotlib,到机器学习算法,循序渐进,帮助零基础读者快速入门。2.图文并茂:一图胜千言,书中配有精心绘制的近200幅插图,形象生动,融会一心。3....
  • 机器学习算法地图

    千次阅读 多人点赞 2018-07-05 12:10:07
    其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。 书的购买链接 书的勘误,优化,源代码资源 文章《机器学习算法地图》系...
  • 机器学习发展历史回顾

    万次阅读 多人点赞 2018-09-05 18:21:20
    其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。 书的购买链接 书的勘误,优化,源代码资源 机器学习是现阶段解决很多...
  • 机器学习算法地图(高清图)

    千次阅读 2018-07-10 19:44:56
    其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。 书的购买链接 书的勘误,优化,源代码资源 ...
  • 2021-07-02

    2021-07-02 21:14:05
    我用#CSDN#这个app发现了有技术含量的博客,小伙伴们求同去《最新机器学习:原理、算法与应用雷明高清PDF完整带书签》, 一起来围观吧 ...app_version=4.10.0&code=app_1562916241&uLinkId=usr1mkqgl919blen ...
  • 其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接书的勘误,优化,源代码资源PDF全文链接:深度学习算法地图自...
  • 机器学习中的编码器-解码器结构哲学

    万次阅读 多人点赞 2019-02-27 17:50:43
    机器学习中体现着各种工程和科学上的哲学思想,大的有集成学习,没有免费午餐,奥卡姆剃刀;小的有最大化类间差异、最小化类内差异。对于很多问题,存在着一类通行的解决思路,其中的一个典型代表就是“编码器-解码...
  • 一、数学 二、计算机 三、人工智能 1. 机器学习 2.深度学习 3.其他 吴恩达深度学习笔记
  • 拥有良好的数学基础,有利于大家在后续课程的学习中更好的理解机器学习和深度学习的相关算法内容。同时对于AI研究尤为重要,例如人工智能中的智能很大一部分依托“概率论”实现的。 PDF下载地址...
  • 其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。 书的购买链接 书的勘误,优化,源代码资源 PDF全文链接:深度学习模型...
  • 其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。书的购买链接书的勘误,优化,源代码资源获取全文PDF请查看:基于深度学习...
  • 自然场景文本检测识别技术综述

    万次阅读 多人点赞 2018-06-30 09:05:52
    其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。 书的购买链接 书的勘误,优化,源代码资源 番外青蛇: 姐, 图像文本...
  • 其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。 书的购买链接 书的勘误,优化,源代码资源 作者简介:SIGAI人工智能...
  • 其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。 书的购买链接 书的勘误,优化,源代码资源 理解...
  • OCR文字识别经典论文详解

    千次阅读 多人点赞 2022-06-04 22:22:29
    其它机器学习、深度学习算法的全面系统讲解可以阅读 《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号…https://zhuanlan.zhihu.com/p/38655369OCR开源资源推荐: Scene Text Detection:...
  • 一季度,集中上架的机器学习、深度学习、算法、操作系统等新书,得到小伙伴们的一致支持,来个榜单截图。 人工智能 1、机器学习公式详解 (“西瓜书”学习伴侣“南瓜书”正式版) 谢文睿,秦州 著 人工...
  • 其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。 书的购买链接 书的勘误,优化,源代码资源 PDF全文地址:...
  • 理解熵和交叉熵

    千次阅读 2019-01-19 16:55:27
    本文PDF版下载地址:http://www.sigai.cn/paper_80.html ...市面上虽然有大量介绍XGBoost原理使用的文章,但少有能清晰透彻的讲清其原理的。本文的目标是对XGBoost的原理进行系统而深入的讲解,帮助大家真正理解...
  • 基于单目视觉的三维重建算法综述

    千次阅读 2019-01-28 17:30:25
    三维计算机视觉在计算机视觉是偏基础的方向,随着2010年阿凡达在全球热映以来,三维计算机视觉的应用从传统工业领域逐渐走向生活、娱乐、服务等,比如AR/VR,SLAM,自动驾驶等都离不开三维视觉的技术。 三维重建包含...
  • 理解隐马尔可夫模型

    千次阅读 2019-02-14 23:35:49
    全文PDF下载:http://www.sigai.cn/paper_99.html 隐马尔可夫模型(Hidden Markov Model,简称HMM)由Baum等人在1966年提出[1],是一种概率图模型,用于解决序列预测问题,可以对序列数据中的上下文信息建模。所谓...
  • 场景文本检测—CTPN算法介绍

    千次阅读 2018-06-25 13:14:37
    其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。 书的购买链接 书的勘误,优化,源代码资源 SIGAI特约作者:沪东三哥 ...
  • 尽管最新的高端智能手机有强大的CPU和GPU,但是在移动设备上运行复杂的深度学习模型(例如ImageNet分类模型)仍然十分困难。为了可以将深度网络模型应用于移动设备,本文提出了一个简单且有效的压缩整个CNN模型的...
  • 理解主成分分析 (PCA)

    千次阅读 多人点赞 2018-06-12 13:32:57
    其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。 书的购买链接 书的勘误,优化,源代码资源 导言 主成分分析法 (PCA) ...

空空如也

空空如也

1 2 3
收藏数 52
精华内容 20
热门标签
关键字:

机器学习与应用雷明pdf