精华内容
下载资源
问答
  • 资源名称:Python机器学习 PDF作者简介:Sebastian Raschka是密歇根州立大学的博士生,他在计算生物学领域提出了几种新的计算方法,还被科技博客Analytics Vidhya评为GitHub上具影响力的数据科学家。他有一整年都...

    资源名称:Python机器学习 PDF

    作者简介:

    Sebastian Raschka是密歇根州立大学的博士生,他在计算生物学领域提出了几种新的计算方法,还被科技博客Analytics Vidhya评为GitHub上具影响力的数据科学家。他有一整年都使用Python进行编程的经验,同时还多次参加数据科学应用与机器学习领域的研讨会。正是因为Sebastian 在数据科学、机器学习以及Python等领域拥有丰富的演讲和写作经验,他才有动力完成此书的撰写,目的是帮助那些不具备机器学习背景的人设计出由数据驱动的解决方案。

    他还积极参与到开源项目中,由他开发完成的计算方法已经被成功应用到了机器学习竞赛(如Kaggle等)中。在业余时间,他沉醉于构建体育运动的预测模型,要么待在电脑前,要么在运动。

    资源目录:

    译者序

    推荐序

    作者简介

    审校者简介

    前言

    第1章 赋予计算机学习数据的能力1

    1.1构建智能机器将数据转化为知识1

    1.2 机器学习的三种不同方法1

    1.2.1 通过监督学习对未来事件进行预测2

    1.2.2 通过强化学习解决交互式问题4

    1.2.3 通过无监督学习发现数据本身潜在的结构4

    1.2.4 基本术语及符号介绍5

    1.3 构建机器学习系统的蓝图6

    1.3.1 数据预处理6

    1.3.2 选择预测模型类型并进行训练7

    1.3.3 模型验证与使用未知数据进行预测8

    1.4 Python在机器学习中的应用8

    本章小结9

    第2章 机器学习分类算法10

    2.1 人造神经元—早期机器学习概览10

    2.2 使用Python实现感知器学习算法13

    2.3 自适应线性神经元及其学习的收敛性19

    2.3.1 通过梯度下降最小化代价函数20

    2.3.2 使用Python实现自适应线性神经元21

    2.3.3 大规模机器学习与随机梯度下降25

    本章小结29

    第3章 使用scikit-learn实现机器学习分类算法30

    3.1 分类算法的选择30

    3.2 初涉scikit-learn的使用30

    使用scikit-learn训练感知器31

    3.3 逻辑斯谛回归中的类别概率34

    3.3.1 初识逻辑斯谛回归与条件概率34

    3.3.2 通过逻辑斯谛回归模型的代价函数获得权重36

    3.3.3 使用scikit-learn训练逻辑斯谛回归模型37

    3.3.4 通过正则化解决过拟合问题39

    3.4 使用支持向量机最大化分类间隔41

    3.4.1 对分类间隔最大化的直观认识41

    3.4.2 使用松弛变量解决非线性可分问题42

    3.4.3 使用scikit-learn实现SVM44

    3.5 使用核SVM解决非线性问题44

    3.6 决策树48

    3.6.1 最大化信息增益—获知尽可能准确的结果49

    3.6.2 构建决策树52

    3.6.3 通过随机森林将弱分类器集成为强分类器53

    3.7 惰性学习算法—k-近邻算法54

    本章小结57

    第4章 数据预处理—构建好的训练数据集58

    4.1 缺失数据的处理58

    4.1.1 将存在缺失值的特征或样本删除59

    4.1.2 缺失数据填充60

    4.1.3 理解scikit-learn预估器的API60

    4.2 处理类别数据61

    4.2.1 有序特征的映射61

    4.2.2 类标的编码62

    4.2.3 标称特征上的独热编码63

    4.3 将数据集划分为训练数据集和测试数据集64

    4.4 将特征的值缩放到相同的区间65

    4.5 选择有意义的特征66

    4.5.1 使用L1正则化满足数据稀疏化67

    4.5.2 序列特征选择算法70

    4.6 通过随机森林判定特征的重要性74

    本章小结76

    第5章 通过降维压缩数据77

    5.1 无监督数据降维技术—主成分分析77

    5.1.1 总体方差与贡献方差78

    5.1.2 特征转换80

    5.1.3 使用scikit-learn进行主成分分析82

    5.2 通过线性判别分析压缩无监督数据84

    5.2.1 计算散布矩阵85

    5.2.2 在新特征子空间上选取线性判别算法87

    5.2.3 将样本映射到新的特征空间89

    5.2.4 使用scikit-learn进行LDA分析90

    5.3 使用核主成分分析进行非线性映射91

    5.3.1 核函数与核技巧91

    5.3.2 使用Python实现核主成分分析94

    5.3.3 映射新的数据点99

    5.3.4 scikit-learn中的核主成分分析102

    本章小结103

    第6章 模型评估与参数调优实战104

    6.1 基于流水线的工作流104

    6.1.1 加载威斯康星乳腺癌数据集104

    6.1.2 在流水线中集成数据转换及评估操作105

    6.2 使用k折交叉验证评估模型性能106

    6.2.1 holdout方法106

    6.2.2 k折交叉验证107

    6.3 通过学习及验证曲线来调试算法110

    6.3.1 使用学习曲线判定偏差和方差问题110

    6.3.2 通过验证曲线来判定过拟合与欠拟合112

    6.4 使用网格搜索调优机器学习模型113

    6.4.1 使用网络搜索调优超参114

    6.4.2 通过嵌套交叉验证选择算法115

    6.5 了解不同的性能评价指标116

    6.5.1 读取混淆矩阵116

    6.5.2 优化分类模型的准确率和召回率117

    6.5.3 绘制ROC曲线118

    6.5.4 多类别分类的评价标准121

    本章小结121

    第7章 集成学习—组合不同的模型122

    7.1 集成学习122

    7.2 实现一个简单的多数投票分类器125

    7.3 评估与调优集成分类器131

    7.4 bagging —通过bootstrap样本构建集成分类器135

    7.5 通过自适应boosting提高弱学习机的性能138

    本章小结143

    第8章 使用机器学习进行情感分析144

    8.1 获取IMDb电影评论数据集144

    8.2 词袋模型简介146

    8.2.1 将单词转换为特征向量146

    8.2.2 通过词频-逆文档频率计算单词关联度147

    8.2.3 清洗文本数据148

    8.2.4 标记文档149

    8.3 训练用于文档分类的逻辑斯谛回归模型151

    8.4 使用大数据—在线算法与外存学习152

    本章小结155

    第9章 在Web应用中嵌入机器学习模型156

    9.1 序列化通过scikit-learn拟合的模型156

    9.2 使用SQLite数据库存储数据158

    9.3 使用Flask开发Web应用160

    9.3.1 第一个Flask Web应用160

    9.3.2 表单验证及渲染161

    9.4 将电影分类器嵌入Web应用164

    9.5 在公共服务器上部署Web应用169

    本章小结172

    第10章 使用回归分析预测连续型目标变量173

    10.1 简单线性回归模型初探173

    10.2 波士顿房屋数据集174

    10.3 基于最小二乘法构建线性回归模型178

    10.3.1 通过梯度下降计算回归参数178

    10.3.2 使用scikit-learn估计回归模型的系数181

    10.4 使用RANSAC拟合高鲁棒性回归模型182

    10.5 线性回归模型性能的评估184

    10.6 回归中的正则化方法185

    10.7 线性回归模型的曲线化-多项式回归186

    10.7.1 房屋数据集中的非线性关系建模188

    10.7.2 使用随机森林处理非线性关系190

    本章小结193

    第11章 聚类分析——处理无类标数据194

    11.1 使用k-means算法对相似对象进行分组194

    11.1.1 k-means++196

    11.1.2 硬聚类与软聚类198

    11.1.3 使用肘方法确定簇的最佳数量199

    11.1.4 通过轮廓图定量分析聚类质量200

    11.2 层次聚类203

    11.2.1 基于距离矩阵进行层次聚类204

    11.2.2 树状图与热度图的关联207

    11.2.3 通过scikit-learn进行凝聚聚类208

    11.3 使用DBSCAN划分高密度区域209

    本章小结212

    第12章 使用人工神经网络识别图像213

    12.1 使用人工神经网络对复杂函数建模213

    12.1.1 单层神经网络回顾214

    12.1.2 多层神经网络架构简介215

    12.1.3 通过正向传播构造神经网络216

    12.2 手写数字的识别218

    12.2.1 获取MNIST数据集218

    12.2.2 实现一个多层感知器222

    12.3 人工神经网络的训练228

    12.3.1 计算逻辑斯谛代价函数228

    12.3.2 通过反向传播训练神经网络230

    12.4 建立对反向传播的直观认识231

    12.5 通过梯度检验调试神经网络232

    12.6 神经网络的收敛性236

    12.7 其他神经网络架构237

    12.7.1 卷积神经网络237

    12.7.2 循环神经网络238

    12.8 关于神经网络的实现239

    本章小结240

    第13章 使用Theano并行训练神经网络241

    13.1 使用Theano构建、编译并运行表达式241

    13.1.1 什么是Theano242

    13.1.2 初探Theano243

    13.1.3 配置Theano244

    13.1.4 使用数组结构245

    13.1.5 整理思路—线性回归示例247

    13.2 为前馈神经网络选择激励函数250

    13.2.1 逻辑斯谛函数概述250

    13.2.2 通过softmax函数评估多类别分类任务中的类别概率252

    13.2.3 通过双曲正切函数增大输出范围252

    13.3 使用Keras提高训练神经网络的效率254

    本章小结258

    资源截图:

    展开全文
  • 人红是非多,不管学术界如何评价,吴老师的机器学习课程一直受国人追捧,深得人心!此乃事实,无需多言。 本号宗旨是全心全意为读者服务,鉴于此,特将吴恩达老师新书《Machine Learning Yearning》PDF奉献给读者。...

          吴恩达老师,计算机科学家!功力深厚,声名远播,家喻户晓。

          人红是非多,不管学术界如何评价,吴老师的机器学习课程一直受国人追捧,深得人心!此乃事实,无需多言。

          本号宗旨是全心全意为读者服务,鉴于此,特将吴恩达老师新书《Machine Learning Yearning》PDF奉献给读者。

    ee08faeadd405b6d1f9b7067761178f3.png

      本书开篇引导的案例:建立猫咪图片初创公司

      想象一下,你正在建立一家初创公司,这家公司的产品目标是为猫咪爱好者们提供数不尽的猫

      咪图片,你打算应用神经网络(neural network)技术来构建一套计算机视觉系统,通过该

      系统来识别图片中的猫。

      但悲剧的是,目前你的学习算法准确度还不够好。为了改进这个猫咪检测器,你正面临着巨大

      的压力。可你该怎么做呢?

      你的团队给出了许多建议,例如:

      ● 获取更多的数据,即收集更多的猫咪图片

      ● 收集更加多样化的训练数据集,图片中猫的位置可能不常见,也有可能颜色奇异,或者

      拍摄时使用不同的相机参数

      ● 通过增加梯度下降的迭代次数,使算法训练得久一些

      ● 尝试一个拥有更多层/更多隐藏元/更多参数的,规模更大的神经网络

      ● 尝试一个更小的神经网络

      ● 尝试加入正则化(例如 L2 正则化)

      Page 6 Machine Learning Yearning-Draft Andrew Ng

      ● 改变神经网络的架构(激活函数,隐藏元数量等等)

      ● ...

      在上面众多的方向中,如果你做出了正确的选择,就将建立起一个效果领先的猫咪图片识别平

      台,并带领你的公司取得成功。但如果你选择了一个糟糕的方向,则可能因此浪费掉几个月的

      时间。那么你该如何做出决定呢?

      这本书将告诉你应该怎么做。众多的机器学习问题会留下一些线索,告诉你什么样的尝试有用

      ,什么样的没用。而学会解读这些线索将会节省你几个月甚至几年的开发时间。

      公众号回复 吴恩达老师 即可获取!长存此号,实惠多多

    展开全文
  • 李宏毅机器学习pdf.zip

    2019-09-07 17:19:22
    李宏毅机器学习课程使用的ppt,很适合机器学习爱好者下载使用
  • 机器学习是一门将人类知识和推理过程提炼为一种适合机器和工程自动化系统自动处理的过程的学科。随着机器学习基于应用变得越来越普遍,以及相关的软件包也变得越来越容易使用,底层的技术细节被抽象出来并对使用者不...
    dd9f00ea3287136cfbdff9442943e3be.png

    机器学习是一门将人类知识和推理过程提炼为一种适合机器和工程自动化系统自动处理的过程的学科。随着机器学习基于应用变得越来越普遍,以及相关的软件包也变得越来越容易使用,底层的技术细节被抽象出来并对使用者不可见,这是很自然且也是我们所期待的。然而,这也带来了一种危险,技术使用者可能不知道算法数学基础,从而意识不到机器学习算法的局限性。

    对于想要了解机器学习算法背后的技术细节的研究者而言,目前面临着一系列问题,他们需要了解很多先验知识:

    编程语言和数据分析工具

    大规模计算和相关框架

    数学和统计学以及机器学习算法是如何基于这些知识构建的

    文末附本书pdf下载地址。

    在大学里,机器学习入门课程往往在课程的早期阶段就涵盖了其中的一些基础知识。由于历史原因,机器学习的课程往往在计算机科学系教授,这些学生通常接受前两个知识领域的学习,但数学和统计学方面的学习较少。

    当前的机器学习教科书主要关注机器学习算法和方法,并假设读者已经学习过数学和统计学方面知识。因此,这些书只花了一到两章讲讲一些数学基础,要么在书的开头,要么作为附录。我们发现许多人想要深入了解的机器学习方法的数学基础,他们需要艰难地收集、学习分散的机器学习数学基础知识。在大学教过本科和研究生课程后,我们发现高中数学和阅读标准机器学习教科书所需的数学水平之间的差距对许多人来说太大了。

    这本书突出了基本机器学习概念的数学基础,将所有的知识点整理到一起,希望可以解决机器学习算法应用和相关数学基础知识之间的差异。

    本书目录

    42f9f40e6e693dd77cc461aae0205190.png
    7c78c7b82c3c7c2a19af7cd4e67c0db3.png
    5a378000be5ac69798fd3646418334c3.png

    本书最新版下载地址:https://www.toutiao.com/a1653906112564235

    往期精品内容推荐

    吴恩达-AI的发展历程、AI落地、亚马逊的AI

    NeurIPS-2019接收论文最全列表(1429)

    文本生成公开数据集/开源工具/经典论文详细列表分享

    中文版《动手学深度学习》9月最新版、代码、ppt、视频分享

    简明深度学习学习资料分享:从基础到进阶

    深度学习基础:正向模型、可微损失函数与优化

    9个精品AI开源免费实战项目助你掌握AI工程师基本技能

    2019年Google最新中文版《机器学习速成课程》分享

    历史最全-130本科技互联网类免费书籍整理-汇总分享

    新书分享-嵌入式深度学习:持续性神经网路算法、结构和电路设计

    中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

    8月最新-《可解释机器学习-Christoph Molnar》-新书分享

    元学习-从小样本学习到快速强化学习-ICML2019

    深度学习-机器学习从入门到深入全套资源分享

    斯坦福大学-2019年自然语言理解(CS224u)全套课程资源分享

    展开全文
  • 菊安酱机器学习PDF.rar

    2020-08-26 17:25:47
    视频在B站可以搜索到 菊安酱机器学习全套学习资料 pdf+ipython+kaggle数据集 算法讲解以及经典数据案例讲解
  • 今天给大家分享一个PDF识别转word的工具,也是我自己写的一个小工具,日常生活中还挺有用的,希望可以帮到大家,带来一些便利 ps:放在当前文件夹下,选择文件路径后,会出现一个2.doc,这就是识别出来的word文件,...
  • 本书介绍 一种最常见和最广泛使用的机器学习模型是线性回归。线性回归是一种非常直观的监督学习算法,顾名思义,它是一种回归技术。这意味着当我们有连续值的标签时,例如汽车价格或房间温度,就会使用它。此外,...
    575c548c55acf0958787ae0905d1e089.png

    本书介绍

    一种最常见和最广泛使用的机器学习模型是线性回归。线性回归是一种非常直观的监督学习算法,顾名思义,它是一种回归技术。这意味着当我们有连续值的标签时,例如汽车价格或房间温度,就会使用它。此外,正如它的名字所暗示的那样,线性回归寻求的是对线状数据的模糊处理。这是什么意思?

    本书最新免费pdf下载地址: 个人主页“私信”,回复关键字“nmln”获取下载地址。

    想象一下,你收到了一个由汽车组成的数据集,其中每辆汽车的行驶里程数以及价格。在这种情况下,让我们假设您正在尝试训练一个机器学习系统,该系统接收关于每辆车的信息,即行驶里程数及其相关价格。这里,对于给定的汽车,行驶里程是输入,价格是输出。该数据可以表示为(X,Y)坐标。

    本书目录

    4ebd85a9446a0ceeff3e2b7ab2d9a219.png

    内容截图

    7fda892e30567c3646443d96585e84df.png
    2b3b9771044c2c695c21b2556f448cd5.png
    27648b3587ae66a88da9c1e2d134e972.png
    054bf655972058731f3d8df9f3c35994.png
    c1e0fdce98484ae39141bd935345a879.png
    eebe21856afb2d1b0ac0792069a043a2.png

    本书免费pdf下载地址

    个人主页“私信”,回复关键字“nmln”获取下载地址。

    往期精品内容推荐

    个人主页点击“私信”,回复关键字“his”获取文章地址。

    最近几年-基于深度学习自然语言处理的推荐系统-必读论文整理分享

    机器学习基础教材-《数据驱动的科学与工程-机器学习、动态系统与控制》免费pdf分享

    Fast.ai-《程序员深度学习实战课程2020》最新视频分享(带中英双字幕)

    2020年新书-《神经网络新手入门必备数学基础》免费pdf分享

    2020年AI统计学新书-《数据科学、机器学习、人工智能基础》免费pdf分享

    机器学习经典书籍-《贝叶斯推理与机器学习》免费分享

    NLP必读圣经《自然语言处理综述》2020最新版免费分享

    深度学习架构论文3-批量标准(BN)减少内部偏移加速模型训练

    自然语言处理任务相关经典论文、免费书籍、博客、tf代码整理分享

    机器学习基础-《统计学习-SLT》教材分享

    斯坦福大学《分布式算法与优化》课程(2020)视频及ppt免费分享

    李宏毅-《深度学习人类语言处理2020》中文视频课程及ppt分享

    展开全文
  • 小编今天为大家分享一本《Python机器学习基础教程》如果你想成为机器学习从业者,那么看这本书是完全没错了!那么一起来看看这本基础教程吧~本书是为机器学习从业者或有志成为机器学习从业者的人准备的,他们在为...
  • 铜灵 发自 凹非寺量子位 出品 | 公众号 QbitAI不出家门,也能学习到国外高校的研究生机器学习课程了。今天,一本名为Foundations of Machine Learning(《机器学习基础》)的课在Reddit上热度飙升至300,里面可谓内容...
  • 这些技能通常用德鲁·康威(Drew Conway)创造的维恩图(或它的变体)来表示: 本书最新免费pdf下载地址:个人主页“私信”,回复关键字“mht20”获取下载地址。 三个圆圈分别代表三个不同的领域:编程领域(语...
  • 给大家带来的一篇关于Python相关的电子书资源,介绍了关于Python、机器学习方面的内容,本书是由清华大学出版社出版,格式为PDF,资源大小153.8 MB,段小手编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:...
  • はじめに本書(ほんしょ)のサンプルのテスト環(かん)境(きょう)とサンプルファイルについて 介绍...1.1 機械学習(がくしゅう)について 1.1 关于机器学习 1.1.1 機械学習習得(しゅうとく)のコツ1.1.1 机器学习的...
  • 理解机器学习 理解机器学习
  • 机器学习.pdf

    2021-03-17 15:42:33
    机器学习.pdf
  • 机器学习学习笔记.pdf

    2020-06-14 21:36:44
    机器学习学习笔记.pdf
  • 机器学习个人笔记完整版 网易云课堂 吴恩达机器学习 上课pdf
  • 吴恩达机器学习笔记pdf格式,共分10周学习课程,可以通过视频资源对照学习。 吴恩达机器学习笔记pdf格式,共分10周学习课程,可以通过视频资源对照学习。
  • 机器学习算法指南.pdf

    2020-08-22 13:48:29
    机器学习算法指南.pdf
  • 机器学习笔记.pdf

    2021-02-03 13:34:58
    机器学习笔记,很详细,很完整
  • 写给人类的机器学习.pdf 介绍了基本的机器学习,包含监督非监督,以及深度学习、强化学习 等,并提供了机器学习相关资源的链接信息
  • 机器学习 第11章 深度学习 复旦大学 赵卫东 博士 wdzhao@ 章节介绍 深度学习是一种利用复杂结构的多个处理层来实现对数据进行高层次抽象 的算法是机器学习的一个重要分支传统的BP算法仅有几层网络需要 手工指定特征...
  • 机器学习技法.pdf

    2019-12-15 17:27:48
    林轩田机器学习技法视频笔记
  • 人工智能机器学习理论.pdf
  • 机器学习概念.pdf

    2019-07-26 18:44:24
    介绍了机器学习中,监督学习、无监督学习、过拟合,以及采取相关的措施进行处理。
  • 机器学习综合.pdf

    2020-07-20 16:48:00
    为了学习数据分析,在一个培训机构里报了一个学习班,这个是一节课的内容,主要讲的是机器学习的相关内容,其他的内容将陆续上传。
  • 李宏毅机器学习·笔记自己整理成了PDF,现在分享给大家。
  • 深度学习及其应用机器学习学术报告.pdf

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 4,069
精华内容 1,627
关键字:

机器学习pdf