精华内容
下载资源
问答
  • 机器学习实战》中英文电子书 + 源代码下载

    千次阅读 多人点赞 2019-05-09 17:21:23
    今天给大家介绍一本以 Python 为基础的机器学习实战编程书籍:《机器学习实战》。 本书特色: 本书的目录如下: 本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法...

    红色石头的个人网站:www.redstonewill.com

    今天给大家介绍一本以 Python 为基础的机器学习实战编程书籍:《机器学习实战》。

    本书特色:

    本书的目录如下:

    本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树(CART)算法等。第三部分则重点介绍无监督学习及其一些主要算法:k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的一些附属工具。

    本书的最大亮点莫过于使用 Python,从零开始实现主流的机器学习算法,没有调包调库,包括复杂的 SVM SMO 算法。可以说非常有助于深入理解算法核心知识,巩固机器学习理论。

    优质资源:

    由于《机器学习实战》配套的代码多由 Python2 实现,且某些代码有 bug,故作者 wzy6642 对书中的代码重新做了整理,全部代码可在 Python3 环境下运行。所有源程序中,文件夹名称的命名规则为:算法名称+对应书中的第几个案例,少数几个案例因为数据量比较大所以采用压缩包上传。相应的 GitHub 地址如下:

    https://github.com/wzy6642/Machine-Learning-in-Action-Python3

    另外,还有一份按照书中章节顺序,非常好的基于 Python3 的源代码(包括 .ipynb 文件)。目前在 GitHub 上已经超过 1500 star 了。地址如下:

    https://github.com/pbharrin/machinelearninginaction

    资源下载:

    目前,《机器学习实战》书籍的英文版和中文版,包括所有章节的源代码程序都已打包完毕。获取方式如下:

    1.扫描下方二维码关注 “AI有道” 公众号

    2.公众号后台回复关键词:ML1


    在这里插入图片描述

    展开全文
  • 这是楼主自己学习过程中整理的机器学习实战全书的全部源代码,书上的代码有很多不能运行的,楼主把全部代码重新进行的书写,所有代码在python3上均通过运行,没有任何bug。全网唯一一个可以在python3下完美运行的...
  • Sklearn与机器学习实战介绍了sklearn概率,完整的项目实战的模型训练和旋转等
  • 机器学习实战1》

    2018-12-09 14:36:13
    (1)使用机器学习算法的目的:预测值则监督学习,否则无监督学习;监督学习,其中离散型选择分类算法,连续型选择回归算法;无监督学习,分析是否需要将数据划分为离散的组,是则聚类,若估计数据与每个分组的...

    记录看书过程中对我有启发的地方

    1. 如何保证算法应用的正确性?
    2. 如何选择合适的算法?

    如何保证算法应用的正确性按照以下步骤:

    (1)确保算法应用可以正确处理简单的数据;

    (2)将现实世界中得到的数据格式化为算法可以处理的格式;

    (3)将步骤(2)得到的数据输入到步骤(1)的算法中,检验算法的运行结果。

    任何复杂系统都是由基础构成的,尤其是算法出现问题,增量地搭建系统可以确保我们及时找到问题出现的位置和原因。如果刚开始就堆砌在一起,我们就很难发现到底是算法问题还是数据格式问题。

    书中源代码在英文版出版商的网站上下载:www.manning.com/MachineLearninginAction

    如何选择合适的算法?

    (1)使用机器学习算法的目的:预测值则监督学习,否则无监督学习;监督学习,其中离散型选择分类算法,连续型选择回归算法;无监督学习,分析是否需要将数据划分为离散的组,是则聚类,若估计数据与每个分组的相似度则密度估计。

    (2)需要分析和收集的数据是什么:充分理解数据,特征值是离散型变量还是连续型变量,特征值是否缺失,何种原因造成缺失,数据中是否存在异常值,某个特征发生的频率如何(是罕见如同否海底捞针)

    开发机器学习应用程序的步骤:

    (1)收集数据:网络爬虫、RSS反馈或API中得到信息、设备发送过来的实测数据(风速、血糖等)。公开数据集(节省时间和精力);

    (2)准备输入数据:确保数据符合格式;

    (3)分析输入数据:分析数据是否可以识别出模式;数据中是否有异常值;

    (4)训练算法

    (5)测试算法

    (6)使用算法

    展开全文
  • Python机器学习实战1

    2016-11-06 20:30:45
    一般机器学习开始就会直接来线性回归,但是python机器学习这本书貌似一开始上来的是knn.. 虽然KNN也比较简单,但我还是选择了拿逻辑回归来试手。这本书基本的数据结构采用ndarray, dict结构比较多。 开始为了加快...

    Python机器学习实战_Logistic-Regression(梯度上升)

    最近半年开始用python做数据分析的项目,作为一个new pythoner, 多数情况下都是直接调包。在想能不能自己开始尝试去深入算法内核。。。
    一般机器学习开始就会直接来线性回归,但是python机器学习这本书貌似一开始上来的是knn..
    虽然KNN也比较简单,但我还是选择了拿逻辑回归来试手。

    这本书基本的数据结构采用ndarray, dict结构比较多。
    开始为了加快速度了解python自己写算法的速度,就不贴(不会)算法推导的过程了。直接上代码,记下遇到的坑!

    import numpy as np
    import pandas as pd
    import operator
    import os
    import sys
    import matplotlib.pylab as plt
    
    #设置python运行环境在指定目录下,方便直接读入文件
    os.getcwd()
    os.chdir('E:\\Python\\2_book_practise\\2_ml\\practise\\chap5')
    
    #定义一个读入本地txt文件的函数
    #数据格式长成这样
    #第1-2列是输入,3列是输出
    -0.017612   14.053064   0
    -1.395634   4.662541    1
    -0.752157   6.538620    0
    -1.322371   7.152853    0
    0.423363    11.054677   0
    0.406704    7.067335    1
    0.667394    12.741452   0
    -2.460150   6.866805    1
    0.569411    9.548755    0
    -0.026632   10.427743   0
    0.850433    6.920334    1
    1.347183    13.175500   0
    1.176813    3.167020    1
    -1.781871   9.097953    0
    -0.566606   5.749003    1
    0.931635    1.589505    1
    
    #定义读入的函数
    def loadDataSet():
        dataMat = [];labelMat = []
        fr = open('testSet.txt') #读入数据
        for line in fr.readlines():
            lineArr = line.strip().split()
            dataMat.append([1.0, float(lineArr[0]), float(lineArr[1])]) #这里额外添加了一列全部是1的值,就是常规线性回归中的那个常数项
            labelMat.append(int(lineArr[2]))
        return dataMat, labelMat
    
    #通过下面的定义可以直接获取loadDataset 返回的两个list- dataMat & labelMat    
    dataMat, labelMat = loadDataSet()
    
    #定义sigmoid函数
    def sigmoid(inX):
        return 1.0/(1 + np.exp(-inX))
    
    #定义梯度上升函数
    def gradAscent(dataMatIn, classLabelIn, maxCycles):
        #这里用矩阵数据结构而非ndarray,因为ndarray不能做非对称矩阵乘法
        dataMatrix = np.mat(dataMatIn)
        labelMatrix = np.mat(classLabelIn).transpose()
    
        m,n = dataMatrix.shape
        alpha = 0.01
        #maxCycles = 1000
        weights = np.ones((n,1))
        for k in range(maxCycles):
            h = sigmoid(dataMatrix * weights)
            error = (labelMatrix - h)
            weights = weights + alpha * dataMatrix.transpose() * error
        return weights
    
    
    #返回每一次迭代的每个变量的回归系数
    #并且可视化
    def get_iter_coef(iters=100000, coefs=3):
        coefMatrix = np.ones((iters, coefs))    
        for i in range(iters):
            weights = gradAscent(dataMat, labelMat, i)
            coefMatrix[i, :] = np.array(weights).reshape((1,3))
        return coefMatrix
    
    coefMatrix = get_iter_coef(1000, 3) 
    
    f, ax = plt.subplots(figsize = (10,7), nrows = 3)
    
    ax[0].plot(coefMatrix[:,0])
    ax[0].set_title('coef0')
    
    ax[1].plot(coefMatrix[:,1])
    ax[1].set_title('coef1')
    
    ax[2].plot(coefMatrix[:,2])
    ax[2].set_title('coef2')
    

    画图展示每次迭代回归系数的变化
    coef0代表全部值是1的那一列的回归系数,
    coef1 & coef2代表的是原始读入文件的第一列与第二列的系数
    这里写图片描述
    观察发现,在迭代400次以内,每项回归系数都得到了收敛

    下一章看看,如果没有添加的一列常数项,会对回归系数收敛有什么影响

    展开全文
  • 今日资料推荐《 机器学习实战:基于 Scikit-Learn、Keras 和 TensorFlow(第二版) 》机器学习实战(第二版)全面使用 TensorFlow2 是最大的变化,除此之外,作者还详细记录了六大改进:覆盖了更多的机器学习知识,包括...

    今日资料推荐

    《 机器学习实战:基于 Scikit-Learn、Keras 和 TensorFlow(第二版) 》

    机器学习实战(第二版)全面使用 TensorFlow2 是最大的变化,除此之外,作者还详细记录了六大改进:覆盖了更多的机器学习知识,包括:无监督学习,训练深度网络,计算机视觉,序列处理,自然语言处理;覆盖更多的库和 API(Keras,Data API,TF-Agents),使用 Distribution Strategies API、TF-Serving、Google Cloud AI 平台大规模训练和部署 TF 模型,还简要介绍了 TF Transform、TFLite、TF Addons/Seq2Seq 和 TensorFlow.js等。

    扫 码 即 可 查 看 收 藏

    下载地址:https://www.yanxishe.com/resourceDetail/1078?from=leiphonecolumn_res0323

    de5412a0024019b6dbd817728a4dd302.png

    更多相关资料下载:https://www.yanxishe.com/resources?from=leiphonecolumn

    资料 | 《 Pytorch 深度学习实战 》

    资料 | 《 面向机器学习的特征工程 》

    资料 | 程序员面试宝典 第 5 版

    资料 | 《 机器学习数学基础 》

    资料 | 《 怎样解题:数学竞赛攻关宝典(第 2 版) 》

    资料 | 《 Linux 命令行与 shell 脚本编程大全 》

    资料下载 | 数学分析八讲(修订版) :概述了数学分析的基本思想、基本概念和基本方法

    资料 | 《 大话数据结构 》

    资料 | 《 你不知道的 JavaScript(上卷) 》

    资料 | 算法设计与分析基础(第 3 版)

    资料 | 《 JavaScript 高级程序设计(第3版)中文-高清 》

    资料 | 《 图解密码技术(第 3 版) 》

    资料 | 《 Java 8 实战 》

    资料 | 《 推荐系统实践 》

    雷锋网雷锋网雷锋网 雷锋网雷锋网雷锋网

    展开全文
  • 本书结合了机器学习、数据分析和Python语言,通过案例以通俗易懂的方式讲解了如何将算法应用到实际任务。全书共20章,大致分为4个部分。第一部分介绍了Python的工具包,包括科学计算库Numpy、数据分析库Pandas、可视...
  • 在“One Stack to rule them all”理念的指引下,Spark基于RDD成功地构建起了大数据处理的一体化解决方案,将MapReduce、Streaming、SQL、Machine Learning、Graph Processing等大数据计算模型统一到一个技术堆栈中...
  • 分享100本Python机器学习、深度学习电子书

    千次阅读 多人点赞 2019-09-15 10:44:03
    这套电子书包括:机器学习、深度学习、数据科学入门、神经网络等 获取资源地址: https://pan.baidu.com/s/1BuY0qliHtQ86eWuBoErW3g 密码: n63r 此套电子书保持在线更新,可以在公众号:Python专栏,回复:机器学习...
  • 有些地方中文显示不了,大部分还是可用的,斯坦福大学Andrew Ng的机器学习课程,很不错的
  • 金融信贷风控的机器学习实战视频课程,面向开发人员,从实际应用讲起
  • 一本《机器学习算法竞赛实战》应运而生,意在帮助机器学习初学者通过实战的方法从虽然优美但是略显枯燥的各种公式和理论当中脱离出来,感受机器学习在实际应用中的奥秘,而竞赛则是一种最特殊的实战。 算法竞赛时代...
  • 关注公众号NLPlayer并回复:python机器学习 即可获取资料,内有其他相关机器学习资料 ...《图解机器学习》、《pytorch官方中文教程》、《Tensorflow实战Google深度学习框架》、《机器学习基础教程》
  • 1.包含常用的数据预处理常用操作: 离散值处理(独热编码) 归一化和标准化 缺失值的处理 异常值的检测和处理 连续值离散化处理 数据的相似度分析 2. 算法模型: 线性回归(最小二乘法、梯度下降法) ...
  • 而机器学习是我们团队的一个主要方向,新加入的同学通常都是从《机器学习实战》这本书开始入门的。 所以,我把这本书的电子版分享给大家,可以作为入门教材,希望能够对大数据、机器学习感兴的同学有益。当然,这...
  • 作者:[法] 奥雷利安·杰龙(Aurélien Géron) 著,宋能辉,李娴 译 出版社:机械工业出版社 品牌:机械工业出版社 出版时间:2020-10-01 机器学习实战:基于Scikit-Learn、Keras和TensorFlow
  • 在 Python 中有很多机器学习的模块,比如 Sklearn Tensorflow Caffe 等,可以很方便地调用一些机器学习的算法如果你对 Python 机器学习感兴 趣,这份 python 机器学习视频教程 的就分享给你 python 基础教程:/s/1...
  • 【唐宇迪python数据分析与机器学习实战】我有整理好...Ps:(赠送电子书:唐宇迪《跟着迪哥学 Python数据分析与机器学习实战》PDF+源代码) 链接:https://pan.baidu.com/s/1wTMglVs_2yYJY_mz2HnF8w 提取码:aog2 ...
  • 中文版,英文版,书上的源代码都有 链接:https://pan.baidu.com/s/1XU0VBSff52_G3r4tIvVCLw提取码:lgqi 转载于:https://www.cnblogs.com/bejm/p/10440851.html
  • 机器学习实战 通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化。通过各种实例,可从中学会机器学习的核心算法,并能将其运用于...
  • 推荐一个新开的数据竞赛网站,经过测试,确实是一个不错的初学者机器学习实践的平台。一直有很多同学询问我关于数据竞赛的问题,因为不少人觉得自己很难找到入门的方式,同时一个人也很难坚持下来。因...
  • 一直想找本书,能在机器学习复杂的算法原理和高效的编程实战之间达到合适的平衡:让感兴趣的同学拿到就有能用的代码,还有基本原理的介绍,因为了解原理才知道什么时候用什么算法最合适,以及如何调整参数。...
  • 继NLP之后,我又开了ML这个大坑。这是因为NLP涉及到太多的ML模型,仅仅拿过来用的话,我实现的HanLP已经快到个人极限了。...统计学习方法.pdf│ 机器学习及其应用.pdf│ All of Statistics - A Concise
  • 校宝在线出的新书《PyTorch机器学习从入门到实战》已由机械工业出版社出版!各大平台有售。 书籍详情(点击查看):机械工业出版社 | 亚马逊 | china-pub | 当当 | 京东 书籍代码地址:...
  • 一本《机器学习算法竞赛实战》应运而生,意在帮助机器学习初学者通过实战的方法从虽然优美但是略显枯燥的各种公式和理论当中脱离出来,感受机器学习在实际应用中的奥秘,而竞赛则是一种最特殊的实战。 算法竞赛时代...
  • 作者:Richard Gall 翻译:车前子 校对:丁楠雅;本文约2000字,建议阅读10分钟。本文介绍了帮助入门机器学习的5本免费机器学习电子书。今天,机器学习已成为软...
  • 我的建议:学习ML,作为初学者,打好基础很重要,花时间好好刷刷这些入门书很有必要,可以选读一下以下的一些经典书籍,个人感觉还是很不错的。等研究到一定深度之后,找到自己的兴趣,再进行更进一步的细分领域,...
  • 主要是让你开阔了眼界,发现机器学习不单单只有深度学习而已。 推荐:***** PS:对应人群都很适合,唯一有点缺点的事情是,书中代码是基于python2感觉很多已经变化了。 电子书下载: 链接:...
  • 我们以前给大家介绍过杨强教授团队所著的业界首本联邦学习的书籍,现在这本书的实战版来了,5月刚刚出版,本次给大家赠送3本新书,即《联邦学习实战》。这是一本什么样的书所谓联邦学习技术,是一种新...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,776
精华内容 1,510
关键字:

机器学习实战电子书