精华内容
下载资源
问答
  • 邹博小象学院机器学习课程全套代码。回归、svm、聚类等常规算法都有,很全面。
  • 机器学习
  • 仅供各位爱好机器学习的同学分享学习使用,如有侵权请联系本人删除。
  • 机器学习邹博笔记1

    千次阅读 2018-07-12 19:33:25
    1、机器学习分为两部分:建模和预测 建模:根据已有数据(文本,图像,声音等)并可能有标记值,提取出数据中的特征向量,使用某一个机器学习算法(最小二乘法),对模型进行训练得出模型。 预测:现有新数据...

    1、机器学习分为两部分:建模和预测

    建模:根据已有数据(文本,图像,声音等)并可能有标记值,提取出数据中的特征向量,使用某一个机器学习算法(最小二乘法),对模型进行训练得出模型。

    预测:现有新数据(文本,图像,声音等)并可能有标记值,提取出数据中的特征向量,根据模型对新的数据进行预测。

    2、整体看机器学习就是模仿人识别事物的过程即:学习、提取特征、识别、分类

    由于机器不能跟人类思维一样根据事物特征自然而然的选择分类方法,所以机器学习方法的选择依然还需要人工选择。目前,机器学习的方法主要有三种:监督学习、半监督学习和无监督学习。监督学习是利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程。白话一点,就是根据已知的,推断未知的。代表方法有:Nave Bayes、SVM、决策树、KNN、神经网络以及Logistic分析等;半监督方法主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题,也就是根据少量已知的和大量未知的内容进行分类。代表方法有:最大期望、生成模型和图算法等。无监督学习是利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程。也就是及其自个儿学。代表方法有:Apriori、FP树、K-means以及目前比较火的Deep Learning。从这三方面看,无监督学习是最智能的,有能实现机器主动意识的潜质,但发展还比较缓慢;监督学习是不太靠谱的,从已知的推断未知的,就必须要把事物所有可能性全都学到,这在现实中是不可能的,人也做不到;半监督学习是“没办法中的办法”,既然无监督学习很难,监督学习不靠谱,就取个折中,各取所长。目前的发展是,监督学习技术已然成熟,无监督学习还在起步,所以对监督学习方法进行修改实现半监督学习是目前的主流。但这些方法基本只能提取信息,还不能进行有效的预测。来源:https://www.cnblogs.com/xpNLP/p/4678636.html

    3、邹博将机器学习流程比作西红柿炒蛋

    4、清晰地理解各个算法原理、优缺点

    针对新的数据新的问题,知道使用什么算法。

    参考https://blog.csdn.net/u013369277/article/details/51645672

    展开全文
  • B站视频的https://www.bilibili.com/video/av50327129/?p=5的配套资源,之前学过一些机器学习算法,正在整体的复习。在B站看到好视频,然后正在刷,就把代码和课件分享给大家。主要看到CSDN上同类的资源比较贵,所以...
  • 小象学院邹博机器学习课程全部ppt与代码实现,内容详细,代码清楚,机器学习必备。
  • 邹博老师小象学院机器学习课程全套课件,很全面,一共24课。对于新入门机器学习的同学应该比较有帮助。
  • 邹博机器学习全套课件及代码,适合想入门和以入门机器学习领域的初学者,讲解十分详细,有助于打好数学基础
  • 邹博机器学习课程上的PPT及相关代码(完整版)。
  • 机器学习班PPT(邹博),课件,入门必备。包含所有机器学习算法讲解。
  • 我是先把大学教材《高等数学》、《线性代数》、《概率论》从头到尾都看了一遍,然后又看了多家机构的机器学习教学视频 可以说当初的迷茫、慌张、害怕、忐忑 ,心路历程非常艰辛 因为感觉东西太多太多了 ,一会...

    慌慌张张,匆匆忙忙,生活本来就是这样

    很喜欢郝云的《活着》这首歌,很生动的描述了现代年轻上班族的生活。

    时光飞逝,从开始接触机器学习 已经两年多了,现已成功从安卓移动端转战机器学习

    现在也如愿从事机器学习的工作,虽初出茅庐,却也拿到了比较满意的25+

    想起当初…

    我是先把大学教材《高等数学》、《线性代数》、《概率论》从头到尾都看了一遍,然后又看了多家机构的机器学习教学视频

    可以说当初的迷茫、慌张、害怕、忐忑 ,心路历程非常艰辛

    因为感觉东西太多太多了 ,一会儿机器学习一会儿深度学习,一会儿这个导师的视频,一会儿那个机构的教程,都不知道从哪学,要学哪些

    现在回想起来,那些基本的数学知识 从头到尾全部看一遍 其实没那个必要, 只需要掌握必要的几个基础点就好了,高数必备的 求导、梯度下降、泰勒公式、洛必达法则这几个常用的,线性代数相对重要些 , 最好把大学教材过一遍(资料已经整理好了),概率和统计跟着老师的步调 哪里不会不哪里就好了, 最最重要的贝叶公式和全概率公式

    关于机器学习的理论知识 , 不必慌张,只需要从算法开始 ,先把必要的几个数学知识点搞明白, 再把主流算法的理论、推导能搞个大致,再按照老师的项目实践下,可以说就踏上了机器学习这趟车了,看不在多,适合最好。主流算法就那几个,基础的线性回归、逻辑回归、决策树、xgboost、SVM、神经网络、卷积神经网络这些,老师都会一个一个讲解,弄透了 多敲敲 其他就是easy 的事情了 。

    要问我学习路程,这个看个人了, 我觉得教程先搞一遍,先入门再说,其他的都是扯。

    本人看了很多教学视频,包括小-象、唐-宇迪老师、张-志华老师(可能翻译有问题)、吴-恩达前辈、极-客时间、邹博老师的,个人感觉邹博老师的视频适合入门,深入浅出、通俗易懂,对于有基础和没基础的同学,都能让你轻易入门,但是得一边看一遍敲,不能说我只看看就能找到工作,对不起,不可能。

    大家一起奋斗、一起进步,整理不易,需要资料或者有问题可以探讨的加-群即可:780239930。

    扫-码即送整套视频:

    展开全文
  • 小象 邹博机器学习课程全部ppt与代码实现,内容详细,代码清楚,机器学习必备。
  • 邹博老师机器学习

    2019-01-10 11:17:01
    邹博老师的视频最适合入门,深入浅出、通俗易懂,对于有基础和没基础的同学,都能让你轻易入门,但是得一边看一遍敲,不能说我只看看就能找到工作,对不起,不可能。
  • 邹博机器学习24课全套PPT和代码。人工智能机器学习,深度学习算法入门。
  • 邹博机器学习课件

    2018-11-08 14:24:03
    邹博 机器学习升级版VII 课程讲义 PPT 共 23 课,高清
  • 邹博机器学习PPT 推荐学习 对于公式的推导非常详细
  • 邹博,中国科学院副研究员,天津大学软件学院创业导师,成立中国科学院邹博,人工智能研究中心(杭州站) ,在规创、天识,容客邦等公司担任技术顾问,研·究方向机器学习、深度学习、计算几何,应用于大型气象设备图像与文本...

    邹博,中国科学院副研究员,天津大学软件学院创业导师,成立中国科学院邹博,人工智能研究中心(杭州站) ,在规创、天识,容客邦等公司担任技术顾问,研·究方向机器学习、深度学习、计算几何,应用于大型气象设备图像与文本挖握股票交易与预测、量子化学医药路径寻优、传统农资产品价格预测和决策等领域。

    课程介绍

    本课程特点是从数学层面推导最经典的机器学习算法,以及每种算法的示例和代码实现(Python)、如何做算法的参数调试、以实际应用案例分析各种算法的选择等。

    1.每个算法模块按照“原理讲解→分析数据→自己动手实现→特征与调参”的顺序,“原理加实践,顶天立地”。

    2.拒绝简单的“调包”——增加3次“机器学习的角度看数学”和3次“Python数据清洗和特征提取”,提升学习深度、降低学习坡度。

    3.增加网络爬虫的原理和编写,从获取数据开始,重视将实践问题转换成实际模型的能力,分享工作中的实际案例或Kaggle案例:广告销量分析、环境数据异常检测和分析、数字图像手写体识别、Titanic乘客存活率预测、用户-电影推荐、真实新闻组数据主题分析、中文分词、股票数据特征分析等。

    4.强化矩阵运算、概率论、数理统计的知识运用,掌握机器学习根本。

    5.阐述机器学习原理,提供配套源码和数据;确保“懂推导,会实现”。

    6.删去过于晦涩的公式推导,代之以直观解释,增强感性理解。

    7.对比不同的特征选择带来的预测效果差异。

    8.重视项目实践(如工业实践、Kaggle等),重视落地。思考不同算法之间的区别和联系,提高在实际工作中选择算法的能力。

    9.涉及和讲解的部分Python库有:Numpy、Scipy、matplotlib、Pandas、scikit-learn、XGBoost、libSVM、LDA、Gensim、NLTK、HMMLearn,涉及的其他“小”库在课程的实践环节会逐一讲解。

    课程目录

    第一课:机器学习的数学基础1 - 数学分析

    1. 机器学习的一般方法和横向比较

    2. 数学是有用的:以SVD为例

    3. 机器学习的角度看数学

    4. 复习数学分析

    5. 直观解释常数e

    6. 导数/梯度

    7. 随机梯度下降

    8. Taylor展式的落地应用

    9. gini系数

    10. 凸函数

    11. Jensen不等式

    12. 组合数与信息熵的关系

    第二课:机器学习的数学基础2 - 概率论与贝叶斯先验

    1. 概率论基础

    2. 古典概型

    3. 贝叶斯公式

    4. 先验分布/后验分布/共轭分布

    5. 常见概率分布

    6. 泊松分布和指数分布的物理意义

    7. 协方差(矩阵)和相关系数

    8. 独立和不相关

    9. 大数定律和中心极限定理的实践意义

    10. 深刻理解最大似然估计MLE和最大后验估计MAP

    11. 过拟合的数学原理与解决方案

    第三课:机器学习的数学基础3 - 矩阵和线性代数

    1. 线性代数在数学科学中的地位

    2. 马尔科夫模型

    3. 矩阵乘法的直观表达

    4. 状态转移矩阵

    5. 矩阵和向量组

    6. 特征向量的思考和实践计算

    7. QR分解

    8. 对称阵、正交阵、正定阵

    9. 数据白化及其应用

    10. 向量对向量求导

    11. 标量对向量求导

    12. 标量对矩阵求导

    第四课:Python基础1 - Python及其数学库

    1. 解释器Python2.7与IDE:Anaconda/Pycharm

    2. Python基础:列表/元组/字典/类/文件

    3. Taylor展式的代码实现

    4. numpy/scipy/matplotlib/panda的介绍和典型使用

    5. 多元高斯分布

    6. 泊松分布、幂律分布

    7. 典型图像处理

    8. 蝴蝶效应

    9. 分形

    第五课:Python基础2 - 机器学习库

    1. scikit-learn的介绍和典型使用

    2. 损失函数的绘制

    3. 多种数学曲线

    4. 多项式拟合

    5. 快速傅里叶变换FFT

    6. 奇异值分解SVD

    7. Soble/Prewitt/Laplacian算子与卷积网络

    8. 卷积与(指数)移动平均线

    9. 股票数据分析

    第六课:Python基础3 - 数据清洗和特征选择

    1. 实际生产问题中算法和特征的关系

    2. 股票数据的特征提取和应用

    3. 一致性检验

    4. 缺失数据的处理

    5. 环境数据异常检测和分析

    6. 模糊数据查询和数据校正方法、算法、应用

    7. 朴素贝叶斯用于鸢尾花数据

    8. GaussianNB/MultinomialNB/BernoulliNB

    9. 朴素贝叶斯用于18000+篇/Sogou新闻文本的分类

    第七课: 回归

    1. 线性回归

    2. Logistic/Softmax回归

    3. 广义线性回归

    4. L1/L2正则化

    5. Ridge与LASSO

    6. Elastic Net

    7. 梯度下降算法:BGD与SGD

    8. 特征选择与过拟合

    第八课:Logistic回归

    1. Sigmoid函数的直观解释

    2. Softmax回归的概念源头

    3. Logistic/Softmax回归

    4. 最大熵模型

    5. K-L散度

    6. 损失函数

    7. Softmax回归的实现与调参

    第九课:回归实践

    1. 机器学习sklearn库介绍

    2. 线性回归代码实现和调参

    3. Softmax回归代码实现和调参

    4. Ridge回归/LASSO/Elastic Net

    5. Logistic/Softmax回归

    6. 广告投入与销售额回归分析

    7. 鸢尾花数据集的分类

    8. 交叉验证

    9. 数据可视化

    第十课:决策树和随机森林

    1. 熵、联合熵、条件熵、KL散度、互信息

    2. 最大似然估计与最大熵模型

    3. ID3、C4.5、CART详解

    4. 决策树的正则化

    5. 预剪枝和后剪枝

    6. Bagging

    7. 随机森林

    8. 不平衡数据集的处理

    9. 利用随机森林做特征选择

    10. 使用随机森林计算样本相似度

    11. 数据异常值检测

    第十一课:随机森林实践

    1. 随机森林与特征选择

    2. 决策树应用于回归

    3. 多标记的决策树回归

    4. 决策树和随机森林的可视化

    5. 葡萄酒数据集的决策树/随机森林分类

    6. 波士顿房价预测

    第十二课:提升

    1. 提升为什么有效

    2. 梯度提升决策树GBDT

    3. XGBoost算法详解

    4. Adaboost算法

    5. 加法模型与指数损失

    第十三课:提升实践

    1. Adaboost用于蘑菇数据分类

    2. Adaboost与随机森林的比较

    3. XGBoost库介绍

    4. Taylor展式与学习算法

    5. KAGGLE简介

    6. 泰坦尼克乘客存活率估计

    第十四课:SVM

    1. 线性可分支持向量机

    2. 软间隔的改进

    3. 损失函数的理解

    4. 核函数的原理和选择

    5. SMO算法

    6. 支持向量回归SVR

    第十五课:SVM实践

    1. libSVM代码库介绍

    2. 原始数据和特征提取

    3. 调用开源库函数完成SVM

    4. 葡萄酒数据分类

    5. 数字图像的手写体识别

    6. SVR用于时间序列曲线预测

    7. SVM、Logistic回归、随机森林三者的横向比较

    第十六课:聚类(上)

    1. 各种相似度度量及其相互关系

    2. Jaccard相似度和准确率、召回率

    3. Pearson相关系数与余弦相似度

    4. K-means与K-Medoids及变种

    5. AP算法(Sci07)/LPA算法及其应用

    第十七课:聚类(下)

    1. 密度聚类DBSCAN/DensityPeak(Sci14)

    2. DensityPeak(Sci14)

    3. 谱聚类SC

    4. 聚类评价AMI/ARI/Silhouette

    5. LPA算法及其应用

    第十八课:聚类实践

    1. K-Means++算法原理和实现

    2. 向量量化VQ及图像近似

    3. 并查集的实践应用

    4. 密度聚类的代码实现

    5. 谱聚类用于图片分割

    第十九课:EM算法

    1. 最大似然估计

    2. Jensen不等式

    3. 朴素理解EM算法

    4. 精确推导EM算法

    5. EM算法的深入理解

    6. 混合高斯分布

    7. 主题模型pLSA

    第二十课:EM算法实践

    1. 多元高斯分布的EM实现

    2. 分类结果的数据可视化

    3. EM与聚类的比较

    4. Dirichlet过程EM

    5. 三维及等高线等图件的绘制

    6. 主题模型pLSA与EM算法

    第二十一课:主题模型LDA

    1. 贝叶斯学派的模型认识

    2. 共轭先验分布

    3. Dirichlet分布

    4. Laplace平滑

    5. Gibbs采样详解

    第二十二课:LDA实践

    1. 网络爬虫的原理和代码实现

    2. 停止词和高频词

    3. 动手自己实现LDA

    4. LDA开源包的使用和过程分析

    5. Metropolis-Hastings算法

    6. MCMC

    7. LDA与word2vec的比较

    第二十三课:隐马尔科夫模型HMM

    1. 概率计算问题

    2. 前向/后向算法

    3. HMM的参数学习

    4. Baum-Welch算法详解

    5. Viterbi算法详解

    6. 隐马尔科夫模型的应用优劣比较

    第二十四课:HMM实践

    1. 动手自己实现HMM用于中文分词

    2. 多个语言分词开源包的使用和过程分析

    3. 文件数据格式UFT-8、Unicode

    4. 停止词和标点符号对分词的影响

    5. 前向后向算法计算概率溢出的解决方案

    6. 发现新词和分词效果分析

    7. 高斯混合模型HMM

    8. GMM-HMM用于股票数据特征提取

     

    下载地址:百度网盘

    展开全文
  • 机器学习全套课件和可运行python代码,机器学习新手入门必备!
  • 本课程特点是从数学层面推导最经典的机器学习算法,以及每种算法的示例和代码实现(Python)、如何做算法的参数调试、以实际应用案例分析各种算法的选择等。
  • 一、线性回归 1. 基本线性回归 from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression x_train, x_test, y_train, y_test = train_test_split(x, y, ...

    一、线性回归

    1. 基本线性回归

    from sklearn.model_selection import train_test_split
    from sklearn.linear_model import LinearRegression
    x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=1)
    # print x_train, y_train
    linreg = LinearRegression()
    model = linreg.fit(x_train, y_train)
    # model
    # linreg.coef_
    # linreg.intercept_
    
    y_hat = linreg.predict(np.array(x_test))
    mse = np.average((y_hat - np.array(y_test)) ** 2)  # Mean Squared Error
    rmse = np.sqrt(mse)  # Root Mean Squared Error
    
    t = np.arange(len(x_test))
    plt.plot(t, y_test, 'r-', linewidth=2, label='Test')
    plt.plot(t, y_hat, 'g-', linewidth=2, label='Predict')

     2. CV

    from sklearn.model_selection import train_test_split
    from sklearn.linear_model import Lasso, Ridge
    from sklearn.model_selection import GridSearchCV
    x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=1)
    # print x_train, y_train
    model = Lasso()
    # model = Ridge()
    alpha_can = np.logspace(-3, 2, 10)
    lasso_model = GridSearchCV(model, param_grid={'alpha': alpha_can}, cv=5)
    lasso_model.fit(x, y)
    # lasso_model.best_params_
    # pd.DataFrame(lasso_model.cv_results_)

     3. pipline和meshgrid画图(鸢尾花数据)

    lr = Pipeline([('sc', StandardScaler()),
                        ('clf', LogisticRegression()) ])
    lr.fit(x, y.ravel())
    
    N, M = 500, 500     # 横纵各采样多少个值
    x1_min, x1_max = x[:, 0].min(), x[:, 0].max()   # 第0列的范围
    x2_min, x2_max = x[:, 1].min(), x[:, 1].max()   # 第1列的范围
    t1 = np.linspace(x1_min, x1_max, N)
    t2 = np.linspace(x2_min, x2_max, M)
    x1, x2 = np.meshgrid(t1, t2)                    # 生成网格采样点
    x_test = np.stack((x1.flat, x2.flat), axis=1)   # 测试点
    
    cm_light = mpl.colors.ListedColormap(['#77E0A0', '#FF8080', '#A0A0FF'])
    cm_dark = mpl.colors.ListedColormap(['g', 'r', 'b'])
    y_hat = lr.predict(x_test)                  # 预测值
    y_hat = y_hat.reshape(x1.shape)                 # 使之与输入的形状相同
    plt.pcolormesh(x1, x2, y_hat, cmap=cm_light)     # 预测值的显示
    plt.scatter(x[:, 0], x[:, 1], c=y, edgecolors='k', s=50, cmap=cm_dark)    # 样本的显示
    plt.xlabel('petal length')
    plt.ylabel('petal width')
    plt.xlim(x1_min, x1_max)
    plt.ylim(x2_min, x2_max)
    plt.grid()

     

    转载于:https://www.cnblogs.com/figo-studypath/p/10384652.html

    展开全文
  • 机器学习课件+视频+代码,很好的资源,python版,包含众多的机器学习算法,原理,案例,python实现以及库调用等
  • 本课程特点是从数学层面推导最经典的机器学习算法,以及每种算法的示例和代码实现(Python)、如何做算法的参数调试、以实际应用案例分析各种算法的选择等。 1.每个算法模块按照“原理讲解→分析数据→自己动手实现...
  • 视频+资料+代码 第一课:机器学习与数学分析 第二课:概率论与贝叶斯先验 第三课:矩阵和线性代数 第四课:Python基础 第五课:Python基础2 - 机器学习库 第六课:Python基础3 - 数据清洗和特征选择 第七课:回归 第...
  • 邹博 ppt格式

    2019-11-04 10:40:06
    ppt格式的 可修改 ,不是pdf的,准备课件的饿时候会容易很多!
  • 吴恩达机器学习经典课程全套PPT整合 !!
  • 七月在线-邹博 机器学习源码及讲义(SVM, XGBoost, em算法,LDA, HMM等等)
  • 机器学习课件集锦.zip

    2021-09-03 09:42:23
    清华大学、南京大学、东北大学、邹博机器学习课件汇总
  • July机器学习课程课件

    2017-11-11 09:36:06
    July机器学习课程July机器学习课程July机器学习课程July机器学习课程

空空如也

空空如也

1 2 3 4 5 ... 18
收藏数 356
精华内容 142
关键字:

机器学习邹博