机器学习 订阅
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径。 展开全文
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径。
信息
外文名
Machine Learning
涉及学科
概率论、统计学、逼近论、线性代数、高等数学
中文名
机器学习
性    质
多领域交叉学科
机器学习定义
机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式, 并将现有内容进行知识结构划分来有效提高学习效率。 [1]  机器学习有下面几种定义:(1) 机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。(2) 机器学习是对能通过经验自动改进的计算机算法的研究。(3) 机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。 [2] 
收起全文
精华内容
参与话题
问答
  • 从零开始学习机器学习视频教程

    万人学习 2017-12-04 22:38:30
    人工智能作为现在最为火热的领域,使得机器学习被越来越多的人所了解。机器学习难学,主要的难度在于算法模型多不好理解,各种各样的工具不知道如何使用,实际项目不知道如何开发。本门课程将系统入门机器学习,课程...
  • 机器学习

    千次阅读 2020-01-09 22:01:52
    机器学习综述机器学习介绍机器学习的分类机器总结 机器学习介绍 机器学习在我个人看来就是运用相关的算法,对某件事一次又一次地重复,直到达到自己想要的目标 机器学习的分类 学习策略的分类标准就是根据学生实现...

    机器学习介绍

    机器学习在我个人看来就是运用相关的算法,对某件事一次又一次地重复,直到达到自己想要的目标

    机器学习的分类

    学习策略的分类标准就是根据学生实现信息转换所需的推理多少和难易程度来分类的,依从简单到复杂,从少到多的次序分为以下六种基本类型:

    1. 机械学习(Rote learning)
      学习者无需任何推理或其它的知识转换,直接吸取环境所提供的信息。如塞缪尔的跳棋程序,纽厄尔和西蒙的LT系统。这类学习系统主要考虑的是如何索引存贮的知识并加以利用。系统的学习方法是直接通过事先编好、构造好的程序来学习,学习者不作任何工作,或者是通过直接接收既定的事实和数据进行学习,对输入信息不作任何的推理。
    2. 示教学习(Learning from instruction或Learning by being told)
      学生从环境(教师或其它信息源如教科书等)获取信息,把知识转换成内部可使用的表示形式,并将新的知识和原有知识有机地结合为一体。所以要求学生有一定程度的推理能力,但环境仍要做大量的工作。教师以某种形式提出和组织知识,以使学生拥有的知识可以不断地增加。这种学习方法和人类社会的学校教学方式相似,学习的任务就是建立一个系统,使它能接受教导和建议,并有效地存贮和应用学到的知识。不少专家系统在建立知识库时使用这种方法去实现知识获取。
    3. 演绎学习(Learning by deduction)
      学生所用的推理形式为演绎推理。推理从公理出发,经过逻辑变换推导出结论。这种推理是"保真"变换和特化(specialization)的过程,使学生在推理过程中可以获取有用的知识。这种学习方法包含宏操作(macro-operation)学习、知识编辑和组块(Chunking)技术。演绎推理的逆过程是归纳推理。
    4. 类比学习 (Learning by analogy)
      利用二个不同领域(源域、目标域)中的知识相似性,可以通过类比,从源域的知识(包括相似的特征和其它性质)推导出目标域的相应知识,从而实现学习。类比学习系统可以使一个已有的计算机应用系统转变为适应于新的领域,来完成原先没有设计的相类似的功能。
      类比学习需要比上述三种学习方式更多的推理。它一般要求先从知识源(源域)中检索出可用的知识,再将其转换成新的形式,用到新的状况(目标域)中去。类比学习在人类科学技术发展史上起着重要作用,许多科学发现就是通过类比得到的。
    5. 基于解释的学习(Explanation-based learning, EBL)
      学生根据教师提供的目标概念、该概念的一个例子、领域理论及可操作准则,首先构造一个解释来说明为什该例子满足目标概念,然后将解释推广为目标概念的一个满足可操作准则的充分条件。EBL已被广泛应用于知识库求精和改善系统的性能
    6. 归纳学习(Learning from induction)
      归纳学习是由教师或环境提供某概念的一些实例或反例,让学生通过归纳推理得出该概念的一般描述。这种学习的推理工作量远多于示教学习和演绎学习,因为环境并不提供一般性概念描述(如公理)。从某种程度上说,归纳学习的推理量也比类比学习大,因为没有一个类似的概念可以作为"源概念"加以取用。归纳学习是最基本的,发展也较为成熟的学习方法,在人工智能领域中已经得到广泛的研究和应用。

    总结

    机器学习最主要的应用领域有:专家系统、认知模拟、规划和问题求解、数据挖掘、网络信息服务、图象识别、故障诊断、自然语言理解、机器人和博弈等领域。
    从机器学习的执行部分所反映的任务类型上看,大部分的应用研究领域基本上集中于以下两个范畴:分类和问题求解。
    (1)分类任务要求系统依据已知的分类知识对输入的未知模式(该模式的描述)作分析,以确定输入模式的类属。相应的学习目标就是学习用于分类的准则(如分类规则)。
    (2)问题求解任务要求对于给定的目标状态,寻找一个将当前状态转换为目标状态的动作序列;机器学习在这一领域的研究工作大部分集中于通过学习来获取能提高问题求解效率的知识(如搜索控制知识,启发式知识等)。

    展开全文
  • Python数据分析与机器学习实战教程,该课程精心挑选真实的数据集为案例,通过python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例。课程以实战为基础,所有课时都结合代码演示...
  • [机器学习篇]机器学习知识总结篇

    千次阅读 热门讨论 2017-03-08 22:36:48
    1、机器学习的数学基础1 - 数学分析 机器学习的一般方法和横向比较 数学是有用的:以SVD为例 机器学习的角度看数学 复习数学分析 直观解释常数e 导数/梯度 随机梯度下降 Taylor展式的落地应用 gini...

    #1、机器学习的数学基础1 - 数学分析

    机器学习的一般方法和横向比较
    数学是有用的:以SVD为例
    机器学习的角度看数学
    复习数学分析
    直观解释常数e
    导数/梯度
    随机梯度下降
    Taylor展式的落地应用
    gini系数
    凸函数
    Jensen不等式
    组合数与信息熵的关系

    #2、机器学习的数学基础2 - 概率论与贝叶斯先验

    概率论基础
    古典概型
    贝叶斯公式
    先验分布/后验分布/共轭分布
    常见概率分布
    泊松分布和指数分布的物理意义
    协方差(矩阵)和相关系数
    独立和不相关
    大数定律和中心极限定理的实践意义
    深刻理解最大似然估计MLE和最大后验估计MAP
    过拟合的数学原理与解决方案

    #3、机器学习的数学基础3 - 矩阵和线性代数

    线性代数在数学科学中的地位
    马尔科夫模型
    矩阵乘法的直观表达
    状态转移矩阵
    矩阵和向量组
    特征向量的思考和实践计算
    QR分解
    对称阵、正交阵、正定阵
    数据白化及其应用
    向量对向量求导
    标量对向量求导
    标量对矩阵求导

    #3、机器学习的数学基础3 - 数理统计与参数估计

    统计量
    期望/方差/偏度/峰度
    中心矩/原点矩
    矩估计
    深刻理解最大似然估计
    过拟合的数学原理与解决方案
    最大后验估计MAP
    偏差方差二难

    4、Python基础1 - Python及其数学库
    解释器Python2.7与IDE:Anaconda/Pycharm
    Python基础:列表/元组/字典/类/文件
    Taylor展式的代码实现
    numpy/scipy/matplotlib/panda的介绍和典型使用
    多元高斯分布
    泊松分布、幂律分布
    典型图像处理

    #5、Python基础2 - 机器学习库

    scikit-learn的介绍和典型使用
    损失函数的绘制
    多种数学曲线
    多项式拟合
    快速傅里叶变换FFT
    奇异值分解SVD
    Soble/Prewitt/Laplacian算子与卷积网络
    卷积与(指数)移动平均线
    股票数据分析

    #6、Python基础3 - 数据清洗和特征选择

    实际生产问题中算法和特征的关系
    股票数据的特征提取和应用
    一致性检验
    缺失数据的处理
    环境数据异常检测和分析
    模糊数据查询和数据校正方法、算法、应用

    #7、回归

    线性回归
    Logistic/Softmax回归
    广义线性回归
    L1/L2正则化
    Ridge与LASSO
    Elastic Net
    梯度下降算法:BGD与SGD
    特征选择与过拟合
    Softmax回归的概念源头
    最大熵模型
    K-L散度

    #8、回归实践

    机器学习sklearn库介绍
    回归代码实现和调参
    Ridge回归/LASSO/Elastic Net
    Logistic/Softmax回归
    广告投入与销售额回归分析
    鸢尾花数据集的分类
    回归代码实现和调参
    交叉验证
    数据可视化

    #9、决策树和随机森林

    熵、联合熵、条件熵、KL散度、互信息
    最大似然估计与最大熵模型
    ID3、C4.5、CART详解
    决策树的正则化
    预剪枝和后剪枝
    Bagging
    随机森林
    不平衡数据集的处理
    利用随机森林做特征选择
    使用随机森林计算样本相似度

    #10、随机森林实践

    随机森林与特征选择
    决策树应用于回归
    多标记的决策树回归
    决策树和随机森林的可视化
    葡萄酒数据集的决策树/随机森林分类

    #11、提升

    提升为什么有效
    Adaboost算法
    加法模型与指数损失
    梯度提升决策树GBDT
    XGBoost算法详解

    #12、XGBoost实践

    自己动手实现GBDT
    XGBoost库介绍
    Taylor展式与学习算法
    KAGGLE简介
    泰坦尼克乘客存活率估计

    #13、SVM

    线性可分支持向量机
    软间隔的改进
    损失函数的理解
    核函数的原理和选择
    SMO算法
    支持向量回归SVR

    #14、SVM实践

    libSVM代码库介绍
    原始数据和特征提取
    调用开源库函数完成SVM
    葡萄酒数据分类
    数字图像的手写体识别
    SVR用于时间序列曲线预测
    SVM、Logistic回归、随机森林三者的横向比较

    #15、聚类

    各种相似度度量及其相互关系
    Jaccard相似度和准确率、召回率
    Pearson相关系数与余弦相似度
    K-means与K-Medoids及变种
    AP算法(Sci07)/LPA算法及其应用
    密度聚类DBSCAN/DensityPeak(Sci14)
    谱聚类SC
    聚类评价和结果指标

    #16、聚类实践

    K-Means++算法原理和实现
    向量量化VQ及图像近似
    并查集的实践应用
    密度聚类的代码实现
    谱聚类用于图片分割

    #17、EM算法

    最大似然估计
    Jensen不等式
    朴素理解EM算法
    精确推导EM算法
    EM算法的深入理解
    混合高斯分布
    主题模型pLSA

    #18、EM算法实践

    多元高斯分布的EM实现
    分类结果的数据可视化
    EM与聚类的比较
    Dirichlet过程EM
    三维及等高线等图件的绘制
    主题模型pLSA与EM算法

    #19、贝叶斯网络

    朴素贝叶斯
    贝叶斯网络的表达
    条件概率表参数个数分析
    马尔科夫模型
    D-separation
    条件独立的三种类型
    Markov Blanket
    混合(离散+连续)网络:线性高斯模型
    Chow-Liu算法:最大权生成树MSWT

    #20、朴素贝叶斯实践

    GaussianNB
    MultinomialNB
    BernoulliNB
    朴素贝叶斯用于鸢尾花数据
    朴素贝叶斯用于18000+篇新闻文本的分类

    #21、主题模型LDA

    贝叶斯学派的模型认识
    共轭先验分布
    Dirichlet分布
    Laplace平滑
    Gibbs采样详解

    #22、LDA实践

    网络爬虫的原理和代码实现
    停止词和高频词
    动手自己实现LDA
    LDA开源包的使用和过程分析
    Metropolis-Hastings算法
    MCMC
    LDA与word2vec的比较

    #23、隐马尔科夫模型HMM

    概率计算问题
    前向/后向算法
    HMM的参数学习
    Baum-Welch算法详解
    Viterbi算法详解
    隐马尔科夫模型的应用优劣比较

    #24、HMM实践

    动手自己实现HMM用于中文分词
    多个语言分词开源包的使用和过程分析
    文件数据格式UFT-8、Unicode
    停止词和标点符号对分词的影响
    前向后向算法计算概率溢出的解决方案
    发现新词和分词效果分析
    高斯混合模型HMM
    GMM-HMM用于股票数据特征提取

    #微信号
    这里写图片描述

    展开全文
  • 机器学习实战》学习笔记(一):机器学习基础

    千次阅读 多人点赞 2019-08-19 17:01:32
    专栏【机器学习】 【机器学习】《机器学习实战》读书笔记及代码 总目录 https://blog.csdn.net/TeFuirnever/article/details/99701256 ————————————————————————————————————...

    欢迎关注WX公众号:【程序员管小亮】

    【机器学习】《机器学习实战》读书笔记及代码 总目录

    GitHub代码地址:

    ——————————————————————————————————————————————————————

    本章内容

    • 机器学习的简单概述
    • 机器学习的主要任务
    • 学习机器学习的原因
    • Python语言的优势

    1、何谓机器学习

    什么是机器学习?书中举了一个很有意思的例子,我们来听一下,就当开胃菜了。

    最近我和一对夫妇共进晚餐,他们问我从事什么职业,我回应道:“机器学习。”妻子回头问丈夫:“亲爱的,什么是机器学习?”她的丈夫答道:“T-800型终结者。”在《终结者》系列电影中,T-800是人工智能技术的反面样板工程。
    在这里插入图片描述

    哈哈,承包了我一天的笑点,极其学习的概念到底是什么,这个我们在很多博客中都又提到过。

    如果你还是不清楚的话,实在是很过分了 😐,在深度学习大火的如今,机器学习也正是出现在人们视野中,现今,机器学习已应用于多个领域,远超出大多数人的想象,比如NLP,再比如推荐系统。
    在这里插入图片描述

    机器学习在日常生活中的应用,从左上角按照顺时针方向依次使用到的机器学习技术分别为:人脸识别、手写数字识别、垃圾邮件过滤和亚马逊公司的产品推荐。

    在本书中,给出的定义是:【简单地说,机器学习就是把无序的数据转换成有用的信息。】

    1. 传感器和海量数据

    虽然已从互联网上获取了大量的人为数据,但最近却涌现了更多的非人为数据。传感器技术并不时髦,已经发展了好多年的传统行业,但是如何将它们接入互联网这确实是新的挑战。地震预测是一个很好的例子,传感器手机了海量的数据,但是如何从这些数据中抽取出有价值的信息是一个非常值得研究的课题。

    1. 机器学习非常重要

    在过去的半个世纪里,发达国家的多数工作岗位都已从体力劳动转化为脑力劳动。过去的工作基本上都有明确的定义,类似于把物品从A处搬到B处,或者在这里打个洞,但是现在这类工作都在逐步消失。现今的情况具有很大的二义性,类似于“最大化利润”,“最小化风险”、“找到最好的市场策略”……诸如此类的任务要求都已成为常态。虽然可从互联网上获取到海量数据,但这并没有简化知识工人的工作难度。针对具体任务搞懂所有相关数据的意义所在,这正成为基本的技能要求。

    2、关键术语

    通过构建下面的鸟类分类系统,来对机器学习领域的常用术语进行一个总结。
    在这里插入图片描述
    机器学习的主要任务就是 分类。如何判断飞入进食器的鸟是不是象牙喙啄木鸟呢?(任何发现活的象牙喙啄木鸟的人都可以得到5万美元的奖励。)这个任务就是 分类,有很多机器学习算法非常善于 分类。本例中的类别就是鸟的物种,更具体地说,就是区分是否为象牙喙啄木鸟。

    我们决定使用某个机器学习算法进行 分类,首先需要做的是算法训练,即学习如何 分类。通常我们为算法输入大量已分类数据作为算法的 训练集训练集 是用于训练机器学习算法的数据样本集合,表1-1是包含六个训练样本的训练集,每个训练样本有4种 特征(体重、翼展、脚蹼和后背颜色)、一个 目标变量(种属),目标变量 是机器学习算法的预测结果,在 分类 算法中目标变量的类型通常是标称型的,而在 回归 算法中通常是连续型的。训练样本集必须确定知道 目标变量 的值,以便机器学习算法可以发现 特征目标变量 之间的关系。正如前文所述,这里的目标变量 是种属,也可以简化为标称型的数值。我们通常将分类问题中的目标变量称为 类别,并假定分类问题只存在有限个数的 类别

    为了测试机器学习算法的效果,通常使用两套独立的样本集:训练数据测试数据。当机器学习程序开始运行时,使用 训练样本集 作为算法的输入,训练完成之后输入 测试样本。输入 测试样本 时并不提供 测试样本目标变量,由程序决定样本属于哪个类别。比较 测试样本 预测的 目标变量 值与 实际样本类别 之间的差别,就可以得出算法的实际精确度。

    假定这个鸟类分类程序,经过测试满足精确度要求,是否我们就可以看到机器已经学会了如何区分不同的鸟类了呢?这部分工作称之为 知识表示,某些算法可以产生很容易理解的知识表示,而某些算法的知识表示也许只能为计算机所理解。知识表示 可以采用规则集的形式,也可以采用概率分布的形式,甚至可以是训练样本集中的一个实例。在某些场合中,人们可能并不想建立一个专家系统,而仅仅对机器学习算法获取的信息感兴趣。此时,采用何种方式 表示知识 就显得非常重要了。

    3、机器学习的主要任务

    分类问题的主要任务是将实例数据划分到合适的分类中;回归问题的主要任务是预测数值型数据。分类和回归属于监督学习,之所以称之为 监督学习,是因为这类算法必须知道预测什么,即 目标变量的分类信息,也就是label。

    监督学习 相对应的是 无监督学习,此时数据没有 类别信息,也不会给定 目标值。在 无监督学习 中,将数据集合分成由类似的对象组成的多个类的过程被称为 聚类;将寻找描述数据统计值的过程称之为 密度估计。此外,无监督学习 还可以减少数据特征的维度,以便我们可以使用二维或三维图形更加直观地展示数据信息。

    在这里插入图片描述

    4、如何选择合适的算法

    从上面的表格中可以看出,如果我们能确定算法的目的,想要算法完成何种任务,再加上确定需要分析或手机的数据是什么,就能大概确定哪一个算法更适合了。

    首先考虑使用机器学习算法的目的。

    • 如果想要预测目标变量的值,则可以选择监督学习算法
      • 如果目标变量是离散型,则可以选择分类器算法
      • 如果目标变量是连续型的数值,则需要选择回归算法
    • 如果不想预测目标变量的值,则可以选择无监督学习算法
      • 进一步分析是否需要将数据划分为离散的组。如果这是唯一的需求,则使用聚类算法;
      • 如果还需要估计数据与每个分组的相似程度,则需要使用密度估计算法。

    其次需要考虑的是数据问题。主要应该了解数据的以下特性:特征值是离散型变量还是连续型变量,特征值中是否存在缺失的值,何种原因造成缺失值,数据中是否存在异常值,某个特征发生的频率如何(是否罕见得如同海底捞针),等等。

    一般说来发现最好算法的关键环节是反复试错的迭代过程。

    5、开发机器学习应用程序的步骤

    机器学习算法开发应用程序通常遵循以下的步骤。
    (1) 收集数据
    (2) 准备输入数据
    (3) 分析输入数据
    (4) 训练算法
    (5) 测试算法
    (6) 使用算法

    6、Python 语言的优势

    选择Python作为实现机器学习算法的编程语言的原因:
    (1) Python的语法清晰;
    (2) 易于操作纯文本文件;
    (3) 使用广泛,存在大量的开发文档。

    7、NumPy 函数库基础

    机器学习算法涉及很多线性代数知识,因此在使用Python语言构造机器学习应用时,会经常使用NumPy函数库。如果不熟悉线性代数也不用着急,这里用到线性代数只是为了简化不同的数据点上执行的相同数学运算。将数据表示为矩阵形式,只需要执行简单的矩阵运算而不需要复杂的循环操作。

    8、总结

    尽管现在引起很多人的注意,但是机器学习算法其实还是一个专业的学科,很多人都是道听途说,仍然有很长的路要走。随着每天我们需要处理的数据在不断地增加,能够深入理解数据背后的真实含义,是数据驱动产业必须具备的基本技能。如果你想走这个方向,就要下定决心,走到黑,加油,共勉。

    下一章我们将介绍第一个分类算法——k-近邻算法。

    参考文章

    • 《机器学习实战》
    展开全文
  • 机器学习系列(一)——机器学习简介

    万次阅读 多人点赞 2018-06-05 21:33:46
    前前后后接触机器学习也有一年时间,但一直没有系统整理总结过。从本篇博客开始,将记录下我的学习内容与参考资料,系列按照李宏毅的机器学习课程,吴恩达的机器学习课程和周志华的西瓜书为主线。 发展历程 \...

    前前后后接触机器学习也有一年时间,但一直没有系统整理总结过。从本篇博客开始,将记录下我的学习内容与参考资料,系列按照李宏毅的机器学习课程,吴恩达的机器学习课程和周志华的西瓜书为主线。

    发展历程

    \quad人类一直试图让机器具有智能,也就是人工智能(Artificial Intelligence)。从上世纪50年代,人工智能的发展经历了“推理期”,通过赋予机器逻辑推理能力使机器获得智能,当时的AI程序能够证明一些著名的数学定理,但由于机器缺乏知识,远不能实现真正的智能。因此,70年代,人工智能的发展进入“知识期”,即将人类的知识总结出来教给机器,使机器获得智能。在这一时期,大量的专家系统问世,在很多领域取得大量成果,但由于人类知识量巨大,故出现“知识工程瓶颈”。
    \quad无论是“推理期”还是“知识期”,机器都是按照人类设定的规则和总结的知识运作,永远无法超越其创造者,其次人力成本太高。于是,一些学者就想到,如果机器能够自我学习问题不就迎刃而解了吗!机器学习(Machine Learning)方法应运而生,人工智能进入“机器学习时期”。“机器学习时期”也分为三个阶段,80年代,连接主义较为流行,代表工作有感知机(Perceptron)和神经网络(Neural Network)。90年代,统计学习方法开始占据主流舞台,代表性方法有支持向量机(Support Vector Machine),进入21世纪,深度神经网络被提出,连接主义卷土从来,随着数据量和计算能力的不断提升,以深度学习(Deep Learning)为基础的诸多AI应用逐渐成熟。
    人工智能的发展所以,人工智能是追求目标,机器学习是实现手段,深度学习是其中一种方法。
    这里写图片描述

    机器学习

    机器学习是一类算法的总称,这些算法企图从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类,更具体的说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的结果,只是这个函数过于复杂,以至于不太方便形式化表达。需要注意的是,机器学习的目标是使学到的函数很好地适用于“新样本”,而不仅仅是在训练样本上表现很好。学到的函数适用于新样本的能力,称为泛化(Generalization)能力。

    机器学习步骤

    通常学习一个好的函数,分为以下三步:
    1、选择一个合适的模型,这通常需要依据实际问题而定,针对不同的问题和任务需要选取恰当的模型,模型就是一组函数的集合。
    2、判断一个函数的好坏,这需要确定一个衡量标准,也就是我们通常说的损失函数(Loss Function),损失函数的确定也需要依据具体问题而定,如回归问题一般采用欧式距离,分类问题一般采用交叉熵代价函数。
    3、找出“最好”的函数,如何从众多函数中最快的找出“最好”的那一个,这一步是最大的难点,做到又快又准往往不是一件容易的事情。常用的方法有梯度下降算法,最小二乘法等和其他一些技巧(tricks)。
    学习得到“最好”的函数后,需要在新样本上进行测试,只有在新样本上表现很好,才算是一个“好”的函数。
    这里写图片描述

    机器学习路线图

    机器学习是一个庞大的家族体系,涉及众多算法,任务和学习理论,下图是机器学习的学习路线图。
    这里写图片描述图中蓝色代表不同的学习理论,橙色代表任务,绿色代表方法。
    1、按任务类型分,机器学习模型可以分为回归模型、分类模型和结构化学习模型。回归模型又叫预测模型,输出是一个不能枚举的数值;分类模型又分为二分类模型和多分类模型,常见的二分类问题有垃圾邮件过滤,常见的多分类问题有文档自动归类;结构化学习模型的输出不再是一个固定长度的值,如图片语义分析,输出是图片的文字描述。
    2、从方法的角度分,可以分为线性模型和非线性模型,线性模型较为简单,但作用不可忽视,线性模型是非线性模型的基础,很多非线性模型都是在线性模型的基础上变换而来的。非线性模型又可以分为传统机器学习模型,如SVM,KNN,决策树等,和深度学习模型。
    3、按照学习理论分,机器学习模型可以分为有监督学习,半监督学习,无监督学习,迁移学习和强化学习。当训练样本带有标签时是有监督学习;训练样本部分有标签,部分无标签时是半监督学习;训练样本全部无标签时是无监督学习。迁移学习就是就是把已经训练好的模型参数迁移到新的模型上以帮助新模型训练。强化学习是一个学习最优策略(policy),可以让本体(agent)在特定环境(environment)中,根据当前状态(state),做出行动(action),从而获得最大回报(reward)。强化学习和有监督学习最大的不同是,每次的决定没有对与错,而是希望获得最多的累计奖励。

    参考文献

    百度百科
    维基百科
    《人工智能过去60年沉浮史,未来60年将彻底改变人类》
    OpenAI
    百度AI开放平台
    人工智能、机器学习和深度学习之间的区别和联系
    机器学习
    深度学习
    深度学习
    Deep learning
    李宏毅主页

    展开全文
  • 人工智能之机器学习算法的介绍

    千人学习 2017-02-28 17:24:05
    机器学习算法入门教程,主要介绍人工智能机器学习常见算法,包括决策树、基于概率论的分类方法:朴素贝叶斯、Logistic回归、支持向量机、第利用AdaBoost元算法提高分类性能。
  • 吴恩达机器学习与深度学习作业目录 [图片已修复]

    万次阅读 多人点赞 2018-10-23 10:03:59
    吴恩达机器学习作业目录 1 吴恩达机器学习作业Python实现(一):线性回归 2 吴恩达机器学习作业Python实现(二):logistic回归 3 吴恩达机器学习作业Python实现(三):多类分类和前馈神经网络 4 吴恩达机器学习作业...
  • 机器学习&深度学习系统实战!

    万人学习 2017-06-07 13:18:11
    数学原理推导与案例实战紧密结合,由机器学习经典算法过度到深度学习的世界,结合深度学习两大主流框架Caffe与Tensorflow,选择经典项目实战人脸检测与验证码识别。原理推导,形象解读,案例实战缺一不可!具体课程...
  • python基础教程 python基础系列教程——Python的安装与测试:python解释器、PyDev编辑器、pycharm编译器 python基础系列教程——Python库的安装与卸载 ...python基础系列教程——Python3.x标准模块库目录 ...
  • 机器学习是数据分析和数据挖掘的一种比较常用,比较好的手段从有无监督的角度,可以分为三类: 有监督学习 无监督学习 半监督学习 有监督学习 用已知某种或某些特性的样本作为训练集,以建立一个数学模型,再用已...
  • 机器学习算法 综述(入门)

    万次阅读 多人点赞 2019-06-16 21:59:28
    学习了一个学期机器学习算法,从什么都不懂到对十个机器学习算法有一定的了解,下面总结一下十大机器学习算法,从算法的概念、原理、优点、缺点、应用等方面来总结,如果有错误的地方,欢迎指出。 目录 1.决策树...
  • 机器学习入门好文,强烈推荐

    万次阅读 多人点赞 2017-02-01 23:44:30
    本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。当然,本文也面对一般读者,不会对阅读有相关的前提要求。   在进入正题前,我想读者心中可能会有一个疑惑:机器
  • Runtime execution Cavs: An Efficient Runtime System for Dynamic Neural Networks ATC 2018 ...TVM: An Automated End-to-End Optimizi...
  • 盘点当下大热的 7 大 Github 机器学习『创新』项目

    万次阅读 多人点赞 2019-09-21 02:45:22
    本文将会分享近期发布的七大GitHub机器学习项目。这些项目广泛覆盖了机器学习的各个领域,包括自然语言处理(NLP)、计算机视觉、大数据等。最顶尖的Github机器学习项...
  • VIDEO 【1】Learning Map(学习导图) blog pdf video 【2】Regression:Case Study ;回归:案例研究 blog pdf video 【3】Gradient Descent ;梯度下降 blog pdf video 【4
  • 机器学习机器学习概述

    万次阅读 2019-12-16 22:37:25
    第一个视频主要讲了什么是机器学习机器学习能做些什么事情。 机器学习是目前信息技术中最激动人心的方向之一。在这门课中,你将学习到这门技术的前沿,并可以自己实现学习机器学习的算法。 你或许每天都在不知不觉...
  • 这几天把吴恩达机器学习的视频看了下,都是很基础的,很适合入门视频链接:网易云课堂-吴恩达机器学习配套讲解链接:第一节 第二节 第三节 第四节 第五节入门的话每天看一节就可以,用到的知识也都很基础(微...
  • 阿里云机器学习算法应用实践

    万人学习 2016-10-27 14:30:17
    人工智能的商业化应用是下一个风口,阿里云在机器学习算法方面有许多沉淀。本次分享首先是介绍阿里云机器学习PAI,接着会在上面搭建真实的案例,包括心脏病预测、新闻分类等场景。
  • 我们先带着大家过一遍传统机器学习算法,基本思想和用途。把问题解决思路和方法应用建议提前到这里的想法也很简单,希望能提前给大家一些小建议,对于某些容易出错的地方也先给大家打个预防针,这样在理解后续相应...
  • 轻松搞定八大机器学习算法

    千人学习 2020-04-08 20:03:16
    【为什么学习机器学习算法?】 人工智能是国家发展的战略,未来发展的必然趋势。 将来很多岗位终将被人工智能所代替,但人工智能人才只会越来越吃香。 中国人工智能人才缺口超过500万,...
  • 斯坦福大学吴恩达机器学习课程 完整学习笔记+原始版讲义 全是高清版的ppt该课件为中科院一位仁兄在学习斯坦福大学吴恩达机器学习课程时候所做的学习笔记,非常好,吴老师上课略过的一些内容笔记都详细给出,并且还做...
  • 小玉用心总结了一些良心up主,包含了c、c++、java、python、web前端、机器学习等等各个方面的优质视频,不进来看看你就亏大了
  • 机器学习系列(7)_机器学习路线图(附资料)

    万次阅读 多人点赞 2016-02-28 11:55:21
    也许你和这个叫『机器学习』的家伙一点也不熟,但是你举起iphone手机拍照的时候,早已习惯它帮你框出人脸;也自然而言点开今日头条推给你的新闻;也习惯逛淘宝点了找相似之后货比三家;亦或喜闻乐见微软的年龄识别...
  • Security aspects Efficient Deep Learning on Multi-Source Private Data https://arxiv.org/pdf/1807.06689.pdf Chiron: Privacy-preserving Machine Learning as a Service ...

空空如也

1 2 3 4 5 ... 20
收藏数 278,329
精华内容 111,331
关键字:

机器学习