精华内容
下载资源
问答
  • 文章目录集成学习学习目标5.1 集成学习算法简介1 什么是集成学习2 **复习:机器学习的两个核心任务**3 集成学习中boosting和Bagging 学习目标 了解集成学习中主要解决的两个核心任务 知道bagging集成原理 知道随机...

    集成学习

    学习目标

    • 了解集成学习中主要解决的两个核心任务
    • 知道bagging集成原理
    • 知道随机森林决策树的建立过程
    • 知道为什么需要随机有放回(Bootstrap)的抽样
    • 应用RandomForestClassifie实现随机森林算法
    • 知道boosting集成原理
    • 知道bagging和boosting的区别
    • 了解gbdt实现过程
      在这里插入图片描述

    5.1 集成学习算法简介

    1 什么是集成学习

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FUywK5ZD-1583250286371)(../images/ensemble1.png)]

    集成学习通过建立几个模型来解决单一预测问题。它的工作原理是生成多个分类器/模型,各自独立地学习和作出预测。这些预测最后结合成组合预测,因此优于任何一个单分类的做出预测。

    2 复习:机器学习的两个核心任务

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dnD9oIGI-1583250286372)(../images/ensemble2.png)]

    3 集成学习中boosting和Bagging

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1NgqFpid-1583250286372)(../images/ensemble3.png)]

    只要单分类器的表现不太差,集成学习的结果总是要好于单分类器的.

    展开全文
  • 机器学习的基本任务 1.分类任务 2.回归任务 分类任务细分有: 二分类任务 ,结果仅为两个中的一个; 多分类任务 ,结果会是多个中的一个; 在某种程度上来说,一些很复杂的任务也可以分为多分类的任务。eg.会...

    Anthem的深度学习之路

    深度学习笔记之

    机器学习的基本任务

    1.分类任务

    2.回归任务

    分类任务细分有:

    1. 二分类任务 ,结果仅为两个中的一个;

    2. 多分类任务 ,结果会是多个中的一个;

      在某种程度上来说,一些很复杂的任务也可以分为多分类的任务。eg.会自己下2048、下围棋、智能驾驶等等…
      虽然分类方法应用范围很广,但它并不是最好的完成任务的方法。

      对于分类任务的核心思想就是:
      	1.对于某些任务只支持二分类的,就用二分类。
      	2.多分类的任务想办法把其转化为许多个二分类任务,再逐个解决。
      

    回归任务:

    	1.结果应该是一个连续数字的值,而不是一个类别。
    

    不同算法的解决范围是不一样的

    	要根据实际需要再来进行选择
    

    图片来自网络,侵删

    展开全文
  • 这是我在The Sparks Foundation进行的实习中给我的任务之一,即GRIP(研究生旋转实习计划)任务1-探索有监督的机器学习在此回归任务中,我们将预测学生所获分数的百分比预期会根据他们学习的小时数来评分。...
  •   我们所关注的机器学习的基本任务主要有类,一类是分类,一类是回归。 一、分类任务   分类任务,其实在之前博客中所举的例子都是一分类任务。比如图像识别,让机器识别一张图片是一只狗还是一只猫。分类...


      我们所关注的机器学习的基本任务主要有两类,一类是分类,一类是回归

    一、分类任务


      分类任务,其实在之前博客中所举的例子都是一个分类任务。比如图像识别,让机器识别一张图片是一只狗还是一只猫。分类任务即是将我们给定的数据进行分类。

      分类任务又具体分为了以下几种。

    1. 二分类(Binary Classification)


      相对而言,二分类任务是比较简单的任务,相当于一种二选一的任务。虽然二分类任务看起来比较简单,其实在实际生活中,很多任务使用二分类任务就足够了。

      比如判断邮件是垃圾邮件还是不是垃圾邮件;判断发放给客户信用卡有风险还是没有风险;判断一个病患是良性肿瘤还是恶性肿瘤。,判断某支股票是涨还是跌等等,这些都是二分类的任务。

    2. 多分类(Multi-class Classification)


      与二分类所对应的,就是多分类任务。换句话说,我们的机器算法不仅仅将结果锁定在两个选项中,而是多个中的一个。比如手写一个数字,就需要在10个数字中进行判断。
    在这里插入图片描述
      同样,多分类的问题在实际生活中也有广泛的应用。最典型的比如数字识别;图像识别;判断发放给客户信用卡的风险评级(A/B/C/D/E);

      可以想象一下,可能很多看似复杂的任务,都可以转换成一个分类任务。比如说,我们想做一个自动玩游戏的人工智能,这里我们用 2048 这个游戏为例。如果使用机器学习的方法经过训练之后,最终我们的机器要做到的就是给你现在的这个盘面的状态,机器只需要选择是要上移,左移,右移还是下移,在这四个选项中选择一个就好。那么我们就将这样的人工智能转化成一个多分类的任务。这就是我们所说的很多复杂的问题也可以转换成多分类的问题。
    在这里插入图片描述
      同样,对于一个更复杂的游戏也是如此。比如说,下围棋这个游戏。毕竟在棋盘上可以落子的地方是有限的,所以每一步机器要做的事情其实是根据现在的棋盘讯息选择一个地方进行落子,我们可以将它转化成一个分类任务。

      甚至,现在大红大紫的无人车这个领域,我们都可以将其转换成一个分类任务。在车的周围可能有各种传感器,包括摄像头来监视车身周围的一些情况,然后根据所获得的信息,我们要做的只是选择方向盘向左或向右打多少个角度,即时配合上油门和刹车,我们踩下的幅度的不同,那么,整个开车过程就在每一个时刻去选择方向盘,油门,刹车对这三个关键的部件进行控制得到的结果的一个组合,在这些组合中选择一个而已。所以,我们可以将其转换成一个多分类问题。

      但是需要注意的是,我们上面所说的是可以将这些问题转换成多分类任务,并不是说这个问题使用多分类就是最好的解决方案。

      在后面的学习中,我们会意识到一些算法只支持完成二分类任务,但是我们可以将多分类的任务转换成二分类的任务。

      其实分类任务除了划分成二分类和多分类。还可以分为多标签分类
    在这里插入图片描述

    二、回归任务


      上面介绍的都是分类任务,与介绍的数据是对应的。其实还有一类数据是这个样子。下面的表格中是一个房产数据。
    在这里插入图片描述
      对于这个房产数据,它的特征有4个,分别是房屋的面积,房屋的年龄,卧室的数量,以及最近地铁站距离,与之相对应的标签是房屋的价格。与之前的数据不同的是,之前的数据的标签是一个分类,比如是猫还是狗,是垃圾邮件还是不是垃圾邮件,而这个数据是一个价格,不是一个类别,是一个具体的数值。这一类任务就是机器学习可以处理的另外一类任务,也就是回归任务

      回归任务的特点,就在于结果是一个连续数字的值,而非一个类别。比如房屋的价格,市场的分析,学生的成绩,股票的价格。但是有一些情况下,回归任务是可以简化成分类任务。

      对于一些算法来说,有一些算法只能解决回归问题,有一些算法只能解决分类问题。不过,还是有一些算法的思路既能解决回归问题,又能解决分类问题。

      我们再来回顾一下什么是机器学习?
    在这里插入图片描述
      大量的学习资料就是数据集。将这些数据集送给机器学习算法,机器学习算法将根据数据集训练出一个模型,而这个模型是我们进一步解决问题的核心,当有了新的样本资料后,通过这个模型来得出这个结果。而这篇博客主要讲的是这个模型的输出结果主要有两类,一类是具体的类别,对应的是分类问题,另一类是一个具体的数值,对应的是回归问题。那么我们再来看看什么叫做一个模型,事实上,我们可以将一个模型理解为一个函数 f(x),那么我们的机器学习算法得到的就是一个函数 f(x),每一个 x 就是一个小的样本资料,如果有了新的 x,那么我们就将 x 带入 f(x) 中,如果得到的是一个0,1,2这样的类别,那么这就是一个分类问题,如果得到的是一个具体的数值,那么相应的就是一个回归问题。

    展开全文
  • 分钟论文】系列视频资源见链接:http://www.insideai.cn/vedio/papers/reluplex.html 下一篇:依据语音内容生成...介绍机器学习领域高引用热门论文. 这课程解读论文是斯坦福大学《Reluplex:An Ef...

    【两分钟论文】系列视频资源见链接:http://www.insideai.cn/vedio/papers/reluplex.html
    下一篇:依据语音内容生成面部动画 - NVIDIA
    关注公众号:【袋马AI 】获取论文资源

    在这里插入图片描述
    两分钟论文导读系列是由Károly Zsolnai-Fehér录制。介绍机器学习领域的高引用的热门论文.

    这个课程解读的论文是斯坦福大学的《Reluplex:An Efficient SMT Solver for Verifying Deep Neural Networks》。论文介绍了一种验证神经网络重要特征的方法。帮助学习系统明确可能的对抗性训练。视频内容是英文的,因此我把视频内容翻译了下,翻译内容如下(如有更多翻译的建议欢迎在公众中回复):

    Dear Fellow Scholars, this is Two Minute Papers with Karoly Zsolnai-Feher.
    亲爱的学者们,这是Karoly Zsolnai-Feher的两分钟论文系列。

    This paper does not contain the usual fireworks that you’re used to in Two Minute Papers, but I feel that this is a very important story that needs to be told to everyone.
    这篇文章不像之前的论文那样出彩,但是我认为有一些重要的故事,仍然值得告诉每个人。

    In computer science, we encounter many interesting problems, like finding the shortest path between two given streets in a city, or measuring the stability of a bridge.
    在计算机科学中,我们遇到许多有趣的问题,比如在城市中两条给定的街道之间找到最短的路径,或者测量桥梁的稳定性。

    Up until a few years ago, these were almost exclusively solved by traditional, handcrafted techniques.
    直到几年前,这些问题几乎完全是通过传统手工技术解决的。

    This means a class of techniques that were designed by hand by scientists and are often specific to the problem we have at hand.
    这意味着有一类由科学家手动设计的技术,是专门针对我们手头的问题而设计的
    Different problem, different algorithm.
    不同的问题,不同的算法。

    And, fast forward to a few years ago, we witnessed an amazing resurgence of neural networks and learning algorithms.
    几年前,我们目睹了神经网络和学习算法的惊人复兴。

    Many problems that were previously thought to be unsolvable, crumbled quickly one after another.
    许多以前被认为是无法解决的问题,一个接一个地被迅速攻破。

    Now it is clear that the age of AI is coming, and clearly, there are possible applications of it that we need to be very cautions with.
    现在很明显,人工智能的时代即将到来,显然,我们需要非常小心地使用它。

    Since we design these traditional techniques by hand, the failure cases are often known because these algorithms are simple enough that we can look under the hood and make reasonable assumptions.
    由于我们手动设计这些传统的技术,失败的情况是可以被预见的,因为这些算法非常简单,我们可以通过观察做出合理的假设。

    This is not the case with deep neural networks.
    深层神经网络所处理的问题的情况并非如此。

    We know that in some cases, neural networks are unreliable.
    我们知道,在某些情况下,神经网络是不可靠的。

    But it is remarkably hard to identify these failure cases.
    但是很难识别出这些错误的案例。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    For instance, earlier, we talked about this technique by the name pix2pix where we could make a crude drawing of a cat and it would translate it to a real image.
    例如,早些时候,我们讨论了这个名为pix2pix的技术,在这里我们可以绘制一只猫的简笔画,将它转换成一个真实的猫的形象。

    It worked spectacularly in many cases, but twitter was also full of examples with really amusing failure cases.
    它在很多情况下都非常有效,但在Twitter上也有很多非常有趣的失败案例。

    Beyond the unreliability, we have a much bigger problem.
    除了不可靠之外,神经网络还有一个更大的问题。

    And that problem is adversarial examples.
    就是对抗样本问题。

    In an earlier episode, we discussed an adversarial algorithm, where in an amusing example, they added a tiny bit of barely perceptible noise to this image, to make the deep neural network misidentify a bus for an ostrich.
    在前面的一集中,我们讨论了一种对抗性算法,在一个有趣的例子中,他们给这幅图像添加了一点几乎无法察觉的噪音,从而使深层神经网络把公共汽车误认为成鸵鸟。

    在这里插入图片描述
    We can even train a new neural network that is specifically tailored to break the one we have, opening up the possibility of targeted attacks against it.
    我们甚至可以训练出一种新的神经网络,它是专门为打破现有的神经网络而设计的,从而产生了针对它的定向攻击的可能性。

    To alleviate this problem, it is always a good idea to make sure that these neural networks are also trained on adversarial inputs as well.
    为了缓解这一问题,确保这些神经网络接受了对抗性输入的训练,是一个好主意。

    But how do we know how many possible other adversarial examples exist that we haven’t found yet?
    但是,我们怎么知道还有多少其他可能的对抗性例子,还没有被找到呢?

    The paper discusses a way of verifying important properties of neural networks.
    本文讨论了一种验证神经网络重要特征的方法。

    For instance, it can measure the adversarial robustness of such a network, and this is super useful, because it gives us information whether where there are possible forged inputs that could break our learning systems.
    例如,它可以度量一个网络的对抗鲁棒性,这是非常有用的,因为它为我们提供了信息,让我们可以知道那些输入数据可能会破坏我们的学习系统。

    The paper also contains a nice little experiment with airborne collision avoidance systems.
    本文还对机载避碰系统进行了较好的实验研究。

    The goal here is avoiding midair collision between commercial aircrafts while minimizing the number of alerts.
    这里的目标是避免商用飞机之间的空中碰撞,同时尽量减少警报的数量。
    在这里插入图片描述
    As a small-scale thought experiment, we can train a neural network to replace an existing system, but in this case, such a neural network would have to be verified.
    作为一个小规模的实验,我们可以训练一个神经网络来取代现有的系统,但在这种情况下,这样的神经网络必须得到验证。
    And it is now finally a possibility.
    现在终于有可能了。

    Now, make no mistake, this does not mean that there are any sort of aircraft safety systems deployed in the industry that are relying on neural networks.
    现在,毫无疑问,这并不意味着在工业中部署的任何类型的飞机安全系统都依赖于神经网络。

    No no no, absolutely not.
    不,不,绝对不是。

    This is a small-scale “what if” kind of experiment that may prove to be a first step towards something really exciting.
    这是一个小规模的“万一”实验,可能被证明是迈向真正令人兴奋的事情的第一步。

    This is one those incredible papers that, even without the usual visual fireworks, makes me feel that I am a part of the future.
    这是一篇令人难以置信的论文,即使目前看起来成果有限,但是仍然让我觉得自己是未来的一部分。

    This is a step towards a future where we can prove that a learning algorithm is guaranteed to work in mission critical systems.
    这是迈向未来的一步,我们可以证明,学习算法能够保证关键任务系统中的工作。

    I would also like to note that even if this episode is not meant to go viral on the internet, it is still an important story to be told.
    我还想指出,即使这一集没有在互联网上传播开来,它仍然在讲一个重要的故事。

    【两分钟论文】系列视频资源见链接:http://www.insideai.cn/vedio/papers/reluplex.html
    下一篇:依据语音内容生成面部动画 - NVIDIA
    关注公众号:【袋马AI 】获取论文资源

    展开全文
  • 前言 机器学习(统计机器学习)包括监督学习(supervised learning)、无监督学习(unsupervised learning)、半监督学习(semi-supervised ...监督学习的任务是学习一模型,使模型能够对任意给定的输入,对其相应...
  • 1. 确定特征 选取合适数据和特征可能是最重要步骤,也包括数据预处理或清洗,通常可以称之为特征工程。 2. 确定模型 确定目标函数及决策边界形状。 可选择多个模型进行... 这里要区分两个概念: ...
  • 在 SharpestMinds 创始人 Edouard Harris 介绍的两个成功例子中,人家是从基础的收集数据开始一步步做项目的:目标明确,做到极致。我是一名物理学家,在 YC startup 工作。我们的任务是帮应届生找到自己的第一份...
  • 年,业内学者与科学家都在积极探索可以弥补深度学习不可解释性,无法进行因果推断缺陷,而图神经网络(GNN)成为备受关注和期待“宠儿”。随着学界和业界越来越关注GNN,各种新工作...
  • Task3 基于机器学习的文本分类 在上一章节,我们对赛题的数据进行了读取,并在末尾给出了两个小作业。如果你顺利完成了作业,那么你基本上对Python也比较熟悉了。在本章我们将使用传统机器学习算法来完成新闻分类的...
  • 机器学习中,我们的主要任务是选择一个学习算法并将其在数据上训练,所以有可能效果不佳的两个地方在于: 算法不好 数据不好 我们先从数据不好开始看起。 训练数据的数量不够 如果是教一个小孩子认什么是苹果,...
  • 图算法不是一新兴技术领域,在开源库中已经有很多功能强大算法实现。...基于图数据优秀性质,吸引越来越多企业在基于图数据的机器学习任务中开始投入研究与使用,将图数据与机器学习算法结合,弥补
  • 此处给出了机器学习的两个定义。 亚瑟·塞缪尔(Arthur Samuel)将其描述为:“机器学习赋予计算机无需明确编程就能学习的能力。”这是一个古老的、非正式的定义。 Tom Mitchell给出了一个更现代的定义:“一个...
  • 机器学习的学习任务根据训练集是否拥有标记信息, 可大致分为类:监督学习和无监督学习 分类和回归是监督学习的代表 (对于预测的结果是离散值,例如“好瓜”“坏瓜”此称为分类;对于预测值是连续值,例如西瓜...
  • 支持向量机属于机器学习的监督学习算法,它广泛的应用于统计分类以及回归分析中。在深度学习还未像今天这样火爆的时候,支持向量机被认为是最优秀的算法。其英文名为support vector machine,故一般简称SVM,通俗来...
  • 7步骤建立可用的机器学习模型

    千次阅读 2020-03-12 14:54:38
    Netflix或Amazon Prime推送您喜欢看电影,这背后逻辑你不觉得惊讶吗?或者,你不好奇是什么让Google地图可以预测您所行驶路线上路况? 我们都知道机器学习是如何使用算法和... 简单来说,机器学习可分为两个...
  • 对于那些直接写代码而言太复杂的任务机器学习是必需。 有些任务是如此复杂,以至于不可能写出明确应对每一种可能性程序。 因此,机器学习采用另一途径,通过向算法输入大量数据,让算法自行探索数据并获得...
  • 任务级框架提供方法使您可以执行高级任务,而不必显式处理培训和部署机器学习模型。该框架包括许多预训练模型,并将根据您要执行的任务选择一模型。 Apple提供关键任务级框架如下: 视觉:此框架提供高级...
  • 机器学习

    2020-07-10 21:40:25
    4.最常见的两种监督式学习任务是什么? 5.举出四种常见的无监督式学习任务? 6.要让一机器人在各种未知的地形中行走,应该使用什么类型的机器学习算法? 7.要将顾客分成多组,你会使用什么类型算法? 8.垃圾邮件...
  • 什么是机器学习?   在1959年,Arthur Samuel:不用编程去指定机器做什么,而是让机器有能力自己学习;...在1998年,Tom Mitchell:首先...以上就是对机器学习的两个定义;     机器学习在生活中也处
  • 机器学习的领域,有类主要的任务:监督学习与无监督学习。这种方法上的区别在于,监督学习是使用真实的标签来完成的,但是在无监督中,却不存在这样的标签。因为这样的特性,监督学习的目标是学习一函数,在...
  • 作者 | Mark Needham译者 | ...近年,业内学者与科学家都在积极探索可以弥补深度学习不可解释性,无法进行因果推断缺陷,而图神经网络(GNN)成为备受关注和期待“宠儿”。随着学界和业界越来越关注GNN...
  • 浅谈机器学习的分类

    千次阅读 2018-09-12 20:52:31
    机器学习、人工智能、深度学习...这些词汇相信大家已经在无数个场合看到了,那么...机器学习的主要任务便是聚焦于两个问题:分类和回归。 分类相信大家都不会陌生,生活中会见到很多的应用,比如垃圾邮件识别、信用...
  • 训练并运行机器学习的分类器以执行分子分类任务; 例如,预测QSAR项目中的溶解度,雾化能或生物亲和力等属性。 总体目的是“将任何易于计算的东西扔到墙上,看看有什么东西粘在上面”。 分子以字符串的形式输入。 ...
  • 第二课:机器学习和深度学习的区别 什么是深度学习? 深度学习可以拆解为“深度”和下“学习”两个词来理解, 首先,学习正如它字面意思所说,就是一个从无到有的过程,人类在学习的时候从什么都不会,到掌握了一门...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,661
精华内容 664
关键字:

机器学习的两个任务