精华内容
下载资源
问答
  • 机器学习简述
    2022-05-01 15:41:05

    什么是机器学习

    • Arthur Samuel 认为机器学习是这样一个领域,它赋予机器学习的能力,(这种学习能力)不是通过显著式编程获得的。
      计算机成功完成某项指令,其收益函数为正,其他情况收益函数为负。我们规定了行为和收益函数后,让计算机自己去找最大化收益函数。非显著式编程就是让计算机通过数据和经验自动学习,完成任务。
    • Tom Mitshell 认为一个计算机程序被称为可以学习,指它能够针对某个任务T和某个指标P,从经验E中学习。这种学习的特点是,它在任务T上的被指标P所衡量的性能,会随着经验E的增加而提高。
      任务T=人为编写程序,指标P=识别率等,经验E=训练样本。

    任务分类

    • 监督学习(Supervised Learning)
      经验完全是由人工来搜集起来输入计算机的,并为数据打标签。如垃圾邮件分类(垃圾邮件和非垃圾邮件都要标识),此时经验E=数据+标签。

      按照训练数据是否存在标签可分为
      传统的监督学习(Traditional Supervised Learning) :每一个训练数据都有对应的标签。常用算法:支持向量机、人工神经网络、深度神经网络

      半监督学习(Semi-supervised learning, SSL):一半有标签,一半没有。

      非监督学习(Unsupervised Learning):每一个训练数据都没有标签。(假设同一类在空间上的距离更近 -->获取样本空间信息 -->设计算法聚集为两类。) 常用算法:聚类、EM算法、主成分分析

      按标签是连续的还是离散的可分为 分类问题 和 回归问题(预测)。

    • 强化学习(Reinforcement Learning, RL)
      经验是由计算机与环境互动获得的。计算机产生行为和行为结果,程序定义这些行为的收益函数,对行为进行奖励和惩罚。设计算法让计算机自动改变行为模式去最大化收益函数。如汽车自动驾驶、计算机下棋等。

    算法过程

    很多人认为,只要搜集足够多的数据,扔进网上随便的一个开源模型中,就可能获得很好的结果,这在大部分情况下是不正确的。

    我们首先要自己对数据有认识,才可能设计出好的算法。
    认真观察样本的特点,然后决定自己要提取哪些特征。

    1. 特征提取(Feature Extraction)
    通过训练样本获得,对机器学习任务有帮助的多维数据。

    2. 特征选择(Feature Selection)
    对提取的特征进行取舍

    3. 构建算法
    假设在特征空间上距离接近的样本,他们属于同一个类别的概率会更高。根据选择的特征构建算法在特征空间上区分数据。

    更多相关内容
  • 人工智能、机器学习简述 人工智能的简洁定义如下:努力将通常由人类完成的智力任务自动化。 机器学习的技术定义:在预先定义好的可能性空间中,利用反馈信号的指引来寻找输入数据的有用表示。

    人工智能、机器学习简述


    人工智能、机器学习、深度学习的关系
    人工智能的简洁定义:将通常由人类完成的智力任务自动化。

    另一种广为接受的说法是:通过机器来模拟人类认知能力的技术。例如:输入一张手写数字的图片,机器能像人一样识别是什么数字。

    人工智能的发展

    符号主义人工智能(symbolic AI)

    1. 特点:编制规则处理知识
    2. 主流范式:专家系统(expert system)
    3. 缺点:难以给出明确的规则解决复杂、模糊的问题,如:图像识别、语言翻译。于是出现了一种新的方法来替代符号主义人工智能,这就是机器学习(machine learning)。

    机器学习(Machine Learning)

      机器学习的概念来自于图灵的这个问题:对于计算机而言,除了“我们命令它做的任何事情”之外,它能否自我学习执行特定任务的方法?计算机能否让我们大吃一惊?如果没有程序员精心编写的数据处理规则,计算机能否通过观察数据自动学会这些规则?

    1. 特点:机器学习系统是训练出来的,而不是明确地用程序编写出来的。将与某个任务相关的许多示例输入机器学习系统,它会在这些示例中找到统计结构,从而最终找到规则将任务自动化。
    2. 结构:
      1. 输入数据点:语音识别中,数据点可能是记录人们说话的声音文件;为图像添加标签,那么数据点可能是图像。
      2. 预期输出的示例:语音识别任务中,输出示例可能是人们根据声音文件整理生成的文本;在图像标记任务中,预期输出可能是“狗”、“猫”之类的标签。
      3. 衡量算法效果好坏的方法:计算算法的当前输出与预期输出的差距。衡量结果作为一种反馈信号,也就是一种学习
    3. 核心问题:机器学习和深度学习的核心问题在于有意义地变换数据。换句话说,在于学习输入数据的有用表示(representation)——这种表示可以让数据更接近预期输出。

      表示是以一种不同的方式来查看数据(即表征数据或将数据编码)。例如彩色图像可以通过RBG数值来表示

    符号主义和机器学习的区别

    1. 在经典的程序设计(即符号主义人工智能的范式)中,人们输入的是规则(即程序)和需要根据这些规则进行处理的数据,系统输出的是答案。
    2. 利用机器学习,人们输入的是数据和从这些数据中预期得到的答案,系统输出的是规则。这些规则随后可应用于新的数据,并使计算机自主生成答案。
      符号主义和机器学习的区别

    分类任务–理解机器学习

      图中有一些白点和一些黑点。假设我们想要开发一个算法,输入一个点的坐标 (x,y),就能够判断这个点是黑色还是白色。在这个例子中:

    输入是点的坐标;
    预期输出是点的颜色;
    衡量算法效果好坏的一种方法是,正确分类的点所占的百分比。
    在这里插入图片描述
      这里我们需要的是一种新的数据表示,可以明确区分白点与黑点。可用的方法有很多,这里用的是坐标变换。
    在这里插入图片描述
      在这个新的坐标系中,点的坐标可以看作数据的一种新的表示。利用这种新的表示,用一条简单的规则就可以描述黑 / 白分类问题:“x>0的是黑点”或“x<0 的是白点”。这种新的表示基本上解决了该分类问题。在这个例子中,我们人为定义了坐标变换。但是,如果我们尝试系统性地搜索各种可能的坐标变换,并用正确分类的点所占百分比作为反馈信号,那么我们做的就是机器学习。机器学习中的学习指的是,寻找更好数据表示的自动搜索过程。

    另一种分类方法是:像上图(1)所示那样建立直角坐标系,构造一个线性函数,计算各点到线的距离从而不断修正函数,以达到预期输出

      所有机器学习算法都包括自动寻找这样一种变换:这种变换可以根据任务将数据转化为更加有用的表示。

      机器学习的技术定义:在预先定义好的可能性空间中,利用反馈信号的指引来寻找输入数据的有用表示。




    本文摘抄自《Python深度学习》(弗朗索瓦·肖莱)

    因为作者刚刚接触深度学习,对于这方面知识的理解较不深入,希望随着学习的深入能有更多自己的理解。

    如有错误,请读者及时告知,谢谢

    展开全文
  • 量化中的机器学习简述

    千次阅读 2019-06-24 17:54:20
    人工智能,特别是机器学习,在最近几年大出风头,无人驾驶汽车,阿尔法狗战胜人类最强棋手,演唱会人脸识别抓捕逃犯,手机多国语言在线翻译,这一切一切无不给我们带来深深的震撼,可以说人工智能将在不久的未来引来...

    在这里插入图片描述
    人工智能,特别是机器学习,在最近几年大出风头,无人驾驶汽车,阿尔法狗战胜人类最强棋手,演唱会人脸识别抓捕逃犯,手机多国语言在线翻译,这一切一切无不给我们带来深深的震撼,可以说人工智能将在不久的未来引来巨大的爆发式增长,对我们每个人的生活带来深刻的影响。

    既然机器学习这么厉害,那么是不是可以让机器帮我们预测市场、选股票,买卖股票,我们只需要坐着看收益就好了,为什么现实不是这样的呢?

    这一节就简单总结一下量化投资中的我们对机器学习需要了解的基本概念。后面再逐个研究算法的实际应用。

    1、机器学习在量化投资领域的现状是怎么样的呢?

    一句话总结:

    机器学习是当前量化投资的一个重要的方向,但是它的效果并不比其他方向的策略更好。

    为什么机器学习在投资领域并无明显优势?
    这个现象在国内国外都是一样,相比之下,国外用机器学习做量化的会比国内多一些。我认为有两个方面原因:

    • 一方面是人才结构决定。机器学习领域的顶级专家,几乎没有投入到量化投资领域的。对机器学习或者说人工智能领域的大牛来说,本身就可以在Google、微软、BAT等大公司获得领导岗位,也可以较容易的自己融资创业,量化投资这种高风险的事情对他们没有吸引力。
    • 另一方面是金融学科性质决定的。金融分析属于非实验性科学,因此无法进行对照实验,虽然存在大量的金融交易数据,但是无法通过设计实验来控制自变量的变化、通过重复性试验来检验提出的假设(比如说机器学习发现的某种选股模式)。如此的数据分析得到的大多是看似显著但实际上是欺骗式的模式(尤其对样本外数据),这个现象称作数据迁就(data
      snooping)。

    2、人工智能、机器学习、深度学习什么关系?
    在这里插入图片描述
    补充:

    • 我们通常说的神经网络,也属于深度学习的范畴。
    • 机器学习中除了深度学习,还有强化学习这样的类别,主要用于电子游戏方面。

    3、怎么理解传统算法和机器学习算法的区别?

    什么是机器学习?
    机器学习是人工智能的一个分支。它的核心就是学习能力。用逻辑化的语言来描述就是:

    通过n个样本数据(训练样本),预测出未知数据(测试样本)的属性。

    它和传统算法的主要差别就是:学习能力,也叫做泛化能力

    • 在传统编程中,开发人员要对程序进行硬编码,对于如何达到结果,需要开发人员自己很清楚。
    • 在机器学习中,是机器去从数据中学习,开发人员未必知道机器是怎么达到结果的。能举一反三,从数据中自我学习,是机器学习算法的主要特性。

    比如:预测股价这个问题,在传统算法中,基本认为是不可行的。但是在机器学习算法中,确是有较大成功概率的。

    4、机器学习包含哪些分类?

    从大体上,我们将机器学习分为监督学习和无监督学习。

    • **监督学习:**训练样本中的“特性”feature对应目标的“标签”labels,通常用来解决以下两类问题:
      分类问题,样本标签属于两类或多类。这通常是离散的数据。
      回归问题,样本标签包括一个或多个连续变量。这通常是连续的数据。

    • **无监督学习:**训练样本的属性不包含对应的“标签”,通常是聚类问题。

    **说明:**从量化投资的角度,我们用得较多的都是监督学习。

    更详细的模型分类如下图:
    在这里插入图片描述

    说明:

    • 有些算法既能够用于处理分类问题,也能用于处理回归的问题,比如支持向量机、决策树等。
    • “降维”算是一种特殊的应用,可以是无监督学习,其实也可以用于监督学习的。

    5、机器学习的基本流程是什么样的?

    就如同人类学习某种技能需要持续练习一样,机器学习某种规律也需要大量的数据进行训练。从开始获取数据、训练机器学习模型到最终模型投入应用,通常需要遵循一些固定的流程。

    下图展示了机器学习的基本框架,主要步骤包括:数据获取、特征提取、数据转换、模型训练、模型选择和模型预测。
    在这里插入图片描述

    6、机器学习的模型怎么选择?

    在模型训练中,针对不同的问题,我们选择什么样的机器学习方法呢,这里列举一些简单的例子:

    • 如果数据中包含特征标签,希望学习特征和标签之间的对应关系,那么可以采用监督学习的方法;
    • 如果没有标签,希望探索特征自身的规律,那么可以采用非监督学习
      如果学习任务由一系列行动和对应的奖赏组成,那么可以采用强化学习
    • 如果需要预测的标签是分类变量,比如预测股票上涨还是下跌,那么可以采用分类方法
    • 如果标签是连续的数值变量,比如预测股票具体涨多少,那么可以采用回归方法
    • 另外,样本和特征的个数,数据本身的特点,这些都决定了最终选择哪一种机器学习方法。

    7、机器学习中有哪些重要的概念?

    在进行模型建立的时候,我们有三种数据集:训练集、验证集、测试集

    • 训练集Training set:用来训练模型的,通常需要的数据量很大。可以理解为机器学习过程中的课本。
    • 验证集Validation set:是用来做模型选择(model selection)、参数优化的,即做模型的最终优化及确定的。可以理解为机器学习过程中的模拟考试。
    • 测试集Test set:纯粹是为了测试已经训练好的模型的泛化(generalization)能力。这既是对机器学习成果的考试了。

    在评价模型效果的时候,有欠拟合、正常拟合和过拟合三种情况:

    • 欠拟合:采用了较少的参数或模型过于简单,训练得到的效果就比较差
    • 正常拟合:采用合适数量的参数和合适复杂度的模型
    • 过拟合:采用过多的参数和过于复杂的模型,模型依赖数据,离开测试集后表现较差,即模型预测效果较差。

    8、机器学习在量化投资中怎么用?

    有人觉得这个问题很奇怪,一点都不。我们要做的是交易系统,要做的是量化投资,不论机器学习还是技术分析都只是工具。那么很自然就会有这样几种用法:

    • 第一个当然是直接用用一个机器学习的模型策略来实现交易系统
    • 第二种方式用机器学习与其他策略结合,增加额外的过滤器
    • 第三种是发挥机器学习算法的优势,把它作为工具,给其他量化策略进行参数优化
    展开全文
  • 自动机器学习简述(AutoML)

    千次阅读 2019-03-15 11:37:39
    转载本文需注明出处:微信公众号EAWorld,违者必...一、为什么需要自动机器学习 二、超参数优化 Hyper-parameter Optimization 三、元学习 Meta Learning 四、神经网络架构搜索 Neural Architecture Searc...

    https://www.toutiao.com/a6665420964148281864/

     

    自动机器学习简述(AutoML)

     

    转载本文需注明出处:微信公众号EAWorld,违者必究。

    目录:

    一、为什么需要自动机器学习

    二、超参数优化 Hyper-parameter Optimization

    三、元学习 Meta Learning

    四、神经网络架构搜索 Neural Architecture Search

    五、自动化特征工程

    六、其它自动机器学习工具集

    一、为什么需要自动机器学习

    对于机器学习的新用户而言,使用机器学习算法的一个主要的障碍就是算法的性能受许多的设计决策影响。随着深度学习的流行,工程师需要选择相应的神经网络架构,训练过程,正则化方法,超参数等等,所有的这些都对算法的性能有很大的影响。于是深度学习工程师也被戏称为调参工程师。

    自动机器学习(AutoML)的目标就是使用自动化的数据驱动方式来做出上述的决策。用户只要提供数据,自动机器学习系统自动的决定最佳的方案。领域专家不再需要苦恼于学习各种机器学习的算法。

    自动机器学习不光包括大家熟知的算法选择,超参数优化,和神经网络架构搜索,还覆盖机器学习工作流的每一步:

    自动机器学习简述(AutoML)

     

    • 自动准备数据
    • 自动特征选择
    • 自动选择算法
    • 超参数优化
    • 自动流水线/工作流构建
    • 神经网络架构搜索
    • 自动模型选择和集成学习

    二、超参数优化Hyper-parameter Optimization

    学习器模型中一般有两类参数,一类是可以从数据中学习估计得到,还有一类参数时无法从数据中估计,只能靠人的经验进行设计指定,后者成为超参数。比如,支持向量机里面的C Kernal Gamma;朴素贝叶斯里面的alpha等。

    超参数优化有很多方法:

    最常见的类型是黑盒优化 (black-box function optimization)。所谓黑盒优化,就是将决策网络当作是一个黑盒来进行优化,仅关心输入和输出,而忽略其内部机制。决策网络通常是可以参数化的,这时候我们进行优化首先要考虑的是收敛性。

    以下的几类方法都是属于黑盒优化:

    网格搜索 (grid search)

    Grid search大家都应该比较熟悉,是一种通过遍历给定的参数组合来优化模型表现的方法。网格搜索的问题是很容易发生维度灾难,优点是很容易并行。

    随机搜索 (random search)

    随机搜索是利用随机数求极小点而求得函数近似的最优解的方法。

    自动机器学习简述(AutoML)

     

    很多时候,随机搜索比网格搜索效果要更好,但是我们可以从上图看出,它们都不能保证找到最优解。

    贝叶斯优化(http://t.cn/EfRNqz8)

    贝叶斯优化是一种迭代的优化算法,包含两个主要的元素,输入数据假设的模型和一个采集函数用来来决定下一步要评估哪一个点。每一步迭代,都使用所有的观测数据fit模型,然后利用激活函数预测模型的概率分布,决定如何利用参数点,权衡是Explaoration还是Exploitation。相对于其它的黑盒优化算法,激活函数的计算量要少很多,这也是为什么贝叶斯优化被认为是更好的超参数调优的算法。

    黑盒优化的一些工具:

    hyperopt(http://t.cn/RyJDbzH)

    hyperopt 是一个Python库,可以用来寻找实数,离散值,条件维度等搜索空间的最佳值

    Google Vizier

    Google的内部的机器学习系统 Google Vizier能够利用迁移学习等技术自动优化其他机器学习系统的超参数

    advisor(http://t.cn/RpTEMhK)

    Google Vizier的开源实现

    katib (http://t.cn/EvQJWbq)

    基于Kubernetes的超参数优化工具

    由于优化目标具有不连续、不可导等数学性质,所以一些搜索和非梯度优化算法被用来求解该问题,包括我们上面提到的这些黑盒算法。此类算法通过采样和对采样的评价进行搜索,往往需要大量对采样的评价才能获得比较好的结果。然而,在自动机器学习任务中评价往往通过 k 折交叉验证获得,在大数据集的机器学习任务上,获得一个评价的时间代价巨大。这也影响了优化算法在自动机器学习问题上的效果。所以一些减少评价代价的方法被提出来,其中多保真度优化(multi-fidelity methods)就是其中的一种。这里的技术包括:基于学习曲线来决定是否要提前终止训练,探索-利用困境(exploration exploitation)的多臂老虎机算法 (Multi-armed bandit)(http://t.cn/R5AMrlH)等等。

    另外还有一些研究是基于梯度下降的优化。

    超参数优化面临许多挑战:

    • 对于大规模的模型或者复杂的机器学习流水线而言,需要评估的空间规模非常大
    • 配置空间很复杂
    • 无法或者很难利用损失函数的梯度变化
    • 训练集合的规模太小
    • 很容易过拟合

    相关参考

    http://t.cn/EfRTKmq

    http://t.cn/EfRTmLa

    http://t.cn/EfRHzrV

    http://t.cn/RM7FoqC

    http://t.cn/RdEUPtd

    http://t.cn/EfRQwnA

    http://t.cn/EfRQio5

    http://t.cn/EfR8vzx

    三、元学习 Meta Learning

    元学习也就是"学习如何学习",通过对现有的学习任务之间的性能差异进行系统的观测,然后学习已有的经验和元数据,用于更好的执行新的学习任务。这样做可以极大的该静机器学习流水线或者神经网络架构的设计,也可以用数据驱动的方式取代手工作坊似的算法工程工作。

    从某种意义上来说,元学习覆盖了超参数优化,因为元数据的学习包含了:超参数,流水线的构成,神经网络架构,模型构成,元特征等等。

    机器学习的算法我们又称为‘学习器’,学习器就是假定一个模型,该模型拥有很多未知参数,利用训练数据和优化算法来找到最适合这些训练数据的参数,生成一个新的算法,或者参数已知的模型,并利用该模型/算法来预测新的未知数据。如果说世界上只有一个模型,那么问题就简单了,问题是模型有很多,不同的模型拥有不同的超参数,我们往往还会把模型和算法组装在一起构成复合模型和机器学习的流水线,这个时候,我就需要知道解决不同的问题要构建那些不同的模型。元学习就在这个时候,我们可以把超参数,流水线,神经网络架构这些都看成是一个新的模型的未知参数,把不同学习任务的性能指标看成是输入数据,这样我们就可以利用优化算法来找到性能最好的那组参数。这个模式可以一直嵌套,也就是说,你可以有‘元元元学习‘,当然我希望你不要走得太远,找不到回来的路。

    元学习的方法包括:

    • 通过模型评估来学习
    • 通过任务的属性,元特征来学习

    以下列出了一些常见的元特征

    自动机器学习简述(AutoML)

     

    • 从现有的模型中学习,包括:
    1. 迁移学习
    2. 利用RNN在学习过程中修改自己的权重

    元学习的一个很大的挑战就是如果通过很少的训练数据来学习一个复杂的模型,这就是one-shot(http://t.cn/EfRmJZp)或者few-shot的问题。

    像人类的学习一样,每次学习无论成功失败,我们都收获一定的经验,人类很少从头学习。在构建自动学习的时候,我们也应该充分利用已有的每一次的学习经验,逐步的改进,使得新的学习更加有效。

    相关参考:

    http://t.cn/EfRuJPM

    http://t.cn/EyEri3B

    http://t.cn/EfR1Iek

    四、神经网络架构搜索Neural Architecture Search

    提起AutoML,其实大多数人都是因为Google的AutoML系统才知道这个故事的。随着深度学习的流行,神经网络的架构变得越来越复杂,越来越多的手工工程也随之而来。神经网络架构搜索就是为了解决这个问题。

    NAS主要包含三个部分:

    • 搜索空间 search space
    • 搜索策略 search strategy
    • 性能估计策略 performance estimation strategy

    自动机器学习简述(AutoML)

     

    相关参考

    http://t.cn/EfRD7WS

    五、自动化特征工程

    自动化特征工程可以帮助数据科学家基于数据集自动创建能够最好的用于训练的特征。

    Featuretools(http://t.cn/Rl9tYUT)是一个开源库,用来实现自动化特征工程。它是一个很好的工具,旨在加快特征生成的过程,从而让大家有更多的时间专注于构建机器学习模型的其他方面。换句话说,它使你的数据处于“等待机器学习”的状态。

    自动机器学习简述(AutoML)

     

    Featuretools程序包中的三个主要组件:

    • 实体(Entities)
    • 深度特征综合(Deep Feature Synthesis ,DFS)
    • 特征基元(Feature primitives)

    一个Entity可以视作是一个Pandas的数据框的表示,多个实体的集合称为Entityset。

    深度特征综合(DFS)与深度学习无关,不用担心。实际上,DFS是一种特征工程方法,是Featuretools的主干。它支持从单个或者多个数据框中构造新特征。

    DFS通过将特征基元应用于Entityset的实体关系来构造新特征。这些特征基元是手动生成特征时常用的方法。例如,基元“mean”将在聚合级别上找到变量的平均值。

    相关参考

    http://t.cn/EfRs7O2

    http://t.cn/EfRsias

    六、其它自动机器学习工具集

    以下列出一些开源的自动机器学习工具空大家参考、选择

    • Auto-Sklearn (http://t.cn/EfEPf5H)
    • AutoKeras(http://t.cn/RDVQhH4)
    • TPOT(http://t.cn/EfEPsHl)
    • H2O AutoML (http://t.cn/EfE2fKw)
    • Python auto_ml(http://t.cn/Ri1Ch74)

    自动机器学习简述(AutoML)

     

    关于作者:陶刚,Splunk资深软件工程师,架构师,毕业于北京邮电大学,现在在温哥华负责Splunk机器学习云平台的开发,曾经就职于SAP,EMC,Lucent等企业,拥有丰富的企业应用软件开发经验,熟悉软件开发的各种技术,平台和开发过程,在商务智能,机器学习,·数据可视化,数据采集,网络管理等领域都有涉及。

    展开全文
  • 读完这篇文章后,如果多模态机器学习让你着迷了,建议你去学习CMU的多模态机器学习课程。链接在参考列表中。 参考列表: Multimodal Machine Learning: A Survey and Taxonomy [2017]. ...
  • 机器学习简述——ML(1)

    千次阅读 2018-03-26 16:30:47
    简述 机器学习是人工智能的一种实现方式;深度学习是一种实现机器学习的技术,或者说是一种特殊的机器学习方法,可以说广义上的机器学习也包括了深度学习,三者的关系如下图所示: 从判别垃圾邮件到无人驾驶技术,...
  • 什么是机器学习机器学习与AI的关系?

    千次阅读 热门讨论 2021-02-26 11:56:15
    而这类问题正是机器学习所能够解决的。 传统上来讲,计算机编程指在结构化的数据上执行明确的程序规则。软件开发人员动手编写程序,告诉计算机如何对数据执行一组指令,并输出预期的结果,如图1-1所示。这个过程与...
  • 多目标优化方法在机器学习中的应用简述.pdf
  • 机器学习中多目标优化算法的简述.pdf
  • 大数据背景下的机器学习算法简述.pdf
  • 机器学习”的研究步骤——简述科学研究的一般过程.pdf
  • 今天我们就来看看,在日常生活中有哪些最常见的机器学习用例(有时我们甚至没有意识到这些例子涉及机器学习)。本文涵盖了以下常见的机器学习用例: 1. 机器学习在智能手机中的用例 你知道吗,智能手机中的大多数...
  • 机器学习的三大要素:数据、算法模型、计算。 机器学习最大的用处是通过对历史数据的分析,找出其中的潜在规律,从而对未来进行预测。 数据:目前是大数据时代,各行各业基本上都不缺数据,缺乏的只是从数据当中提炼...
  • 线性模型形式简单,易于建模,但是却蕴藏机器学习中一些重要的基本思想。
  • 机器学习考试简答题

    千次阅读 多人点赞 2020-11-22 15:21:57
    简述机器学习的一般过程。 2、简述K折交叉验证与留一法的基本思想及其特点。 3、简述什么是欠拟合和过拟合、产生的原因以及如何解决。 4、简述线性回归与逻辑回归的区别。 5、简述剪枝的目的以及常用的两种剪枝...
  • 机器学习主要分为两类 监督学习 无监督学习 两者的区别主要是是否需要人工参与数据结果的标注 监督学习:教计算机如何去完成预测任务(有反馈),预先给一定数据量的输入和对应的结果即训练集,建模拟合,最后让...
  • 回归与分类不在于输入值,而在于输出值的不同,回归输出的值是连续的,分类输出的值存在离散的。 回归问题 在回归问题中,我们可以预测房价的变化,未来天气湿度...3.选择合适的学习算法;4.对结果进行预测。 ...
  • 机器学习框架简述

    千次阅读 2018-08-22 14:16:56
    机器学习框架意味着一个能够整合包括机器学习算法在内的所有机器学习的系统或方法,使用户最有效的使用它们。具体来讲,这包括数据表示与处理的方法、表示和建立预测模型的方法、评价和使用建模结果的方法。 在...
  • 机器学习(四):剪枝技术(基础篇) 相关的决策树文章: 机器学习(四)ID3决策树 机器学习(四)C4.5决策树 机器学习(四)CART分类树 机器学习(四)CART回归树 机器学习(四)决策树绘图 到现在为止,已经完成...
  • AI简史及其范畴 AI的重要技术 AI的局限、研究领域、挑战 我国新一代AI目标 我国部分AI状况 牛津报告
  • 包括讲解线性模型的PPT与用python实现线性模型的代码。
  • 自动化机器学习就是能够自动建立机器学习模型的方法,其主要包含三个方面:方面一,超参数优化;方面二,自动特征工程与机器学习算法自动选择;方面三,神经网络结构搜索。本文侧重于方面三,神级网络结构搜索。 ...
  • 机器学习分为:监督学习,无监督学习,半监督学习(也可以用hinton所说的强化学习)等。 在这里,主要理解一下监督学习和无监督学习。 监督学习(supervised learning) (1)从给定的训练数据集中学习出一个函数...
  • 什么是机器学习

    千次阅读 2022-01-05 18:51:05
    机器学习 ( ML )是人工智能的应用程序,计算机程序使用算法来查找数据中的模式。他们可以在没有专门编程的情况下做到这一点,而不需要依赖人类。在当今世界,机器学习算法几乎落后于市场上的所有人工智能 (AI) ...
  • 机器学习(Machine learning)领域,主要有三类不同的学习方法: 监督学习(Supervised learning)、 非监督学习(Unsupervised learning)、 半监督学习(Semi-supervised learning), 监督学习:通过已有的...
  • 机器学习的应用

    千次阅读 2022-06-01 21:47:57
    机器学习的应用
  • 机器学习机器学习概念简述

    千次阅读 2017-12-14 14:57:09
    机器学习追求合理的假设空间的选取和模型的泛化能力   常见的机器学习应用场景: 数据挖掘、模式识别、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列...
  • 堆码 简述 主要的三类集成学习方法为装袋...基本上,现代传统机器学习领域的库基本上被sciket-learn(sklearn)占领,如果你没有使用过sklearnlib,那就不能使用过机器学习算法进行数据挖掘。但是,自定义集成学习库依
  • 机器学习类型概述

    2022-05-21 15:36:27
    从不同的视角来看待诸多机器学习算法,有不同的划分。 1、语料视角 根据训练语料对人工参与类别划分或标签标识的需求程度,可将机器学习划分为四种类型: 监督学习、无监督学习、半监督学习、强化学习。 1.1、...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 22,644
精华内容 9,057
关键字:

机器学习简述