2019-01-10 16:33:09 qq_19950851 阅读数 89
  • 机器学习-决策树视频教学

    机器学习算法系列课程,决策树视频教程,通过具体案例详细讲解机器学习算法-决策树。简单通俗的介绍常见的机器学习算法,具体内容包括认识决策树、熵、Python验证算法等。并且用python验证。

    1429 人正在学习 去看看 刘湘宇

1.1、机器学习的两个大类

监督学习 --分类和回归

监督学习:在机器学习中提供包含特征和标签的数据,通过机器学习的相关算法实现数据的分类和回归。

分类

分类:标签是离散的数据

回归

回归:标签是连续的数据

无监督学习 --聚类

无监督学习:在机器学习中只提供包含特征的数据,通过相关算法实现数据的聚类。

2.1、机器学习的常用类库

Numpy

Python开源数值计算扩展。用于存储和处理大型矩阵。

Pandas

进行数据处理的最主要类库,提供快速读取、存储、处理数据的函数和方法。

Matplotlib

2D绘图库,提供交互式的制图类库。

scikit-learn

Python中提供算法的类库,主要分为六大部分:分类、回归、聚类、数据降维、模型选择、数据预处理。

2018-05-22 15:44:49 wangyuxi__ 阅读数 553
  • 机器学习-决策树视频教学

    机器学习算法系列课程,决策树视频教程,通过具体案例详细讲解机器学习算法-决策树。简单通俗的介绍常见的机器学习算法,具体内容包括认识决策树、熵、Python验证算法等。并且用python验证。

    1429 人正在学习 去看看 刘湘宇

原创不易,如果有转载需要的话,请在首行附上本文地址,谢谢。

机器学习简介

机器学习是什么:

机器学习教计算机执行人和动物与生俱来的活动:从经验中学习。机器学习算法使用计算方法直接从数据中“学习”信息,而不依赖于预定方程模型。当可用于学习的样本数量增加时,这些算法可自适应提高性能。

 

机器学习的工作原理:

机器学习采用两种类型的技术:监督式学习和无监督学习。监督式学习根据已知的输入和输出训练模型,让模型能够预测未来输出;无监督学习从输入数据中找出隐藏模式或内在结构。

监督式学习:

监督式机器学习旨在构建能够根据存在不确定性的证据做出预测的模型。监督式学习算法接受已知的输入数据集和对数据的已知响应(输出),然后训练模型 ,让模型能够为新输入数据的响应生成合理的预测。

监督式学习采用分类和回归技术开发预测模型。

    分类技术可预测离散的响应——例如,电子邮件是真正邮件还是垃圾邮件,肿瘤是恶性还是良性的。分类模型可将输入数据划分成不同类别。典型的应用包括医学成像、语音识别和信用评估。

    回归技术可预测连续的响应——例如,电力需求中温度或波动的变化。典型的应用包括电力系统符合预测和算法交易。

无监督学习:

    无监督学习可发现数据中隐藏的模式或内在结构。这种技术可根据包含未标记响应的输入数据的数据集执行推理。

    聚类是一种最常用的无监督学习技术。这种技术科通过探索性数据分析发现数据中隐藏的模式或分组。聚类的应用包括基因序列分析、市场调查和对象识别。

如何确定使用哪种算法?

    监督式和无监督机器学习算法共有几十种,每种算法又包含不同的学习方法,因此没有最佳的选取方法,只能通过试错,不断地筛选,直至得到最佳的算法。但算法的选择一定程度上取决于你所要处理数据的大小和类型。

什么样情况下使用机器学习?

    当你遇到涉及大量数据和许多变量的复杂任务或问题,但没有现成的处理公式或方程时,可以考虑使用机器学习。如:

(1)手写规则和方程式太过复杂——例如人脸识别、虹膜识别和语音识别

(2)任务的规则始终在变化——例如事务处理记录的欺诈检测。

(3)数据本身在不断变化,程序也必须适应这种变化——例如自动交易、能量需求和购物趋势预测等

 

2018-08-20 11:20:47 lilong_csdn 阅读数 413
  • 机器学习-决策树视频教学

    机器学习算法系列课程,决策树视频教程,通过具体案例详细讲解机器学习算法-决策树。简单通俗的介绍常见的机器学习算法,具体内容包括认识决策树、熵、Python验证算法等。并且用python验证。

    1429 人正在学习 去看看 刘湘宇

先说点废话
最近入职之后一直在做一些机器学习相关的东西,通过一段时间的磨练也算是学到了不少东西(这里强烈推荐吴恩达老师的机器学习、深度学习的视频,对于初学者来说真的非常友好),所以打算开始写一个机器学习系列的博客,包括各种算法、损失函数、优化器等等,算是对自己最近学习的一些总结,同时也希望能够给大家带来一些帮助。这篇主要是做一下机器学习的简单介绍,后续的博客会慢慢深入的讲,如果有什么错误的话希望大佬们不吝赐教。就不多说废话了,上干货!
什么是机器学习
百度百科上机器学习的概念说的很吓人,其实他的概念很简单。下面我用我们更容易理解的方式来聊一聊。
我们知道现在比较常见的就是使用机器学习算法来进行预测。现在有一个函数y=f(x),这个函数其实就一个机器学习算法,在这个算法中,每个x值都有与之对应的一个y值,当我们在做预测的时候,通过给出的x值就可以预测出他的y值。
那么算法的学习过程在哪里呢?在一开始的时候,我们会给x指定了一些初始的参数,这些初始的参数基本上是不满足条件的,学习的过程就是在不断的调整参数,使它慢慢接近那个正确的参数。至于它是如何调整参数至接近正确的参数,这个我们以后再聊,现在只是简单介绍一下。
一个小例子
我们先做一些模拟数据:
这里写图片描述
我做的这些数据大致满足y=3x,一共有50个数据点,在最开始的时候初始的参数可能是0.1,y=0.1x显然是不能模拟这些数据的,学习的过程就是在不断的调整参数至不断接近3的过程,当拟合的差不多的时候,我们就有了一个比较好的模型,假如现在有一个新的x=20,我们可以大致猜测出这个x对应的y值为60,这个就是机器学习的一个大概的过程。我把拟合的直线和散点图放在一起大家可以看一下:
这里写图片描述
代码

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

x = np.linspace(0,10,num=50)
noise = np.random.uniform(-1,1,size=50)
y = 3 * x + noise
y1 = 3 * x
plt.figure(figsize=(5,5))
plt.scatter(x,y)
plt.plot(x, y1, color="r")
plt.show()
2015-02-02 20:06:17 E_pen 阅读数 1611
  • 机器学习-决策树视频教学

    机器学习算法系列课程,决策树视频教程,通过具体案例详细讲解机器学习算法-决策树。简单通俗的介绍常见的机器学习算法,具体内容包括认识决策树、熵、Python验证算法等。并且用python验证。

    1429 人正在学习 去看看 刘湘宇

斯坦福大学机器学习公开课---1. 机器学习简单介绍

1.1  介绍

机器学习流行原因---

1)      由人工智能AI发展来的一个领域

2)      是计算机需要开发的一项新的能力,涉及工业和基础学科中的很多内容。

应用学习算法,如设计自主机器人,计算生物学和其他被机器学习影响的领域。

1.2  机器学习应用

1)        数据挖掘

网站点击流数据、电子医疗记录、计算生物学和工程学。

2)        无法手动进行编程的领域

自动直升机、手写体识别、自然语言处理NLP和计算机视觉。

3)        自我定制程序

Amazon, Netflix(网飞公司)的产品推送。

4)        理解人类的学习(大脑,real AI

1.3 机器学习定义

Machine Learning definition

1)      Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.(曾经编写过跳棋程序)

2)      Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said tolearn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.

2  Machine learning

2.1  Machine learning algorithms:机器学习算法分类

Supervised learning 监督学习

Unsupervised learning 非监督学习

Others: Reinforcement learning增强学习, recommender systems推荐系统.

2.2  Introduction to Supervised Learning监督学习介绍

Supervised Learning :“right answers” given.

给算法一个数据集,并给定每个样本“正确的答案”(标记,正样本和负样本)

l RegressionPredict continuous valued output (price).回归问题,用来预测连续性输出值。

l ClassificationDiscrete valued output (0 or 1)

2.3  Introduction to Unsupervised Learning非监督学习介绍

Unsupervised Learning : “right answers”  are not given.没有标记正负样本之分。

无监督学习(聚类算法):给定一个训练数据集,从中找到某种结构,即将数据集分为几个聚类。(让算法自己从数据中发现一切)

Cocktail party problem algorithm:[W,s,v] =svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

2020-01-09 22:01:52 qq_39893088 阅读数 683
  • 机器学习-决策树视频教学

    机器学习算法系列课程,决策树视频教程,通过具体案例详细讲解机器学习算法-决策树。简单通俗的介绍常见的机器学习算法,具体内容包括认识决策树、熵、Python验证算法等。并且用python验证。

    1429 人正在学习 去看看 刘湘宇

机器学习介绍

机器学习在我个人看来就是运用相关的算法,对某件事一次又一次地重复,直到达到自己想要的目标

机器学习的分类

学习策略的分类标准就是根据学生实现信息转换所需的推理多少和难易程度来分类的,依从简单到复杂,从少到多的次序分为以下六种基本类型:

  1. 机械学习(Rote learning)
    学习者无需任何推理或其它的知识转换,直接吸取环境所提供的信息。如塞缪尔的跳棋程序,纽厄尔和西蒙的LT系统。这类学习系统主要考虑的是如何索引存贮的知识并加以利用。系统的学习方法是直接通过事先编好、构造好的程序来学习,学习者不作任何工作,或者是通过直接接收既定的事实和数据进行学习,对输入信息不作任何的推理。
  2. 示教学习(Learning from instruction或Learning by being told)
    学生从环境(教师或其它信息源如教科书等)获取信息,把知识转换成内部可使用的表示形式,并将新的知识和原有知识有机地结合为一体。所以要求学生有一定程度的推理能力,但环境仍要做大量的工作。教师以某种形式提出和组织知识,以使学生拥有的知识可以不断地增加。这种学习方法和人类社会的学校教学方式相似,学习的任务就是建立一个系统,使它能接受教导和建议,并有效地存贮和应用学到的知识。不少专家系统在建立知识库时使用这种方法去实现知识获取。
  3. 演绎学习(Learning by deduction)
    学生所用的推理形式为演绎推理。推理从公理出发,经过逻辑变换推导出结论。这种推理是"保真"变换和特化(specialization)的过程,使学生在推理过程中可以获取有用的知识。这种学习方法包含宏操作(macro-operation)学习、知识编辑和组块(Chunking)技术。演绎推理的逆过程是归纳推理。
  4. 类比学习 (Learning by analogy)
    利用二个不同领域(源域、目标域)中的知识相似性,可以通过类比,从源域的知识(包括相似的特征和其它性质)推导出目标域的相应知识,从而实现学习。类比学习系统可以使一个已有的计算机应用系统转变为适应于新的领域,来完成原先没有设计的相类似的功能。
    类比学习需要比上述三种学习方式更多的推理。它一般要求先从知识源(源域)中检索出可用的知识,再将其转换成新的形式,用到新的状况(目标域)中去。类比学习在人类科学技术发展史上起着重要作用,许多科学发现就是通过类比得到的。
  5. 基于解释的学习(Explanation-based learning, EBL)
    学生根据教师提供的目标概念、该概念的一个例子、领域理论及可操作准则,首先构造一个解释来说明为什该例子满足目标概念,然后将解释推广为目标概念的一个满足可操作准则的充分条件。EBL已被广泛应用于知识库求精和改善系统的性能
  6. 归纳学习(Learning from induction)
    归纳学习是由教师或环境提供某概念的一些实例或反例,让学生通过归纳推理得出该概念的一般描述。这种学习的推理工作量远多于示教学习和演绎学习,因为环境并不提供一般性概念描述(如公理)。从某种程度上说,归纳学习的推理量也比类比学习大,因为没有一个类似的概念可以作为"源概念"加以取用。归纳学习是最基本的,发展也较为成熟的学习方法,在人工智能领域中已经得到广泛的研究和应用。

总结

机器学习最主要的应用领域有:专家系统、认知模拟、规划和问题求解、数据挖掘、网络信息服务、图象识别、故障诊断、自然语言理解、机器人和博弈等领域。
从机器学习的执行部分所反映的任务类型上看,大部分的应用研究领域基本上集中于以下两个范畴:分类和问题求解。
(1)分类任务要求系统依据已知的分类知识对输入的未知模式(该模式的描述)作分析,以确定输入模式的类属。相应的学习目标就是学习用于分类的准则(如分类规则)。
(2)问题求解任务要求对于给定的目标状态,寻找一个将当前状态转换为目标状态的动作序列;机器学习在这一领域的研究工作大部分集中于通过学习来获取能提高问题求解效率的知识(如搜索控制知识,启发式知识等)。

机器学习简单介绍

阅读数 273

初识机器学习

阅读数 150

简单介绍了机器学习

博文 来自: wuduozhi_1997
没有更多推荐了,返回首页