机器学习 订阅
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径。 展开全文
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径。
信息
外文名
Machine Learning
涉及学科
概率论、统计学、逼近论、线性代数、高等数学
中文名
机器学习
性    质
多领域交叉学科
机器学习定义
机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式, 并将现有内容进行知识结构划分来有效提高学习效率。 [1]  机器学习有下面几种定义:(1) 机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。(2) 机器学习是对能通过经验自动改进的计算机算法的研究。(3) 机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。 [2] 
收起全文
精华内容
参与话题
问答
  • 首先,选择Mac是因为省事,因为其预装了R和python,我用的是OS X Yosemite 10.10(黑苹果 穷人买不起白苹果就用小y做了个黑苹果T^T)所以学习机器学习实践的两大语言都不用下载安装了,但是python需要配置一下,我的10...
    1. 简介
    2. 安装pip
    3. 安装prot
    4. 安装mlpy等机器学习模块
    5. 安装opencv并配置到python2.7上
    6. 搭建基于eclipse的pydev环境

      1.简介
      首先,选择Mac是因为省事,因为其预装了R和python,我用的是OS X Yosemite 10.10(黑苹果 穷人买不起白苹果就用小y做了个黑苹果T^T)所以学习机器学习实践的两大语言都不用下载安装了,但是python需要配置一下,我的10.10预装的python 2.7.10,科学模块里预装了numpy,需要下载的包有scipy,matplotlib(作图用),mlpy(machine learning py也就是机器学习模块),BeautifulSoup(抓取web‘爬虫’模块),Neurolab(神经网络模块)和cv2,其中cv2是python引入opencv的接口模块,顺利安装如上模块也就能在终端用python写机器学习代码了,但是最后介绍一下我用的eclipse上的pydev开发环境,eclipse上写代码还是挺人性化的,至少自动补全来说还挺给力。
      2.安装pip
      pip是python的一个管理模块用的,用easy_install下载

          `easy_install pip`
      

      3.安装port
      见网盘:http://pan.baidu.com/s/1eQ6j9om
      若版本低于10.10或者网盘被河蟹就百度 macports下载 就行
      4.安装mlpy等机器学习模块
      用第二步的pip安装python模块
      终端输入如下:

    pip install scipy
    pip install beautifulsoup
    pip install neurolab
    pip install mlpy

    5.安装opencv并配置到python2.7上
    第一种方法简单粗暴:

    sudo port install opencv +python27

    第二种方法:
    百度 opencv for mac 和 cmake.dmg 两个文件自行下载,cmake直接安装,opencv下载完解压到用户目录(cd:~的那个目录)然后执行以下代码:

    mkdir release
        cd ./release
        cmake -D CMAKE_BUILD_TYPE=RELEASE -D CMAKE_INSTALL_PREFIX=/usr/local -D BUILD_PYTHON_SUPPORT=ON -D BUILD_EXAMPLES=ON ..
        make
        sudo make install

    然后让python识别到opencv:
    打开一个终端,cd ~
    vim .profile
    添加export PYTHONPATH=/usr/local/lib/python2.7/site-packages/(路径具体根据自己的来,不知道就which python2.7,定位到site-packages文件夹)
    source .profile

    此时终端打开python查看所有包中有没有上述安装的包并导入这些包:

    help('modules')
    import mlpy
    import numpy
    import matplotlib
    import neurolab
    import cv2

    如果缺哪个再自行下载安装

    6.搭建基于eclipse的pydev环境
    1).自行下载一个mac版的eclipse和PyDev压缩包
    2).解压eclipse和pydev压缩包,分别把pydev文件夹中的两个子文件夹plugins和features分别和eclipse文件夹下的子文件夹合并
    3).打开eclipse->偏好设置->PyDev->Interpreter - Python -> new
    Interpreter Name名字随便写
    Interpreter Executable写python路径,不知道的去终端which python2.7,如果本机安装了同一个版本放两个位置,但是各有各的包,那就在下面导入存放包的文件夹即可。
    至此,环境搭建完毕。可以自己新建一个python工程,工程中新建一个.py文件,并向工程文件夹里拖拽两个jpg图片分别重命名为1.jpg和2.jpg就可以测试下面的代码:

    import numpy as np
    import mlpy
    import cv2
    
    print 'hello'
    wenjian2 = '2.jpg'
    wenjian1 = '1.jpg'
    img1 = cv2.imread(wenjian1)
    img2 = cv2.imread(wenjian2)
    chang = min(img1.shape[0],img2.shape[0])
    kuan = min(img1.shape[1],img2.shape[1])
    img3 = np.zeros((chang,kuan,3),np.uint8)
    print u'fixing two jpg (%d x %d)'%(chang,kuan)
    for i in range(chang):
        for j in range(kuan):
            for k in range(3):
                img3[i,j,k] = int(img1[i,j,k]*0.5) + int(img2[i,j,k]*0.5)
            if i%100 == 0:
                print '.',
    cv2.namedWindow(u'img1')
    cv2.imshow(u'img1',img1)
    cv2.namedWindow('img2')
    cv2.imshow('img2',img2)
    cv2.namedWindow('img3')
    cv2.imshow('img3',img3)
    cv2.imwrite('/Users/haoran/Pictures/3.jpg',img3)
    cv2.waitKey()
    cv2.destroyAllWindows()
    

    等大概一分钟后自动弹出三个图片窗口,分别是1.jpg,2.jpg和将1、2图片合成到一个图片的3.jpg并保存到用户图片文件夹中,如果通过则说明以上环境都配好啦。

    展开全文
  • 机器学习 python编程库

    千次阅读 2017-07-21 10:23:08
    Numpy 基础编程库 除了提供高级的数学运算机制,还有高效的向量和矩阵运算功能 SciPy基于Numpy 功能更强大 ... 绘图工具包 工作方式和绘图命令和MatLab类似 matplotlib.org/contents.html scikit-learn ...sciki...

    Numpy  基础编程库  除了提供高级的数学运算机制,还有高效的向量和矩阵运算功能

    SciPy基于Numpy 功能更强大

    https://docs.scipy.org/doc/numpy-dev/user/quickstart.html

    绘图工具包   工作方式和绘图命令和MatLab类似

    matplotlib.org/contents.html

    scikit-learn

    scikit-learn.org/stable/user_guide.html

    https://github.com/scikit-learn/scikit-learn

    Pandas 针对数据处理和分析的Python工具包  实现了大量偏于数据读写/清洗/填充和分析的功能

    pandas.pydata.org/pandas-docs/stable/

    Anaconda平台 ,可以一次性获得多重用于科学和工程计算相关任务的python编程库的支持

    www.contunuum.io/documentation

    https://www.continuum.io/downloads

     

    清华大学开源镜像站  https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/

     

     

     

    展开全文
  • 搭建机器学习Python环境

    千次阅读 2017-03-08 11:11:19
    如果只想做机器学习方面的东西,那么直接安装Anaconda就够了,anaconda相当于机器学习的一个集成IDE吧,安装Anaconda之后,它会在你的电脑上把Python机器学习所需要的包都安装好了,所以了您只需要安装Anaconda就...

    如果只想做机器学习方面的东西,那么直接安装Anaconda就够了,anaconda相当于机器学习的一个集成IDE吧,安装Anaconda之后,它会在你的电脑上把Python和机器学习所需要的包都安装好了,所以了您只需要安装Anaconda就可以。如果您想折腾一下那也可以,需要先装python,再装numpy,再装scipy,顺序也不能乱。


    对于机器学习的学习我们一般将scikit-learn作为学习工具,scikit-learn简称sklearn,它集成了大量机器学习相关的工具开发库。

    具体可以参考官网:http://scikit-learn.org/stable/index.html

    sklearn使用的是Python语言,在安装sklearn之前,我们需要下面准备工作。

    1、安装Python (>= 2.6 or >= 3.3)开发环境
    Python的安装比较简单,直接进入官网https://www.python.org/downloads/,我们就可以进行下载安装了。

    2、安装NumPy (>= 1.6.1),SciPy (>= 0.9)这两个包

    它们两个的安装分别进入官网就可以看到安装步骤了

    http://www.scipy.org/install.html

    另外,需要说明的是,最简单的方法就是使用python的科学计算工具,它集成了Python环境以及支持各种python科学计算开发包,例如NumPy ,SciPy 等等。

    1、Anaconda

    支持Linux, Windows 和 Mac

    2、Enthought Canopy

    支持Linux, Windows 和 Mac

    3、Python(x,y)

    只支持Windows

    4、WinPython

    只支持Windows

    5、Pyzo

    支持Linux, Windows 和 Mac

    安装了上面的工具,就相当于安装了Python、IPython和一些包等等。

    上面对应的都是python的一些科学计算工具,它们的强大之处就在于提供了python可视化环境和科学计算依赖包。主要用于进行一些科研实验,就是matlab的作用一样。

    这里穿插说说Python、IPython、Ipython notebook和Spyder

    • ipython是一个 python 的交互式 shell,比默认的python shell 好用得多,支持变量自动补全,自动缩进,支持 bash shell 命令,内置了许多很有用的功能和函数。
    • IPython Notebook使用浏览器作为界面,向后台的IPython服务器发送请求,并显示结果。在浏览器的界面中使用单元(Cell)保存各种信息。Cell有多种类型,经常使用的有表示格式化文本的Markdown单元和表示代码的Code单元。
    • Spyder是一个简单的python集成开发环境。和其他的Python开发环境相比,它最大的优点就是模仿MATLAB的“工作空间”的功能,可以很方便地观察和修改数组的值。具体可以参考:https://github.com/spyder-ide/spyder

    当上面的准备工作完成之后,我们就可以安装sklearn了

    pip install -U scikit-learn
    • 1
    • 1

    对于python的项目开发有一款强大的集成开发工具PyCharm

    PyCharm是一种Python IDE,带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,比如调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制。此外,该IDE提供了一些高级功能,以用于支持Django框架下的专业Web开发。

    PyCharm具体的安装参考官方网站:
    http://www.jetbrains.com/pycharm/index.html

    在PyCharm里面我们可以直接进行手动的安装scikit-learn以及其他的一些开发包,非常的方便。

    这里写图片描述

    这里写图片描述

    另外可以将上面的科学技术工具和python集成开发工具PyCharm结合一块,进行项目的开发。

    展开全文
  • 一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数字那样...

    一,CSV

    逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的的英文逗号或制表符。通常,所有记录都有完全相同的字段序列。通常都是纯文本文件。建议使用WORDPAD或是记事本(注)来开启,再则先另存新档后用EXCEL开启,也是方法之一。

    CSV文件格式的通用标准并不存在,但是在RFC 4180中有基础性的描述。的使用字符编码同样没有被指定,但是7位ASCII是最基本的通用编码。

    • CSV其实就是文本文件,而并不是表格;
    • 的.csv和.xls的区别在于,.xls的只能用Excel中打开,而且,XLS和CSV的编码格式也不一样,简单来说,CSV可以用文本(TXT)打开也可以用EXCLE打开,而XLS只能用擅长打开
    • 最后,如何在CSV与XLS之间抉择呢?这里我们要弄清楚几个问题,CSV只是单纯的文本文件,同样的,也只是单纯的以文本格式存储,CSV无法生成公式,依赖,也无法保存公式,依赖!所以,如果单纯的只是存储文本格式的数据,可以直接选择使用CSV文件,读写方便,易于实现,数据可以表格化展示,这就是优点!

    注意:CSV文件可以通过改变文件后缀名或者通过练成工具强制转换成的的.xls文件,但是要注意乱码问题。


    二,CSV文件读和写

     

    (1)通过标准的Python中的库导入CSV文件

    CSV,用来处理CSV文件。 
    这个类库中的阅读器()函数用来读入CSV文件。当CSV文件被读入后,可以利用这些数据生成一个numpy的数组,用来训练算法模型。

    #!/usr/bin/python3
    
    from csv import reader
    import numpy as np
    filename='pima_data.csv'      #这个文件中所有数据都是数字,并且数据中不包含文件头。
    with open(filename,'rt') as raw_data:
        readers = reader(raw_data, delimiter=',')
        x=list(readers)
        data=np.array(x).astype('float')
        print(data.shape)

     

    (2)采用numpy的导入CSV文件

    可以使用Munpy的loadtxt()函数导入数据。使用这个函数处理的数据没有文件头,并且所有的数据结构都是一样的,也就是说,数据类型都是一样的。

    #!/usr/bin/python3
    
    import numpy as np
    filename='pima_data.csv'
    with open(filename,'rt') as raw_data:
        data=loadtxt(raw_data,delimiter=',')
        print(data.shape)

     

    (3)采用Pandas导入CSV文件 - 机器学习项目中常用来做数据清洗与数据准备工作。推荐使用。

    使用熊猫来导入文件需要使用pandas.read_csv()函数。这个函数的返回值是数据帧,可以很方便地进行下一步的处理。

    #!/usr/bin/python3
    
    from pandas import read_csv
    filename='iris.data.csv'
    names=['separ-length','separ-width','petal-length','petal-width','class']
    dataset=read_csv(filename,names=names)
    print(dataset.shape)

     

     

     

    展开全文
  • 机器学习 python 交叉验证实例

    千次阅读 2017-12-15 20:02:12
    模型选择方法之交叉验证 交叉验证将训练集分为两部分:训练集、验证集。交叉验证的过程是: (1)训练集:用于训练模型; (2)验证集:在使用测试集得出模型误差之前,用验证测试模型的误差; ...
  • hadoop 机器学习 python什么关系

    千次阅读 2018-07-11 16:17:49
    机器学习是一系列算法。这些算法通常需要大数据,大量的计算 。hadoop是一种使用多台服务器稳定的...python编写的机器学习算法,可以自己用gearman或者是自己建立的分布式计算 系统完成多台PC服务器共同计算 。...
  • 机器学习 Python 库 Top 20

    千次阅读 2017-04-06 00:42:02
    本文会为你介绍 2016 年机器学习 Top 20 Python 开源项目,同时分析得出一些有趣的见解和发展趋势。  KDnuggets 为您带来 Github 上最新的 Python 机器学习开源项目前 20 名。奇怪的是,去年一些非常活跃的项目...
  • 机器学习python库sklearn安装

    千次阅读 2017-06-18 08:22:16
    在安装时需要进行包依赖检查,具体有以下几个要求:Python(>=2.6 or >=3.3) NumPy(>=1.6.1) SciPy(>=0.9) 如果满足上述条件,就能使用pip进行安装了:pip install -U scikit-learn当然,使用pip安装会比较麻烦...
  • 机器学习Python编程环境搭建

    千次阅读 2015-01-06 09:02:11
     使用Python作为机器学习的编程工具,具有很多优点,例如Python语法简洁,表达能力强(简短的几行代码抵得上其它语言数十行),第三方支持库多。”工欲善其事,必先利其器“,在使用 Python 进行机器学习研究之前,...
  • 搭建步骤: 1、下载Python安装包,并安装。...2、在cmd窗口中键入python.exe,Python命令行就会启动,同时可以看到当前Python的版本号等信息。 3、下载NumPy。(https://pypi.python.org/pypi/nump
  • 机器学习python库sciki-learn学习笔记

    千次阅读 2016-10-23 13:57:20
    1.计算分类器精度 1.1  from sklearn.metrics import accuracy_score accuracy_score(pred, label_test) 1.2 clf.score(data_test, label_test)
  • 机器学习 Python scikit-learn 视频教程该教程在 人工智能研究网的优酷自频道:网址是 studyai.com
  • 5个常用的机器学习python

    千次阅读 2019-01-02 18:52:47
    机器学习令人无比神往,但从事这个工作的人可能并不这么想。 机器学习的工作内容往往复杂枯燥又困难——通过大量重复工作进行提升必不可少: 汇总工作流及传输渠道、设置数据源以及在内部部署和云部署的资源之间...
  • Windows下各种机器学习python库安装

    千次阅读 2017-06-18 08:09:30
    1、python库下载: 下载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/ 需要下载什么库直接在里面搜索就可以了。 每个库有不同的版本,根据自己电脑的位数及python版本进行下载。如:scipy‑0.19.0‑cp35...
  • Win10下配置机器学习python开发环境

    千次阅读 2019-08-09 20:05:00
    近期计划写一写机器学习微信小程序的开发教程,但微信开发工具只提供了Windows和Mac OS版本,作为一名长期使用Linux系统的开发人员,虽然始终认为Linux系统才...
  • 2017年最受欢迎的十大机器学习Python

    万次阅读 热门讨论 2018-02-21 04:59:25
    但是这次开源库的评选限定在了机器学习的范围内。也许非机器学习库的大牛认为我们有偏见,恳请你们原谅。很希望读者在评论中对本文做出反馈,帮助我们查缺补遗未收录的顶级软件。因此,放轻松,让我们开始吧!1. ...
  • 2019年最强大的十大机器学习python

    千次阅读 2019-01-02 12:43:45
    Python是最流行和广泛使用的编程语言之一,已经取代了业界的许多编程语言。以下是Python流行的几个重要原因: Python有大量的库。 Python因其简单易懂而被称为初学者级编程语言。 从开发到部署和维护,Python希望...
  • train_test_split()函数是用来随机划分样本数据为训练集和测试集的,当然也可以人为的切片划分。 优点:随机客观的划分数据,减少人为因素 完整模板: train_X,test_X,train_y,test_y = train_test_split(train_data...
  • 从零开始学习机器学习视频教程

    万人学习 2017-12-04 22:38:30
    人工智能作为现在最为火热的领域,使得机器学习被越来越多的人所了解。机器学习难学,主要的难度在于算法模型多不好理解,各种各样的工具不知道如何使用,实际项目不知道如何开发。本门课程将系统入门机器学习,课程...
  • Python数据分析与机器学习实战教程,该课程精心挑选真实的数据集为案例,通过python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例。课程以实战为基础,所有课时都结合代码演示...
  • 150讲轻松搞定Python网络爬虫

    万人学习 2019-05-16 15:30:54
    另外如果一台机器不能满足你的需求,我们可以用分布式爬虫让多台机器帮助你快速爬取数据。   从基础爬虫到商业化应用爬虫,本套课程满足您的所有需求! 【课程服务】 ...
  • python安装教程

    万次阅读 多人点赞 2018-06-07 15:15:23
    帮助大家学习的时候少走弯路。希望会对大家有所帮助,欢迎留言提问。PS文章底部是我的python3.7包下载链接,大家可以自行下载。 二、安装环境 本套教程的安装环境是:win7 或者win10系统 Python版本:p...
  • 图解Python 玩转Python 秒懂python

    万次阅读 多人点赞 2019-07-06 21:30:04
    0 Python 解释器: Python数据结构: 2.变量与运算符 3 Python 流程控制 4 Python 文件处理 5 python 输入输出 6 Python 异常 7 Python 函数和模块 8 Python 面相对象: 9 python 多线程 10 Python 标准库...
  • 董付国系列教材《Python程序设计基础》、《Python程序设计(第2版)》、《Python可以这样学》配套视频,讲解Python 3.5.x和3.6.x语法、内置对象用法、选择与循环以及函数设计与使用、lambda表达式用法、字符串与正则...
  • 小波包变换常用于提取非线性信号的特征,常应用于故障诊断领域的故障特征提取。
  • Python 面试100讲(基于Python3.x)

    万人学习 2019-11-15 10:20:42
    本课程搜集了各大互联网公司的Python面试题以及类似的题目。课程体系包括Python语言本身的知识、Python SDK、Web、Python爬虫以及算法等内容。所以的源代码都使用Python3.x编写。Python相关知识包括基本语法、正则...
  • Python入门视频精讲

    万人学习 2018-09-04 12:10:56
    Python入门视频培训课程以通俗易懂的方式讲解Python核心技术,Python基础,Python入门。适合初学者的教程,让你少走弯路! 课程内容包括:1.Python简介和安装 、2.第一个Python程序、PyCharm的使用 、3.Python基础...
  • Python爬虫100例教程导航帖(已完结)

    万次阅读 多人点赞 2019-01-08 23:40:01
    Python爬虫入门教程导航,目标100篇。 本系列博客争取把爬虫入门阶段的所有内容都包含住,需要你有较好的Python基础知识,当然你完全零基础也可以观看本系列博客。 Python爬虫入门教程,加油!
  • 21天通关Python(仅视频课)

    万人学习 2019-05-21 13:58:33
    本页面购买不发书!!!仅为视频课购买!...析和网络爬虫等内容,本课程会从小案例起,至爬虫、数据分析案例终、以Python知识体系作为内在逻辑,以Python案例作为学习方式,最终达到“知行合一”。

空空如也

1 2 3 4 5 ... 20
收藏数 2,971,106
精华内容 1,188,442
关键字:

机器学习