精华内容
下载资源
问答
  • 机器学习 Python scikit-learn 视频教程该教程在 人工智能研究网的优酷自频道:网址是 studyai.com

    #机器学习 Python scikit-learn 视频教程
    #AI社区网址是 studyai.com
    scikit-learn 全新中文文档 https://www.studyai.cn
    这里写图片描述
    这里写图片描述

    展开全文
  • 搭建机器学习Python环境

    千次阅读 2017-03-08 11:11:19
    如果只想做机器学习方面的东西,那么直接安装Anaconda就够了,anaconda相当于机器学习的一个集成IDE吧,安装Anaconda之后,它会在你的电脑上把Python机器学习所需要的包都安装好了,所以了您只需要安装Anaconda就...

    如果只想做机器学习方面的东西,那么直接安装Anaconda就够了,anaconda相当于机器学习的一个集成IDE吧,安装Anaconda之后,它会在你的电脑上把Python和机器学习所需要的包都安装好了,所以了您只需要安装Anaconda就可以。如果您想折腾一下那也可以,需要先装python,再装numpy,再装scipy,顺序也不能乱。


    对于机器学习的学习我们一般将scikit-learn作为学习工具,scikit-learn简称sklearn,它集成了大量机器学习相关的工具开发库。

    具体可以参考官网:http://scikit-learn.org/stable/index.html

    sklearn使用的是Python语言,在安装sklearn之前,我们需要下面准备工作。

    1、安装Python (>= 2.6 or >= 3.3)开发环境
    Python的安装比较简单,直接进入官网https://www.python.org/downloads/,我们就可以进行下载安装了。

    2、安装NumPy (>= 1.6.1),SciPy (>= 0.9)这两个包

    它们两个的安装分别进入官网就可以看到安装步骤了

    http://www.scipy.org/install.html

    另外,需要说明的是,最简单的方法就是使用python的科学计算工具,它集成了Python环境以及支持各种python科学计算开发包,例如NumPy ,SciPy 等等。

    1、Anaconda

    支持Linux, Windows 和 Mac

    2、Enthought Canopy

    支持Linux, Windows 和 Mac

    3、Python(x,y)

    只支持Windows

    4、WinPython

    只支持Windows

    5、Pyzo

    支持Linux, Windows 和 Mac

    安装了上面的工具,就相当于安装了Python、IPython和一些包等等。

    上面对应的都是python的一些科学计算工具,它们的强大之处就在于提供了python可视化环境和科学计算依赖包。主要用于进行一些科研实验,就是matlab的作用一样。

    这里穿插说说Python、IPython、Ipython notebook和Spyder

    • ipython是一个 python 的交互式 shell,比默认的python shell 好用得多,支持变量自动补全,自动缩进,支持 bash shell 命令,内置了许多很有用的功能和函数。
    • IPython Notebook使用浏览器作为界面,向后台的IPython服务器发送请求,并显示结果。在浏览器的界面中使用单元(Cell)保存各种信息。Cell有多种类型,经常使用的有表示格式化文本的Markdown单元和表示代码的Code单元。
    • Spyder是一个简单的python集成开发环境。和其他的Python开发环境相比,它最大的优点就是模仿MATLAB的“工作空间”的功能,可以很方便地观察和修改数组的值。具体可以参考:https://github.com/spyder-ide/spyder

    当上面的准备工作完成之后,我们就可以安装sklearn了

    pip install -U scikit-learn
    • 1
    • 1

    对于python的项目开发有一款强大的集成开发工具PyCharm

    PyCharm是一种Python IDE,带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,比如调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制。此外,该IDE提供了一些高级功能,以用于支持Django框架下的专业Web开发。

    PyCharm具体的安装参考官方网站:
    http://www.jetbrains.com/pycharm/index.html

    在PyCharm里面我们可以直接进行手动的安装scikit-learn以及其他的一些开发包,非常的方便。

    这里写图片描述

    这里写图片描述

    另外可以将上面的科学技术工具和python集成开发工具PyCharm结合一块,进行项目的开发。

    展开全文
  • 首先,选择Mac是因为省事,因为其预装了R和python,我用的是OS X Yosemite 10.10(黑苹果 穷人买不起白苹果就用小y做了个黑苹果T^T)所以学习机器学习实践的两大语言都不用下载安装了,但是python需要配置一下,我的10...
    1. 简介
    2. 安装pip
    3. 安装prot
    4. 安装mlpy等机器学习模块
    5. 安装opencv并配置到python2.7上
    6. 搭建基于eclipse的pydev环境

      1.简介
      首先,选择Mac是因为省事,因为其预装了R和python,我用的是OS X Yosemite 10.10(黑苹果 穷人买不起白苹果就用小y做了个黑苹果T^T)所以学习机器学习实践的两大语言都不用下载安装了,但是python需要配置一下,我的10.10预装的python 2.7.10,科学模块里预装了numpy,需要下载的包有scipy,matplotlib(作图用),mlpy(machine learning py也就是机器学习模块),BeautifulSoup(抓取web‘爬虫’模块),Neurolab(神经网络模块)和cv2,其中cv2是python引入opencv的接口模块,顺利安装如上模块也就能在终端用python写机器学习代码了,但是最后介绍一下我用的eclipse上的pydev开发环境,eclipse上写代码还是挺人性化的,至少自动补全来说还挺给力。
      2.安装pip
      pip是python的一个管理模块用的,用easy_install下载

          `easy_install pip`
      

      3.安装port
      见网盘:http://pan.baidu.com/s/1eQ6j9om
      若版本低于10.10或者网盘被河蟹就百度 macports下载 就行
      4.安装mlpy等机器学习模块
      用第二步的pip安装python模块
      终端输入如下:

    pip install scipy
    pip install beautifulsoup
    pip install neurolab
    pip install mlpy

    5.安装opencv并配置到python2.7上
    第一种方法简单粗暴:

    sudo port install opencv +python27

    第二种方法:
    百度 opencv for mac 和 cmake.dmg 两个文件自行下载,cmake直接安装,opencv下载完解压到用户目录(cd:~的那个目录)然后执行以下代码:

    mkdir release
        cd ./release
        cmake -D CMAKE_BUILD_TYPE=RELEASE -D CMAKE_INSTALL_PREFIX=/usr/local -D BUILD_PYTHON_SUPPORT=ON -D BUILD_EXAMPLES=ON ..
        make
        sudo make install

    然后让python识别到opencv:
    打开一个终端,cd ~
    vim .profile
    添加export PYTHONPATH=/usr/local/lib/python2.7/site-packages/(路径具体根据自己的来,不知道就which python2.7,定位到site-packages文件夹)
    source .profile

    此时终端打开python查看所有包中有没有上述安装的包并导入这些包:

    help('modules')
    import mlpy
    import numpy
    import matplotlib
    import neurolab
    import cv2

    如果缺哪个再自行下载安装

    6.搭建基于eclipse的pydev环境
    1).自行下载一个mac版的eclipse和PyDev压缩包
    2).解压eclipse和pydev压缩包,分别把pydev文件夹中的两个子文件夹plugins和features分别和eclipse文件夹下的子文件夹合并
    3).打开eclipse->偏好设置->PyDev->Interpreter - Python -> new
    Interpreter Name名字随便写
    Interpreter Executable写python路径,不知道的去终端which python2.7,如果本机安装了同一个版本放两个位置,但是各有各的包,那就在下面导入存放包的文件夹即可。
    至此,环境搭建完毕。可以自己新建一个python工程,工程中新建一个.py文件,并向工程文件夹里拖拽两个jpg图片分别重命名为1.jpg和2.jpg就可以测试下面的代码:

    import numpy as np
    import mlpy
    import cv2
    
    print 'hello'
    wenjian2 = '2.jpg'
    wenjian1 = '1.jpg'
    img1 = cv2.imread(wenjian1)
    img2 = cv2.imread(wenjian2)
    chang = min(img1.shape[0],img2.shape[0])
    kuan = min(img1.shape[1],img2.shape[1])
    img3 = np.zeros((chang,kuan,3),np.uint8)
    print u'fixing two jpg (%d x %d)'%(chang,kuan)
    for i in range(chang):
        for j in range(kuan):
            for k in range(3):
                img3[i,j,k] = int(img1[i,j,k]*0.5) + int(img2[i,j,k]*0.5)
            if i%100 == 0:
                print '.',
    cv2.namedWindow(u'img1')
    cv2.imshow(u'img1',img1)
    cv2.namedWindow('img2')
    cv2.imshow('img2',img2)
    cv2.namedWindow('img3')
    cv2.imshow('img3',img3)
    cv2.imwrite('/Users/haoran/Pictures/3.jpg',img3)
    cv2.waitKey()
    cv2.destroyAllWindows()
    

    等大概一分钟后自动弹出三个图片窗口,分别是1.jpg,2.jpg和将1、2图片合成到一个图片的3.jpg并保存到用户图片文件夹中,如果通过则说明以上环境都配好啦。

    展开全文
  • hadoop 机器学习 python什么关系

    千次阅读 2018-07-11 16:17:49
    机器学习是一系列算法。这些算法通常需要大数据,大量的计算 。hadoop是一种使用多台服务器稳定的...python编写的机器学习算法,可以自己用gearman或者是自己建立的分布式计算 系统完成多台PC服务器共同计算 。...
    机器学习是一系列算法。这些算法通常需要大数据,大量的计算 

    hadoop是一种使用多台服务器稳定的进行大规模数据批量处理的软件框架。 其核心是hdfs和map reduce。

    python是一个通用语言,支持广泛,上手容易。当然大数据中的机器学习算法也是很早就可以用pyhon来编写。

    python编写的机器学习算法,可以自己用gearman或者是自己建立的分布式计算 系统完成多台PC服务器共同计算 。 当然也可以通过hadoop的stream接口,将python程序运行在hadoop的框架里。

    这也是一种成功 的商业模式。


    hadoop是容器,机器学习是门学问,python是语言,机器学习相关算法可以用python写,写好后在hadoop搭建的集群上面运行,机器学习统计计算,三折是相辅相成的

    展开全文
  • train_test_split()函数是用来随机划分样本数据为训练集和测试集的,当然也可以人为的切片划分。 优点:随机客观的划分数据,减少人为因素 完整模板: train_X,test_X,train_y,test_y = train_test_split(train_data...
  • 机器学习 Python 库 Top 20

    千次阅读 2017-04-06 00:42:02
    本文会为你介绍 2016 年机器学习 Top 20 Python 开源项目,同时分析得出一些有趣的见解和发展趋势。  KDnuggets 为您带来 Github 上最新的 Python 机器学习开源项目前 20 名。奇怪的是,去年一些非常活跃的项目...
  • Python目前集成了大量的机器学习框架,5个常用机器学习Python库如下: 1、Scikit-Learn Scikit-Learn基于NumPy和SciPy,是专门为机器学习建造的一个Python模块,提供了大量用于数据挖掘和分析的工具,包括数据...
  • 机器学习 python编程库

    千次阅读 2017-07-21 10:23:08
    Pandas 针对数据处理和分析的Python工具包 实现了大量偏于数据读写/清洗/填充和分析的功能 pandas.pydata.org/pandas-docs/stable/ Anaconda平台 ,可以一次性获得多重用于科学和工程计算相关任务的python...
  • 机器学习Python编程环境搭建

    千次阅读 2015-01-06 09:02:11
     使用Python作为机器学习的编程工具,具有很多优点,例如Python语法简洁,表达能力强(简短的几行代码抵得上其它语言数十行),第三方支持库多。”工欲善其事,必先利其器“,在使用 Python 进行机器学习研究之前,...
  • 搭建步骤: 1、下载Python安装包,并安装。...2、在cmd窗口中键入python.exe,Python命令行就会启动,同时可以看到当前Python的版本号等信息。 3、下载NumPy。(https://pypi.python.org/pypi/nump
  • 5个常用的机器学习python

    千次阅读 2019-01-02 18:52:47
    机器学习令人无比神往,但从事这个工作的人可能并不这么想。 机器学习的工作内容往往复杂枯燥又困难——通过大量重复工作进行提升必不可少: 汇总工作流及传输渠道、设置数据源以及在内部部署和云部署的资源之间...
  • 机器学习python库sklearn安装

    千次阅读 2017-06-18 08:22:16
    在安装时需要进行包依赖检查,具体有以下几个要求:Python(>=2.6 or >=3.3) NumPy(>=1.6.1) SciPy(>=0.9) 如果满足上述条件,就能使用pip进行安装了:pip install -U scikit-learn当然,使用pip安装会比较麻烦...
  • 机器学习 python 交叉验证实例

    千次阅读 2017-12-15 20:02:12
    模型选择方法之交叉验证 交叉验证将训练集分为两部分:训练集、验证集。交叉验证的过程是: (1)训练集:用于训练模型; (2)验证集:在使用测试集得出模型误差之前,用验证测试模型的误差; ...
  • 机器学习python算法调参

    千次阅读 2018-01-22 22:17:25
    from pandas import read_csv from sklearn.linear_model import Ridge from sklearn.model_selection import GridSearchCV from scipy.stats import uniform from sklearn.model_selection import RandomizedSearc
  • 机器学习Python实现AdaBoost

    万次阅读 2015-03-18 15:12:57
    下面给出一个python实现的例子: # -*- coding: cp936 -*- ''' Created on Nov 28, 2010 Adaboost is short for Adaptive Boosting @author: Peter ''' from numpy import * def loadSimpData(): datMat = ...
  • Win10下配置机器学习python开发环境

    千次阅读 2019-08-09 20:05:00
    近期计划写一写机器学习微信小程序的开发教程,但微信开发工具只提供了Windows和Mac OS版本,作为一名长期使用Linux系统的开发人员,虽然始终认为Linux系统才...
  • 机器学习python持久化加载模型

    千次阅读 2018-01-22 22:37:45
    from pandas import read_csv from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression from pickle import dump ...#通过pickle序列化和反序列机器
  • 2019年最强大的十大机器学习python

    千次阅读 2019-01-02 12:43:45
    Python是最流行和广泛使用的编程语言之一,已经取代了业界的许多编程语言。以下是Python流行的几个重要原因: Python有大量的库。 Python因其简单易懂而被称为初学者级编程语言。 从开发到部署和维护,Python希望...
  • Windows下各种机器学习python库安装

    千次阅读 2017-06-18 08:09:30
    1、python库下载: 下载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/ 需要下载什么库直接在里面搜索就可以了。 每个库有不同的版本,根据自己电脑的位数及python版本进行下载。如:scipy‑0.19.0‑cp35...
  • 首先我们要了解python机器学习中决策树用来做什么的,然后清楚的知道算法原理,最后才能将决策树算法应用到实际场景当中。 决策树,就是一种把决策节点画成树的辅助决策工具,一种寻找最优方案的画图法。画决策树有...
  • 机器学习python库sciki-learn学习笔记

    千次阅读 2016-10-23 13:57:20
    1.计算分类器精度 1.1  from sklearn.metrics import accuracy_score accuracy_score(pred, label_test) 1.2 clf.score(data_test, label_test)
  • 前言 袁同学学位论文需要,要做一个航空发动机相关的预测模型,了解需求后做了一下测试。 实现最简单的线性回归拟合。 注:`·`后面的都是输出内容,不是代码 ...from sklearn.cross_validation im...
  • (3)采用Pandas导入CSV文件 - 机器学习项目中常用来做数据清洗与数据准备工作。推荐使用。 使用熊猫来导入文件需要使用pandas.read_csv()函数。这个函数的返回值是数据帧,可以很方便地进行下一步的处理。 ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 63,265
精华内容 25,306
关键字:

机器学习python

python 订阅