精华内容
参与话题
问答
  • sklearn

    千次阅读 2019-04-07 22:45:15
    1、sklearn.datasets.load_*() 获取小规模数据集,数据集包含在datasets里 ex_1: sklearn.datasets.load_iris()返回鸢尾花的数据集 2、sklearn.datasets.fetch_*(data_home=None,subset='train/test/all') 获取大...

    1、sklearn.datasets.load_*()
    获取小规模数据集,数据集包含在datasets里
    ex_1:
    sklearn.datasets.load_iris()返回鸢尾花的数据集
    2、sklearn.datasets.fetch_*(data_home=None,subset='train/test/all')
    获取大规模数据集,需要从网络上下载,传入的函数的第一个参数是data_home,表示数据集下载的目录,默认是~/scikit_learn_data/,第二个参数表示想要的数据集是训练集还是测试集,还是都要
    3、数据集的返回值
    load和fetch返回的是datasets.base.Bunch(继承自字典)
    五个键:
    data:数据集中的特值
    target:数据集中的目标值
    DESCR:数据集的描述
    feature_names:特征的名字
    target_names:目标值代表什么

    	dict["key"] = values
        bunch.key = values
    

    ex_2:

    from sklearn.datasets import load_iris
    
    def datasets_demo():
    
    	'''
    	sklearn数据集的使用
    	'''
    	iris = load_iris()
    	print("鸢尾花数据集:\n", iris)
    
    

    4、数据集划分
    训练数据:用于训练,构建模型
    划分比例:数据集20%~30%
    数据集划分api

    from sklearn.model_selection import train_test_split(arrays, *options)
    

    x 数据集的特征值
    y 数据集的标签值
    test_size 测试集大小,一般为float,默认0.25
    random_state 随机数种子
    return 训练集特征值,测试集特征值,训练集目标值,测试集目标值

    ex_3:

    def datasets_demo():
        iris = load_iris()
        # print("鸢尾花数据集:\n", iris)
        # print("鸢尾花数据集描述:\n", iris["DESCR"])
        print("源数据:", iris.data.shape)
        # 数据集划分
        x_train,x_test,y_train,y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=22)
        print("训练集特征值:", x_train,x_train.shape)
        return None
    
    展开全文
  • Sklearn安装

    千次阅读 2017-11-22 08:42:12
    安装sklearn

    一、Sklearn简介

    Scikit learn 也简称sklearn,是机器学习领域当中最知名的python模块之一。sklearn包含了很多机器学习的方式:

    Classification 分类
    Regression 回归
    Clustering 非监督分类
    Dimensionality reduction 数据降维
    Model Selection 模型选择
    Preprocessing 数据与处理
    使用sklearn可以很方便地让我们实现一个机器学习算法。一个复杂度算法的实现,使用sklearn可能只需要调用几行API即可。所以学习sklearn,可以有效减少我们特定任务的实现周期。

    二、Sklearn安装

    在安装sklearn之前,需要安装两个库,即numpy+mkl和scipy。不要使用pip3直接进行安装,因为pip3默安装的是numpy,而不是numpy+mkl。
    第三方库下载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/

    找到对应python版本的numpy+mkl和scipy,下载安装即可,如图1.1和图1.2所示:


    这里写图片描述
    图1.1


    这里写图片描述
    图1.2

    安装wheel,执行命令:pip install wheel

    这里写图片描述
    图1.3 安装wheel

    安装numpy+mkl,执行命令:pip install numpy-1.13.3+mkl-cp36-cp36m-win_amd64.whl

    这里写图片描述
    图1.4 安装numpy+mkl

    安装scipy,执行命令:pip install scipy-1.0.0-cp36-cp36m-win_amd64.whl

    这里写图片描述
    图1.5 安装scipy

    使用pip安装好这两个whl文件后,使用如下指令安装sklearn:pip install -U scikit-learn

    这里写图片描述
    图1.6 安装sklearn

    展开全文
  • python sklearn PCA 实例-主成分分析

    千次阅读 2019-08-21 11:17:22
    python sklearn decomposition PCA 主成分分析 主成分分析(PCA) 1、主成分分析(Principal Component Analysis,PCA)是最常用的一种降维方法, 通常用于高维数据集的探索与可视化,还可以用作数据压缩和预处理 2、...

    python sklearn decomposition PCA 主成分分析

    主成分分析(PCA)

    1、主成分分析(Principal Component Analysis,PCA)是最常用的一种降维方法,
    通常用于高维数据集的探索与可视化,还可以用作数据压缩和预处理

    2、PCA可以把具有相关性的高维变量合成为线性无关的低维变量,称为主成分。
    主成分能够尽可能保留原始数据的信息

    3、概念
    方差:用来度量一组数据的分散程度
    协方差:用来度量两个变量之间的线性相关性程度,若两个变量的协议差为0,二者线性无关
    协方差矩阵:矩阵的特征向量是描述数据集结构的非零向量,?? ⃗=?? ⃗
    特征向量和特征值:? ⃗ 特征向量,?是特征值

    4、提取:
    矩阵的主成分是其协方差矩阵对应的特征向量,按照对应的特征值大小进行排序,最大的特征值就是第一主成分,其次是第二主成分

    5、原理:
    1、对所有样本进行中心化:xi-(x1+x2…xm)/m
    2、计算样本的协方差矩阵X(X.T)
    3、对协方差矩阵X(X.T)做特征值分解
    4、取最大的d个特征值所对应的特征向量w1,w2…wd
    输出投影矩阵W=(w1,w2,…,wd)

    6、参数说明
    sklearn.decomposition.PCA(n_components=None,copy=True,whithen=False,svd_solver=‘auto’,tol=0.0,
    iterated_power=‘auto’,random_state=None)
    n_components:指定主成分的个数,即降维后数据的维度
    svd_slover:设置特征值分解的方法:‘full’,‘arpack’,‘randomized’

    PCA实现高维度数据可视化 实例
    目标:
    已知鸢尾花数据是4维的,共三类样本,使用PCA实现对鸢尾花数据进行降维,实现在二维平面上的可视化

    实例程序编写

    import matplotlib.pyplot as plt
    import sklearn.decomposition as dp
    from sklearn.datasets.base import load_iris
    
    x,y=load_iris(return_X_y=True) #加载数据,x表示数据集中的属性数据,y表示数据标签
    pca=dp.PCA(n_components=2) #加载pca算法,设置降维后主成分数目为2
    reduced_x=pca.fit_transform(x) #对原始数据进行降维,保存在reduced_x中
    red_x,red_y=[],[]
    blue_x,blue_y=[],[]
    green_x,green_y=[],[]
    for i in range(len(reduced_x)): #按鸢尾花的类别将降维后的数据点保存在不同的表表中
        if y[i]==0:
            red_x.append(reduced_x[i][0])
            red_y.append(reduced_x[i][1])
        elif y[i]==1:
            blue_x.append(reduced_x[i][0])
            blue_y.append(reduced_x[i][1])
        else:
            green_x.append(reduced_x[i][0])
            green_y.append(reduced_x[i][1])
    plt.scatter(red_x,red_y,c='r',marker='x')
    plt.scatter(blue_x,blue_y,c='b',marker='D')
    plt.scatter(green_x,green_y,c='g',marker='.')
    plt.show()
    
    展开全文
  • python安装sklearn模块

    万次阅读 多人点赞 2018-03-16 16:56:06
    转载自:http://blog.csdn.net/qq_21904665/article/details/52681176 第一步:更新pip python -m pip install –upgrade pip 第二步:安装 scipy 在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ ... ...

    转载自:http://blog.csdn.net/qq_21904665/article/details/52681176

    这里写图片描述

    可直接用这行命令!:

     pip install -U scikit-learn
    

    其他命令:

    (1)更新pip

    python -m pip install --upgrade pip
    

    (2)安装 scipy

    在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 中找到你需要的版本scipy

    例如windows 64 位 Python2.7 对应下载:scipy-0.18.0-cp27-cp27m-win_amd64.whl

    cd 下载scipy 目录下,安装

    pip install scipy-0.18.0-cp27-cp27m-win_amd64.whl
    

    (3)安装 matplotlib

    pip install matplotlib
    

    (4)安装numpy+mkl

    在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本

    然后 cd 到numpy+mkl所在的目录下,安装

    pip install  numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl
    
     pip install -U scikit-learn
    
    展开全文
  • (1)from sklearn.cross_validation import train_test_split (2)from sklearn.model_selection import cross_val_score from sklearn.model_selection import train_test_split 通常我们会使用方法(1)的...
  • sklearn 安装

    千次阅读 2017-01-11 21:19:53
    sklearn windows下pip安装会缺少部分包,下载源码编译也会出错,因为VS2008没有安装,电脑实在不堪负荷,只要使用Centos系统编译sklearn,OK,搞定!觉得使用神经网络果断还是Theano更好用
  • Sklearn SVR模型实践

    2019-10-28 14:27:01
    线性回归模型: 流程: 读取数据,划分训练测试数据集,生成模型实例(SVR),预测,计算其loss值。 训练数据集拟合data与label之间的关系。...# from sklearn.preprocessing import Standar...
  • Sklearn-train_test_split随机划分训练集和测试集

    万次阅读 多人点赞 2017-02-05 15:06:15
    sklearn.model_selection.train_test_split随机划分训练集和测试集 官网文档:...
  • sklearn.svm.SVC 参数说明 经常用到sklearn中的SVC函数,这里把文档中的参数翻译了一些,以备不时之需。 本身这个函数也是基于libsvm实现的,所以在参数设置上有很多相似的地方。(PS: libsvm中的二次规划问题的...
  • Python之Sklearn使用教程

    万次阅读 多人点赞 2018-04-15 19:49:27
    1.Sklearn简介 Scikit-learn(sklearn)是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装,包括回归(Regression)、降维(Dimensionality Reduction)、分类(Classfication)、聚类(Clustering)等方法。当...
  • sklearn安装

    千次阅读 2019-02-28 19:48:16
    为了简单起见,直接用的Anaconda,因为Anaconda 里面已经集成了你想要的各种机器学习库,比如:numpy,scipy,pandas等,而且学习机器学习用jupyter notebook挺方便的,关于Anaconda安装,我有之前有写到:...
  • sklearn KNeighborsRegressor

    千次阅读 2018-12-29 18:24:54
    import pandas as pd import numpy as np import matplotlib.pyplot...from sklearn.neighbors import KNeighborsRegressor df = pd.read_csv("data/cs-training.csv") 将名字都改为 snake_case def ca...
  • 只要import sklearn包就报错,是不是我没装好这个包啊。 求大神帮助,这个问题遇到好几次了,真的没办法。。。 ``` Traceback (most recent call last): File "E:/MyPython/Code/Neural_network/My_neural_network...
  • ImportError: cannot import name 'Imputer' from 'sklearn.preprocessing' (E:\python\lib\site-packages\sklearn\preprocessing\__init__.py) ``` 利用dir()查看包内的函数,发现没有Imputer: ``` >>> dir...
  • anaconda升级sklearn版本

    万次阅读 2017-09-05 21:18:15
    调用sklearn的model_selection时,发现sklearn中没有model_selection的模块。经过检查,发现anaconda中的sklearn版本太低,为0.17版本。于是,开始了sklearn的升级之旅。1.查看原有版本首先使用conda list命令,查看...
  • 零、前言 一、机器学习概览 二、一个完整的机器学习项目 三、分类 四、训练模型 五、支持向量机 六、决策树 七、集成学习和随机森林 八、降维 十、使用 Keras 搭建人工神经网络 十一、训练深度神经网络 ...
  • >>> from sklearn.sklearn.model_selection import KFold Traceback (most recent call last): File "<pyshell#0>", line 1, in from sklearn.sklearn.model_selection import KFold ModuleNotFoundError: ...
  • sklearn库的学习

    万次阅读 多人点赞 2017-12-24 15:14:43
    sklearn入门,sklearn库结构
  • sklearn SVM使用

    万次阅读 2018-01-17 17:49:12
    sklearn SVM使用
  • 使用sklearn的cross_val_score进行交叉验证

    万次阅读 多人点赞 2018-06-15 18:21:36
    在构建模型时,调参是极为重要的一个步骤,因为只有选择最佳的参数才能构建一个最优的模型。但是应该如何确定参数的值呢?所以这里记录一下选择参数的方法,以便后期复习以及分享。...sklearn 的 cross_val_sc...
  • import sklearn ``` ImportError Traceback (most recent call last) <ipython-input-3-b7c74cbf5af0> in ----> 1 import sklearn D:\PycharmAnaconda\anaconda\lib\site-packages\sklearn\__init__.py in ...
  • sklearn中文文档

    2018-12-19 17:05:34
    scikit-learn(sklearn) 官方文档中文版,scikit-learn中文文档-学习笔记一 sklearn

空空如也

1 2 3 4 5 ... 20
收藏数 40,783
精华内容 16,313
关键字:

sklearn