-
2021-11-19 10:34:10
导入包:
from sklearn.preprocessing import MinMaxScaler
定义归一化对象:
scaler = MinMaxScaler(feature_range=(0, 1)) #将数据归一到0到1,可以根据数据特点归一到-1到1
归一化数据:
mydata = scaler.fit_transform(mydata) #归一化
经过计算之后,反归一化
mydata = scaler.inverse_transform(mydata) #反归一化
注意事项:
原始数据归一化之后,然后进行模型计算,将计算结果反归一化时,要保证与原始数据具有相同的列数,并且计算结果的每列数据要与原始数据的列数一一对应。
归一化保存与加载链接:
python 归一化保存与加载_wh来啦的博客-CSDN博客
归一化作用:
忽略数据本身的属性,例如大小,长度。重视数据与数据之间的联系,例如相对长度,相对大小
更多相关内容 -
python归一化
2021-11-19 19:45:58最大最小化 from sklearn import preprocessing import sklearn.datasets # Loading Iris Dataset iris = sklearn.datasets.load_iris() data = iris.data[:, :4]; # Min-Max Normalization min_max_scaler = ...最大最小化
from sklearn import preprocessing import sklearn.datasets # Loading Iris Dataset iris = sklearn.datasets.load_iris() data = iris.data[:, :4]; # Min-Max Normalization min_max_scaler = preprocessing.MinMaxScaler(feature_range=(0.1,0.9)) input_array = min_max_scaler.fit_transform(data);
最值归一化
from sklearn import preprocessing import numpy as np X = np.array([[1., -1., 2.], [2., 0., 0.], [0., 1., -1.]]) min_max_scaler = preprocessing.MinMaxScaler() X_minMax = min_max_scaler.fit_transform(X) print(X_minMax) [[0.5 0. 1. ] [1. 0.5 0.33333333] [0. 1. 0. ]]
标准化
# 归一化 import numpy as np from sklearn.preprocessing import StandardScaler X_train = np.array([[0, 3, 7, 1], [4, 5, 9, 8], [8, 2, 7, 7], [6, 3, 4, 5]]) X_test = np.array([[0, 3, 7, 1], [2, 5, 4, 7]]) sc = StandardScaler() ## 估算训练数据中的mu和sigma sc.fit(X_train) ## 使用训练数据中的mu和sigma对数据进行标准化 X_train_std = sc.transform(X_train) print(X_train_std) X_test_std = sc.transform(X_test) print(X_test_std)
反归一化
from sklearn.preprocessing import MinMaxScaler mm = MinMaxScaler() # 归一化 train_label = mm.fit_transform(train_data) # 反归一化 predict_value = mm.inverse_transform(predict_value) 此外,也可以用 from sklearn.preprocessing import StandardScaler 进行标准化。
更新
-
python数据归一化及三种方法详解
2021-01-20 06:38:51数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的... -
如何基于python实现归一化处理
2020-12-23 04:35:25这篇文章主要介绍了如何基于python实现归一化处理,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 一、定义 归一化方法有两种形式,一种是把数变为(0,1)... -
python实现几种归一化方法(Normalization Method)
2020-09-18 22:51:17主要介绍了python实现几种归一化方法(Normalization Method),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧 -
python opencv-图像数据归一化
2021-01-20 02:15:291.1.定义:归一化把需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。 1.2.优点:归一化使数据有可比性,同时又保持相比较的两个数据之间的相对关系 转换成标准模式,防止仿射变换的影响。 ... -
python 归一化方法
2021-10-20 17:18:171、min-max标准化(Min-Max Normalization) from sklearn import preprocessing import numpy as np X = np.array([[ 1., -1., 2.], [ 2., 0., 0.], [ 0., 1., -1.]]) min_max_scaler = ...这类归一化让1、min-max标准化(Min-Max Normalization)
from sklearn import preprocessingimport numpy as np
X = np.array([[ 1., -1., 2.],
[ 2., 0., 0.], [ 0., 1., -1.]])
min_max_scaler = preprocessing.MinMaxScaler()
X_minMax = min_max_scaler.fit_transform(X)
这类归一化让各列数按照均值归一化到【0,1】区间
2、归一到[-1,1]
from sklearn import preprocessing
import numpy as npx = np.array([[3., -1., 2., 613.],
[2., 0., 0., 232],
[0., 1., -1., 113],
[1., 2., -3., 489]])
max_abs_scaler = preprocessing.MaxAbsScaler()
x_train_maxsbs = max_abs_scaler.fit_transform(x)
x_train_maxsbs
3、标准化(Standardization):
将数据按比例缩放,使之落入一个小的特定区间内,标准化后的数据可正可负,一般绝对值不会太大。
计算时对每个属性/每列分别进行
将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。使用sklearn.preprocessing.scale()函数,可以直接将给定数据进行标准化:
from sklearn import preprocessing
import numpy as np
X = np.array([[ 1., -1., 2.],
… [ 2., 0., 0.],
… [ 0., 1., -1.]])X_scaled = preprocessing.scale(X)
X_scaled
array([[ 0. …, -1.22…, 1.33…],
[ 1.22…, 0. …, -0.26…],
[-1.22…, 1.22…, -1.06…]])#处理后数据的均值和方差
X_scaled.mean(axis=0)
array([ 0., 0., 0.])X_scaled.std(axis=0)
array([ 1., 1., 1.])使用sklearn.preprocessing.StandardScaler类,使用该类的好处在于可以保存训练集中的参数(均值、方差)直接使用其对象转换测试集数据:
scaler = preprocessing.StandardScaler().fit(X)
4、正则化:
正则化的过程是将每个样本缩放到单位范数(每个样本的范数为1),如果后面要使用如二次型(点积)或者其它核方法计算两个样本之间的相似性这个方法会很有用。Normalization主要思想是对每个样本计算其p-范数,然后对该样本中每个元素除以该范数,这样处理的结果是使得每个处理后样本的p-范数(l1-norm,l2-norm)等于1。
p-范数的计算公式:||X||p=(|x1|^p+|x2|^p+...+|xn|^p)^1/p
该方法主要应用于文本分类和聚类中。例如,对于两个TF-IDF向量的l2-norm进行点积,就可以得到这两个向量的余弦相似性。
1、可以使用preprocessing.normalize()函数对指定数据进行转换:
X = [[ 1., -1., 2.],
… [ 2., 0., 0.],
… [ 0., 1., -1.]]X_normalized = preprocessing.normalize(X, norm=‘l2’)
X_normalized
array([[ 0.40…, -0.40…, 0.81…],
[ 1. …, 0. …, 0. …],
[ 0. …, 0.70…, -0.70…]])2、可以使用processing.Normalizer()类实现对训练集和测试集的拟合和转换:
normalizer = preprocessing.Normalizer().fit(X) # fit does nothing
normalizer
Normalizer(copy=True, norm=‘l2’)normalizer.transform(X)
array([[ 0.40…, -0.40…, 0.81…],
[ 1. …, 0. …, 0. …],
[ 0. …, 0.70…, -0.70…]])normalizer.transform([[-1., 1., 0.]])
array([[-0.70…, 0.70…, 0. …]])StandardScaler 与 scale结果是一样是,只是泛化不一样
-
详解python实现数据归一化处理的方式:(0,1)标准化
2020-09-19 01:35:46主要介绍了详解python实现数据归一化处理的方式:(0,1)标准化,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧 -
基于数据归一化以及Python实现方式
2021-01-20 04:19:00数据归一化: 数据的标准化是将数据按比例缩放,使之落入一个小的特定区间,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。 为什么要做归一化: 1)加快梯度下降求最... -
python归一化处理
2020-12-05 09:45:28一、定义归一化方法有两种形式,一种是把数变为(0,1)之间的小数,一种是把有量纲表达式变为无量纲表达式。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速。二、目的不同评价指标往往...一、定义
归一化方法有两种形式,一种是把数变为(0,1)之间的小数,一种是把有量纲表达式变为无量纲表达式。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速。
二、目的
不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。其具体针对的是奇异样本数据,奇异样本数据指的是相对于其他输入样本特别大或特别小的样本矢量,如[0.34,0.51,0.44,222][0.34,0.51,0.44,128]中最后一列元素就是奇异样本数据。
三、常见标准化方法
1.最大-最小标准化映射到区间[0,1]
2.Z-score标准化结果聚集在0附近方差为1
四、矩阵的归一化
矩阵的列归一化,就是将矩阵每一列的值,除以每一列所有元素平方和的绝对值,这样做的结果就是,矩阵每一列元素的平方和为1了。
五、python归一化
其中参数axis=0表示列也是跨行的意思axis=1表示行也是跨列的意思
fromsklearn.preprocessingimportnormalize
data=np.array([
[1000,10,0.5],
[765,5,0.35],
[800,7,0.09],])
data=normalize(data,axis=0,norm='max')
print(data)
>>[[1.1.1.]
[0.7650.50.7]
[0.80.70.18]]
参考:
-
python归一化多维数组的方法
2021-02-04 00:50:20本篇文章给大家分享的内容是python归一化多维数组的方法 ,具有一定的参考价值,有需要的朋友参考一下今天遇到需要归一化多维数组的问题,但是在网上查阅了很多资料都是归一化数组的一行或者一列,对于怎么归一化一... -
python中归一化、标准化模型保存与加载.md
2019-09-04 15:38:07python中归一化、标准化模型保存与加载,python中归一化、标准化模型保存与加载 -
python归一化和反归一化
2019-07-17 21:19:17from sklearn.preprocessing import MinMaxScaler ...# 归一化 train_label = mm.fit_transform(train_data) # 反归一化 predict_value = mm.inverse_transform(predict_value) 此外,也可以用 from sklearn... -
python 归一化保存与加载
2021-11-27 09:44:32导入包 import joblib 归一化模型保存 joblib.dump(scaler,'scaler') 归一化模型加载 ...new_load——scaler = joblib.load('scaler') ...归一化使用链接: ...python 归一化使用_wh来啦的博客-CSDN博客 -
Python 归一化图片数据
2020-06-17 15:25:07x_data = img.astype('f') x_data /= 255 x_data -= 0.5 x_data = x_data.transpose(2, 0, 1) -
python 归一化_Python也能成为毕加索?我用Python给小姐姐画了幅油画
2021-01-13 12:09:04点击上方“菜鸟学Python”,选“星标”公众号重磅干货,第一时间到达小编的舍友最近交了一个女朋友,是念艺术系的,擅长画画!长的好看又漂亮,舍友经常在我耳边吹嘘,女朋友画的油画多么漂亮。哎。。。经常在我面前... -
python 实现对数据集的归一化的方法(0-1之间)
2020-09-20 06:05:55今天小编就为大家分享一篇python 实现对数据集的归一化的方法(0-1之间),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧 -
python归一化函数MinMaxScaler的理解
2021-05-09 14:23:21python归一化函数MinMaxScaler的理解 class sklearn.preprocessing.MinMaxScaler(feature_range=0, 1, *, copy=True) """ from sklearn.preprocessing import MinMaxScaler import numpy as np x = np.array([[1., -... -
python numpy 按行归一化的实例
2020-12-23 17:11:08如下所示: import numpy as np Z=np.random.random((5,... 您可能感兴趣的文章:详解python实现数据归一化处理的方式:(0,1)标准化Python数据预处理之数据规范化(归一化)示例python 实现对数据集的归一化的方法(0- -
Python - 归一化与反归一化
2022-04-21 02:10:52归一化:用于减少不同字段数量级差异造成的影响,或用来平滑数值,可用在x,y 反归一化:一般用来模型预测后的pred y,反归一化回原来的数量级 纯公式推导版本: 归一化 data = [1,2,3,4] def ... -
对python3 一组数值的归一化处理方法详解
2020-12-24 01:25:531、什么是归一化: 归一化就是把一组数(大于1)化为以1为最大值,0为最小值,其余数据按百分比计算的方法。...3、用python 把一个矩阵中每列的数字归一化 import numpy as np def autoNorm(data): -
python 归一化 标准化
2018-07-28 14:44:09所以规划化可以去掉 image=(image+1)/257 这个部分就需要17ms,p100机器上: start=time.time() inp_image = ((inp_image / 255. - self.mean) / self.std).astype(np.float32) images = inp_i... -
Python归一化tif文件
2020-06-25 09:39:50Python归一化tif文件 #!/usr/bin/env python # -*- coding:utf-8 -*- # @Time : 2019/6/25 10:39 # @Author : wangyu # @File : Duo.py # @Software: PyCharm import os import numpy as np from osgeo import ... -
python 归一化
2018-11-14 16:48:42有现成的工具, # 有目标数组x from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler() x= scaler.fit_transform(x) 即可把数组x中的值归一化。