精华内容
下载资源
问答
  • 填补缺失值

    2020-07-21 18:00:18
    填补缺失值使用0或均值填补缺失值使用随机森林填补缺失值 使用0或均值填补缺失值 #使用均值进行填补 from sklearn.impute import SimpleImputer #引入sklearn中用来填充的类 imp_mean = SimpleImputer(missing_...

    使用0或均值填补缺失值

    #使用均值进行填补
    from sklearn.impute import SimpleImputer	#引入sklearn中用来填充的类
    imp_mean = SimpleImputer(missing_values=np.nan, strategy='mean')	#填充的类也需要实例化
    #用法和DecissionTreeClassifier一样,要先实例化,strategy表示填充的方法
    X_missing_mean = imp_mean.fit_transform(X_missing) #将缺失的dataframe传入实例化填充模型中
    #去,X_missing_mean表示填充后的dataframe
    
    
    #使用0进行填补
    imp_0 = SimpleImputer(missing_values=np.nan, strategy="constant",fill_value=0)	
    #constant表示用常数进行填充,fill_value表示填充的常数值
    X_missing_0 = imp_0.fit_transform(X_missing)
    

    使用随机森林填补缺失值

    1、遍历所有的特征,从缺失最少的开始进行填补(因为填补缺失最少的特征所需要的准确信息最少)。
    2、填补一个特征时,先将其他特征的缺失值用0代替,每完成一次回归预测,就将预测值放到原本的特征矩阵中,再继续填补下一个特征。
    3、每一次填补完毕,有缺失值的特征会减少一个,所以每次循环后,需要用0来填补的特征就越来越少。
    4、当进行到最后一个特征时(这个特征应该是所有特征中缺失值最多的),已经没有任何的其他特征需要用0来进行填补了,而我们已经使用回归为其他特征填补了大量有效信息,可以用来填补缺失最多的特征。
    5、遍历所有的特征后,数据就完整,不再有缺失值。

    X_missing_reg = X_missing.copy()
    sortindex = np.argsort(X_missing_reg.isnull().sum(axis=0)).values
    for i in sortindex:
        
        #构建我们的新特征矩阵和新标签
        df = X_missing_reg
        fillc = df.iloc[:,i]
        df = pd.concat([df.iloc[:,df.columns != i],pd.DataFrame(y_full)],axis=1)
        
        #在新特征矩阵中,对含有缺失值的列,进行0的填补
        df_0 =SimpleImputer(missing_values=np.nan,
                            strategy='constant',fill_value=0).fit_transform(df)
        
        #找出我们的训练集和测试集
        Ytrain = fillc[fillc.notnull()]
        Ytest = fillc[fillc.isnull()]
        Xtrain = df_0[Ytrain.index,:]
        Xtest = df_0[Ytest.index,:]
        
        #用随机森林回归来填补缺失值
        rfc = RandomForestRegressor(n_estimators=100)
        rfc = rfc.fit(Xtrain, Ytrain)
        Ypredict = rfc.predict(Xtest)
        
        #将填补好的特征返回到我们的原始的特征矩阵中
        X_missing_reg.loc[X_missing_reg.iloc[:,i].isnull(),i] = Ypredict
    
    展开全文
  • bostonfrom sklearn.impute import SimpleImputer #用来填补缺失值的类from sklearn.ensembl...

    导入完整的数据集并探索

    以波士顿数据集为例

    import numpy as np

    import pandas as pd

    import matplotlib.pyplot as plt

    from sklearn.datasets import load_boston

    from sklearn.impute import SimpleImputer #用来填补缺失值的类

    from sklearn.ensemble import RandomForestRegressor

    from sklearn.model_selection import cross_val_score

    dataset = load_boston()

    X_full, Y_full = dataset.data,dataset.target

    n_samples = X_full.shape[0]

    n_features = X_full.shape[1]1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    为完整的数据集放入缺失值

    #首先确定我们希望放入的缺失数据的比例,在这里我们假设是50%,那总共就有506*13/2=3289个数据缺失

    rng = np.random.RandomState(0)

    missing_rate = 0.5

    n_missing_samples = int(np.floor(n_samples * n_features * missing_rate))1

    2

    3

    4

    得到n_missing_samples为3289

    #所有数据要随机遍布在数据集的各行各列当中,而一个缺失的数据会需要一个行索引和一个列索引

    #如果能够创造一个数组,包含3289个分布在0~506中间的行索引,和3289个分布在0~13之间的列索引,那我们就可以利用索引来为数据中的任意3289个位置赋空值

    #然后我们用0,均值和随机森林来填写这些缺失值,然后查看回归的结果如何

    missing_features=rng.randint(0,n_features,n_missing_samples)

    # randint (下限,上限,n)在下限和上限之前取出n个整数(可重复)

    missing_samples=rng.randint(0,n_samples,n_missing_samples)1

    2

    3

    4

    5

    6

    missing_samples = rng.choice(dataset.data.shape[0],n_missing_samples,replace=False)

    我们现在采样了3289个数据,远远超过我们的样本量506,所以我们使用随机抽取的函数randint。但如果我们需要的数据量小于我们的样本量506,那我们可以采用np.random.choice来抽样,choice会随机抽取不重复的随机数, 因此可以帮助我们让数据更加分散,确保数据不会集中在一些行中。

    下一步,我们copy一下未缺失的数据,因为原数据我也想留着嘛。

    X_missing = X_full.copy()

    y_missing = y_full.copy()

    X_missing[missing_samples,missing_features] = np.nan

    X_missing = pd.DataFrame(X_missing)1

    2

    3

    4

    然后让随机选中的位置变为空,转为DataFrame格式

    结果如下

    当然,这组数据有506行,这只是一部分。

    使用均值进行或0填补

    imp_mean = SimpleImputer(missing_values=np.nan, strategy='mean')

    # 第一个参数,是告诉他缺失值是什么样子的。第二个参数,是采用均值填补。

    # 也可以采用中位数,众数等等

    X_missing_mean = imp_mean.fit_transform(X_missing)

    # 训练fit+导出predict >>>> fit_transform1

    2

    3

    4

    5

    填补完毕,我们来查看一下是否填补完全

    X_missing_mean = pd.DataFrame(X_missing_mean)

    X_missing_mean.isnull().sum()1

    2

    将numpy格式的数据转换成DataFrame, 然后用isnull()方法查看是否有空值,因为506行看不完全,所以才有sum(True=1,False=0)来确认。

    之后,我们使用0来进行填补。

    # 使用0进行填补

    imp_0 = SimpleImputer(missing_values=np.nan,strategy="constant",fill_value=0)

    X_missing_0 = imp_0.fit_transform(X_missing)1

    2

    3

    使用随机森林填补缺失值

    使用随机森林回归填补缺失值任何回归都是从特征矩阵中学习,然后求解连续型标签y的过程,之所以能够实现这个过程,是因为回归算法认为,特征矩阵和标签之前存在着某种联系。实际上,标签和特征是可以相互转换的,比如说,在一个“用地区,环境,附近学校数量”预测“房价”的问题中,我们既可以用“地区”,“环境”,“附近学校数量”的数据来预测“房价”,也可以反过来,用“环境”,“附近学校数量”和“房价”来预测“地区”。而回归填补缺失值,正是利用了这种思想。

    X_missing_reg = X_missing.copy() #用回归填补缺失值的特征矩阵

    sortindex = np.argsort(X_missing_reg.isnull().sum(axis=0)).values # axis=0 按列进行加和

    #找出数据集中,缺失值从小到大排列的特征值的顺序

    # argsort和sort的区别是,前者排完之后还有索引1

    2

    3

    4

    argsort 返回的是从小到大排序的顺序所对应的索引

    然后再.values,对应的结果是

    array([ 6, 12, 8, 7, 9, 0, 2, 1, 5, 4, 3, 10, 11], dtype=int64)

    把这个赋值给sortindex

    下面是核心部分

    for i in sortindex:

    # 构建我们的新特征矩阵(没有被选中去填充的特征们+原始的标签)和新标签(被选中去填充的特征)

    df = X_missing_reg

    # 新标签

    fillc = df.iloc[:,i] # 所有的行,第六列

    # 新特征矩阵

    df = pd.concat([df.iloc[:,df.columns != i],pd.DataFrame(y_full)],axis=1) # 所有的行,除了第六列的所有列

    # 在新特征矩阵中,对含有缺失值的列,进行0的填补

    df_0 = SimpleImputer(missing_values=np.nan,strategy='constant',fill_value=0).fit_transform(df)

    # 找出我们的训练集和测试集

    Ytrain = fillc[fillc.notnull()] # 被选中要填充的特征中(现在是我们的标签),存在的哪些值,非空值

    Ytest = fillc[fillc.isnull()] # 是被选中的要填充的特种中(现在是我们的标签),不存在的那些值,空值

    # 我们需要的不是Ytest的值,而是Ytest所带的索引

    Xtrain = df_0[Ytrain.index,:] # 在新特征矩阵上,被选出来的要填充的特征的非空值所对应的记录

    Xtest = df_0[Ytest.index,:] # 新特征矩阵上,被选出来的要填充的特征所对应的空值所对应的记录

    # 用随机森林的回归来填补缺失值

    rfc = RandomForestRegressor(n_estimators = 100)#实例化

    rfc = rfc.fit(Xtrain,Ytrain) # 导入训练集去进行训练

    Ypredict = rfc.predict(Xtest) # 用predict接口将Xtest导入,得到我们的预测结果(回归结果),这个预测结果就是我们要用来填补空值的值

    # 将填补好的特征返回到我们的原始特征矩阵中

    X_missing_reg.loc[X_missing_reg.iloc[:,i].isnull(),i] = Ypredict1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    16

    17

    18

    19

    20

    21

    循环结束后,我们就可以得到填充完毕的特征矩阵(下图为一部分)

    OK,那么未缺失的特征矩阵,用均值填补的缺失矩阵,用0填补的缺失矩阵,用随机森林回归填补的缺失矩阵已经处理完毕,下面我们把他们对比一下。

    X = [X_full, X_missing_mean, X_missing_0, X_missing_reg]

    mse = []

    for x in X:

    estimator = RandomForestRegressor(random_state=0, n_estimators=100) # 实例化

    scores = cross_val_score(estimator,x,y_full,scoring="neg_mean_squared_error",cv=5).mean()

    mse.append(scores * -1) # 负的均方误差1

    2

    3

    4

    5

    6

    7

    8

    一般来说mse越小越好,我们来看一下。

    [*zip(["X_full", "X_missing_mean", "X_missing_0", "X_missing_reg"],mse)]1

    结果如下:

    [(‘X_full’, 21.62860460743544),

    (‘X_missing_mean’, 40.84405476955929),

    (‘X_missing_0’, 49.50657028893417),

    (‘X_missing_reg’, 18.03513126175499)]

    居然打分比原始数据集都高。

    下面我们画个图,更加直观的看一下。

    # 我们画个图看一下,更加直观一点。

    x_lables = ['X_full'

    ,"X_missing_mean"

    ,"X_missing_0"

    ,"X_missing_reg"]

    colors = ["r", "g", "b", "orange"]

    plt.figure(figsize=(12,6)) # 画出画布

    ax = plt.subplot(111) # 添加子图 plt.subplot

    for i in np.arange(len(mse)):

    ax.barh(i,mse[i],color=colors[i],alpha=0.6,align='center') # 画条形图,alpah是条的粗度,align是条放在哪里

    ax.set_title('Imputation Techniques with Boston Data')

    ax.set_xlim(left=np.min(mse)*0.9

    ,right=np.max(mse)*1.1) # 最右边是mse取到1,1倍,最左边是mse取到0.9倍,我们不需要从0开始的刻度

    ax.set_yticks(np.arange(len(mse)))

    ax.set_xlabel('MSE') # x轴的名字

    # ax.invert_yaxis() # 把y上面这个轴命名好,然并卵

    ax.set_yticklabels(x_lables) # 用x_lables里面的这些东西作y的命名

    plt.show()1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    16

    17

    18

    可以看出 随机森林回归得到的分数是最好的(MSE越低,效果越好),

    这可能伴随着过拟合的风险,要加以注意。

    展开全文
  • 利用随机森林填补缺失值介绍利用随机森林填补缺失值 介绍 说到缺失值,我想各位在进行数据分析之前或多或少都是会遇到的。在做有关机器学习的项目的时候,出题人都是会给你一个好几万好几十万的数据,可能会出现很多...

    利用随机森林填补缺失值

    介绍

    说到缺失值,我想各位在进行数据分析之前或多或少都是会遇到的。在做有关机器学习的项目的时候,出题人都是会给你一个好几万好几十万的数据,可能会出现很多的缺失值。填补缺失值的方法其实有很多,利用pandas自带的fillnan,replace方法,使用sklearn.impute的SimpleImputer等都是可以填补的,在这里主要是介绍使用随机森林来进行填补缺失值。

    利用随机森林填补缺失值

    利用随机森林进行填补缺失值的思想:随机森林是进行回归的操作,我们可以把那些包含缺失值的列当作标签,如果是很多列都有缺失值,那么就要按照每一列的缺失值的从小到大来填补(因为这样子的话,正确率会更加高一些,因为缺失值少的那个对特征等的要求更加低一些),然后在将剩下和原本就已经给的标签组成新的特征矩阵(一般情况下,最开始的标签是不会有缺失值的),在这个特征矩阵里面,将缺失值利用numpy,pandas或者sklearn的impleImputer填补为0,因为0对数据的影响比较小。接着就是将取出的那个新的标签列,按照有没有缺失值分为Ytrain和Ytest,同样的道理,按照新标签列有缺失值所在的行的位置,将新的特征矩阵分为Xtrain和Xtest,然后就可以利用RandomForestRegressor()来进行训练和预测,利用predict接口来得到最后的Y,其实在前面的Ytest并没有用处,只是来确定所在的行而已。在这里的predict出来的就是要填补的内容,将它把Ytest覆盖就可以了。如果有缺失值的列很多的话,就可以使用循环,不断的预测就可以了。最后所填补的缺失值的正确率要远比利用0填补,均值填补,中位数填补,最多数填补的高。

    接下要使用的数据可以在链接下载:https://pan.baidu.com/s/1pfGMHUxiAx__FSEnbv-OXg
    提取码:ko12

    import pandas as pd
    data = pd.read_excel(r'datasets.xlsx',sheet_name = 2)#在这里的是xlsx文件,我们要使用pd.read_excel方法
    

    下面的这个就是数据数据的展示

    data.info()
    

    信息如下
    在这里插入图片描述

    data_copy.drop(data_copy.columns[0], axis=1, inplace=True)
    

    在这里的data_copy是data.copy()来的,在这里很明显发现,第一列是object的,而且不需要进行填补,进行删除。

    sindex = np.argsort(data_copy.isnull().sum()).values
    

    上面的这个代码就是对那个进行了从小到大排序,并且是返回的所对应的列号而不是列名,这里的np.argsort就是一个从小到大的排序,不过不同于sort等,这个是返回的是列号,然后使用values得到其中的内容放入sindex中,还要介绍的是,我们都知道在python里面False和True用数字表示分别是0和1,在上面的代码里面就是使用这个特性,得到总和进行排序。
    接下来的代码就是核心所在

    # 进行缺失值的填补,利用随机森林进行填补缺失值
    for i in sindex :
    	if data_copy.iloc[:,i].isnull().values() == 0 :
    		continue
        df = data_copy
        fillc = df.iloc[:, i]
        df = df.iloc[:,df.columns!=df.columns[i]]
    
    #在下面的是使用了0来对特征矩阵中的缺失值的填补,
        df_0 = SimpleImputer(missing_values=np.nan
                            ,strategy="constant"
                            ,fill_value=0
                            ).fit_transform(df)
        Ytrain = fillc[fillc.notnull()]
        Ytest = fillc[fillc.isnull()]
        
        Xtrain = df_0[Ytrain.index,:]
        Xtest = df_0[Ytest.index,:]
        
        rfc = RandomForestRegressor()
        rfc.fit(Xtrain, Ytrain)
        Ypredict = rfc.predict(Xtest)
        
        data_copy.loc[data_copy.iloc[:,i].isnull(),data_copy.columns[i]] = Ypredict
    

    上面就是前面的思想的代码体现,如果看懂了前面的思想的,在这里应该是很好理解的。

    接着可以使用下面的代码来进行查看是否还具有缺失值。

    data_copy.isnull().sum()
    

    运行结果如下

    在这里插入图片描述
    可以看到上面全部都是为0了,所有都填补好了,可以看一下填补之后的数据。
    在这里插入图片描述
    看上去还不错,哈哈,好了这个方法就介绍到这里了,如果有任何问题欢迎批评指教。还有在我分享的文件中还有其它的数据,感兴趣的可以使用这个在对其它的数据进行缺失值填补哦,最后感谢查看我的博客。
    另外一片和这个类似的更加简单的讲述使用的方法的文章
    https://blog.csdn.net/Ayingpan/article/details/115659170

    展开全文
  • R语言填补缺失值

    千次阅读 2020-12-25 21:03:20
    使用R语言填补缺失值 数据处理过程中,往往会存在缺失值,对于缺失值的处理,目前各大统计书提出的方法有剔除,用均数填补,用众数填补,采用其他自变量进行回归,推算缺失值进行填补等。在R语言中如何按要求进行...

    使用R语言填补缺失值

    数据处理过程中,往往会存在缺失值,对于缺失值的处理,目前各大统计书提出的方法有剔除,用均数填补,用众数填补,采用其他自变量进行回归,推算缺失值进行填补等。在R语言中如何按要求进行填补?下面将介绍如何进行缺失值填补的各种方法

    用某特定值替换缺失值

    下面这段代码表示使用0填补缺失值,x是需要填补的数据框的某行或某列,如果是其他值,将0改成需要的值即可。

    FillNA <- function(x){
      x[is.na(x )]<- 0;
      x
    }
    

    使用均值,众数,中位数进行填补

    该过程函数是一样的,只需要将后续填补要用的值进行修正即可。

    library(data.table)
    library(dplyr)
    library(tidyverse)
    
    #data.table
    setDT(data)
    data[,names(data):=lapply(.SD,function(x){x[is.na(x)] <- getmode(x)
    x})]
    
    #dplyr
    data %>% 
        mutate_all(function(x){x[is.na(x)] <- getmode(x)
        x})
    dplyr_if_else      <- function(x) { mutate_all(x, ~if_else(is.na(.), 0, .)) }
    #tidyverse
    df %>% 
        select(Pclass, Sex, SibSp, Embarked) %>%
        map_dfc(~ replace_na(.x, rstatix::get_mode(.x)[1]))
    
    展开全文
  • pandas填补缺失值的方法

    千次阅读 2020-02-17 09:12:50
    pandas填补缺失值的方法 在处理数据的过程中,经常会遇到原数据部分内容的缺失,为了保证我们最终数据统计结果的正确性,通常我们有两种处理方式,第一种就是删除掉这些部分缺失的数据;第二种就是填补这些缺失的...
  • 05.使用随机森林回归填补缺失值.ipynb
  • 回归森林填补缺失值

    2020-08-11 20:38:22
    用随机森林回归填补缺失值 在sklearn中,我们可以使用sklearn.impute.SimpleImputer来轻松地将均 值,中值,或者其他常用的数值填补到数据中, 在这个案例中,我们将使用均值,0,和随机森林回归来填补缺 失值,并...
  • #用随机森林来填补缺失值 x_missing_reg = x_missing.copy() #找出数据集中,缺失值从小到大排列的顺序,并且有了这些特征的索引,填补缺失值一定从小到大开始填补,3.3 sort_index = np.argsort(x_missing_reg.isnull...
  • 随机森林填补缺失值具体讲述 下面利用图片理解随机森林填补缺失值(这个最后的标签是我随意填上去的) 上面的数据前面的7列是特征矩阵,最后的一列是标签。 这个图片中所展示的要进行5次填补(因为有5列有缺失值,...
  • 使用随机森林(回归)填补缺失值(分类同样适用),Python详细代码+实例解释。
  • 文章目录随机森林回归填补缺失值导入需要的库导入数据集 随机森林回归填补缺失值 我们从现实中收集的数据,几乎不可能是完美的,往往都会有一些缺失值,很多人选择的是直接将含有缺失值的样本直接删除,这是一种...
  • 导入完整的数据集并探索 以波士顿数据集为例 import numpy as np import pandas as pd import matplotlib.pyplot as plt ...from sklearn.impute import SimpleImputer #用来填补缺失值的类 from sklearn....
  • 对于数据挖掘的缺失值的处理,应该是在数据预处理阶段应该首先完成的事,缺失值的处理一般情况下有三种方式:(1)删掉缺失值数据(2)不对其进行处理(3)利用插补法对数据进行补充第一种方式是极为不可取的,如果你的...
  • 随机森林填补缺失值

    千次阅读 2019-08-13 18:26:19
    任何回归都是从特征矩阵中学习,然后求解连续型标签y的过程,之所以能够实现这个过程,是因为回归算法认为,特征矩阵和标签之前存在着某种联系。实际上,标签和特征是可以相互转换的,比如...而回归填补缺失值,正是...
  • sklearn中填补缺失值的方法

    千次阅读 2018-03-10 19:15:48
    填补缺失值:sklearn.preprocessing.Imputer(missing_values=’NaN’, strategy=’mean’, axis=0, verbose=0, copy=True) 主要参数说明: missing_values:缺失值,可以为整数或NaN(缺失值numpy.n...
  • 填补缺失值有多种方法,如直接用numpy进行填补,如用该特征的众数,中位数,均值进行填补,sklearn中也有针对缺失值的填补方式。 from sklearn.impute import SimpleImputer #填补缺失值 imp_mean=SimpleImputer()#...
  • 例如,剔除缺失值、简单的均值填充、缺失值多变量填补等方法。接下来使用具体的数据集,结合Python库中的相关函数,介绍如何处理数据中的缺失值。将会介绍如何使用Python发现数据中的缺失值,以及使用一些简单的方法...
  • 1.线性回归法填补缺失值#随机生成一个线性回归数据from sklearn.datasets import make_regressionX,Y=make_regression(n_samples=100, n_features=1,n_targets=1,noise=10.5,random_state=1)import matplotlib....
  • from pprint import pprint from sklearn.ensemble import RandomForestRegressor # ...from sklearn.impute import SimpleImputer # 用来填补缺失值的 import numpy as np import pandas as pd import matplotlib....
  • 文章目录填补缺失值1、导入相关库2、创建数据3、利用Pandas填补数据4、sklearn库填补5、利用模型预测 填补缺失值 1、导入相关库 import pandas as pd import numpy as np from sklearn.impute import ...
  • 【Python实例第4讲】填补缺失值

    千次阅读 2018-09-14 09:22:11
    在这个例子里,我们向大家展示填补缺失值比丢弃它们得到的结果更好。但是请注意,缺失值填补并不总会改善预测结果,所以请使用交叉验证评价。有的时候,丢弃缺失行或使用标记值反而更有效。 一般时候,缺失值可以用...
  • 在波士顿房价数据集上用随机森林回归填补缺失值 一、引入 我们从现实中收集的数据,几乎不可能是完美无缺的,往往都会有一些缺失值。面对缺失值,很多人选择的方式是直接将含有缺失值的样本删除,这是一种有效的...
  • 建议采用缺失值填补技术来解决。在SPSS中,有两个菜单可以完成缺失填补。一个是【转换】菜单下的【替换缺失值】,另一个是【分析】菜单下的【缺失值分析】。前者特点简单易行,后者特点是略专业复杂一些。多数情况下...
  • 帮助自己在做机器学习项目时,面对如何处理缺失值提供思路,而不只是用单一的、非最合适的方法用某个均值或中位数代替缺失值。以下内容也只是源于对以上文章的总结和记忆强化,想先用文章记录在这里。建议大家可以去...
  • 很多特征,对于分析和建模来说意义非凡,但对于实 际收集数据的人却不是如此,因此数据挖掘之中,常常会有重要的字段缺失值很多,但又不能舍弃字段的情况。因 此,数据预处理中非常重要的一项就是处理缺失值。 从...
  • 我们拿到的原始数据通常都是一团糟的,缺失值尤其常见,自己在做论文的时候也常常被缺失数据困扰,所以打算写一些如何用python进行缺失值的处理。首先需要大家注意的是,数据的清理很枯燥,但是很重要,根据IBM的...
  • 对于数据挖掘的缺失值的处理,应该是在数据预处理阶段应该首先完成的事,缺失值的处理一般情况下有三种方式:(1)删掉缺失值数据(2)不对其进行处理(3)利用插补法对数据进行补充第一种方式是极为不可取的,如果你的...
  • 1、缺失查看首先,需要查看缺失值的缺失数量以及比例(#数据使用的kaggle平台上预测房价的数据)import 柱形图可视化import matplotlib.pyplot as plt import pylab as pl fig = plt.figure...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 663
精华内容 265
关键字:

填补缺失值