精华内容
下载资源
问答
  • Pandas 列索引操作.pdf

    2021-08-26 15:19:47
    Pandas 列索引操作.pdf
  • Pandas 列索引操作

    千次阅读 2017-05-23 16:57:01
    import pandas as pd df = pd.DataFrame({"Column A":[1,2,3], "Column B":[3,4,5] }) df Column A Column B 0 1 1 2 2 3 更改列名 更改指定列名
    import pandas as pd
    df = pd.DataFrame({"Column A":[1,2,3],
                        "Column B":[3,4,5]
                        })
    df
    Column AColumn B
    01
    12
    23

    更改列名

    更改指定列名

    df.rename(columns={'Column A':'Column C'}, inplace = True) # 重新命名数据框
    df
    Column CColumn B
    01
    12
    23

    更改所有列名

    df.columns=["Column D","Column E"] # 重新命名数据框
    df
    Column DColumn E
    01
    12
    23

    使用DataFrame.str.方法

    df.columns=df.columns.str.lower() # 可以用str方法来修改columns的值
    df
    column dcolumn e
    01
    12
    23

    更改列顺序

    更改数据框列顺序

    df=df.reindex_axis(["Column E","Column D"],axis=1) #设置数据框的列殊勋
    df
    column ecolumn d
    03
    14
    25

    更改保存列顺序

    df.to_csv("C:/Users/Administrator/Desktop/df.csv",
              columns=["column d","column e"]) # 设置保存文件的列顺序
    Column DColumn E
    01
    12
    23
    展开全文
  • estimator =KMeans(n_clusters=3,init = 'kmeans++') #构造一个聚类数为5的聚类器,初始质心选取方式改为kmeans++ estimator.fit(data1) #聚类 label_pred = estimator...显示列索引 x = df.columns.values.tolist()
    estimator =KMeans(n_clusters=3,init = 'kmeans++')   #构造一个聚类数为5的聚类器,初始质心选取方式改为kmeans++
    estimator.fit(data1)   #聚类
    label_pred = estimator.labels_  #获取聚类标签
    centroids = estimator.cluster_centers_ #获取聚类中心
    print(label_pred)
    #画图,每个类别画出一条线
    for  i in range(len(label_pred)):
        if label_pred[i] == 0:
            x = [i for i in range(len(data1[1]))]
            plt.plot(x, data1[i], 'y')
        elif label_pred[i] == 1:
            x = [i for i in range(len(data1[1]))]
            plt.plot(x, data1[3], 'b')
        else:
            x = [i for i in range(len(data1[1]))]
            plt.plot(x, data1[i], 'r')
    

    显示列索引
    x = df.columns.values.tolist()

    展开全文
  • import time from datetime import datetime from sqlalchemy import create_engine, Column ,Integer,DateTime,...import pandas as pd answerengine=create_engine('mysql+pymysql://***') questionengine...
    import time
    from datetime import datetime
    from sqlalchemy import create_engine, Column ,Integer,DateTime,DECIMAL
    import pandas as pd
    
    
    answerengine=create_engine('mysql+pymysql://***')
    questionengine=create_engine('mysql+pymysql://***')
    
    df = pd.DataFrame({"question_id": [], "is_correct": []})
    
    with answerengine.connect() as conn:
        for i in range(100):
            sql = "select question_id,is_correct from `t_exer_record_{}`".format(str(i))
            df1 = pd.read_sql(sql, conn)
            
            df = pd.concat([df1, df], ignore_index=True, sort=True)
        df = df.pivot_table(index='question_id', aggfunc= "mean").rename(columns={"is_correct":"rate"})
    
    #索引到列转换,列到索引转换
    df["question_id"]=df.index
    #注意区别df.index=range(len(df))
    #这样默认index的名字是“index”而不是ID
    df['id']= list(range(len(df)))
    df['current_time']=[datetime.now()]*len(df)
    df=df.set_index("id")
    “”“
    注意比较:
    qdf=df.groupby("question_id").count().rename(columns={"is_correct":"all_count"})
    # ratedf=df.groupby("question_id").sum().rename(columns={"is_correct":"true_count"})
    # result = pd.concat([qdf, ratedf], axis=1, join='inner')
    # result['rate']=result['true_count']/result['all_count']
    ”“”
    
    #转换列的类型
    df=df.astype({"question_id":"int64"})
    
    #改变列的顺序
    df=df[["question_id","rate","current_time"]]
    
    # 结果保留两位小数,以当前时刻存文件
    format=lambda x:"%.2f"%x
    df["rate"]=df["rate"].map(format)
    df.index.astype("int")
    res=time.strftime('%Y.%m.%d-%H:%M:%S',time.localtime(time.time()))
    name=res+".csv"
    df.to_csv(name)
    
    #结果存到数据库
    with questionengine.connect() as conn:
        df.to_sql("t_question_rate",con=conn,if_exists='replace',index=True)
        print(df.head())
        print("done")
    
    
    
    
    
    最后结果
    
    

     

     

    展开全文
  • pandas索引变成

    千次阅读 2021-02-06 22:24:38
    pandas索引变成,只需要使用reset_index。这样index就会变成一变量出现在元数据表中。 比如原来的数据表是上面这样, 使用reset_index 就变成这样 具体reset_index,还有一些更细的应用,后续随着学习...

    pandas把索引变成列,只需要使用reset_index。这样index就会变成一列变量出现在元数据表中。

    比如原来的数据表是上面这样,

    使用reset_index
    就变成这样

    具体reset_index,还有一些更细的应用,后续随着学习再继续更新吧

    展开全文
  • import pandas as pd file_path="" df=pd.read_csv(file_path,sep=',',header=None) #列转行 pf=df.pivot_table(index=0,columns=1,...cols.insert(0,cols.pop(cols.index('nu'))) #调整列索引的顺序 pf=...
  • Pandas DataFrame索引属性

    千次阅读 2020-07-13 10:44:52
    Pandas DataFrame index and columns attributes allow us to get the rows ... Pandas DataFrame的索引属性允许我们获取行和的标签值。 We can pass the integer-based value, slices, or boolean argument...
  • pandas列索引的用法

    千次阅读 2019-07-23 14:58:02
    1,列索引的基本用法。 df.index 可以获取dateframe的列索引信息 df.index=list(列表) 可以修改列的索引。 2,根据条件,获取列索引行号并转成列表。 3,添加列索引。 set_index(): 对列索引进行设置。 reset_index...
  • pandas小记:pandas索引和选择

    万次阅读 多人点赞 2014-01-08 21:49:08
    索引选择时建议全部使用loc(尤其是修改df原本数据时),原因是最下面说的视图和显示拷贝。 dataframe选择 和Series一样,在DataFrame中的一可以通过字典记法或属性来检索,返回Series: frame2[0]#选择第0...
  • Python pandas 重命名索引名称

    千次阅读 2021-03-16 18:24:56
    重命名名称2.重命名索引3.重置索引 df=pd.DataFrame(np.arange(16).reshape(4,4),columns=["one","two","three","four"],index=['a','b','c','d']) 1.重命名名称 df.rename(columns={"one":"nj","two":"bj"},...
  • 通过列索引名称连续选择多列 通过loc: df.loc[:, 'school':'guardian']
  • 主要介绍了Python学习笔记之pandas索引列、过滤、分组、求和功能,结合实例形式分析了Python针对抓取保存的csv数据使用pandas进行索引列、过滤、分组、求和等操作的相关实现技巧,需要的朋友可以参考下
  • 如下所示: import pandas as pd df = pd.DataFrame([1, 2, 3, 4, 5], index=[10, 52, 24, 158, 112]... 您可能感兴趣的文章:pandas数据清洗,排序,索引设置,数据选取方法pandas实现选取特定索引的行在Python中pandas.D
  • 为什么列索引是小写['a','b','c','d'],数据可以正常读出,大写['A','B','C','D']就都是NAN了呢?
  • Pandas入门(学习笔记二)-Pandas的索引操作Pandas的索引操作索引对象Index1.Series和DataFrame中的索引都是Index对象2.... columns 指定列索引名2. 列索引3. 不连续索引高级索引:标签、位置和...
  • 给出行号和列号,根据行索引和列索引同时定位多行多列: df.loc[ ['hang1','hang2'], ['lie1', 'lie2'] ]
  • 有的时候从data里面锁定了一个值,想看这个值属于哪一。 比如kaggle上有一个数据:ign游戏评分。 index为各种平台,columns为各种游戏类型。 我们想查看‘PlayStation Vita’那种类型评分最低,代码如下: worst_...
  • Pandas DataFrame索引操作

    2019-08-02 16:22:51
    pandas通过查找数据索引
  • 今天小编就为大家分享一篇Pandas索引合并数据集的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • pandas 设置索引

    千次阅读 2020-09-05 16:41:59
    import pandas as pd import numpy as np # 以字典的的格式取创建DataFrane a=pd.DataFrame({ 'a' : range(7), 'b' : range(7, 0, -1), 'c' : ['one', 'one', 'one', 'two', 'two', 'two', '
  • import pandas as pd from pandas import Series,DataFrame 单层索引: s=Series(np.random.randint(0,150,size=6),index=list('abcdef')) 多层索引: Series类型数据: #pd.MultiIndex.from_pro...
  • pandas重建索引

    2019-07-26 21:17:25
    此处针对的是DataFrame对象 对于DataFrame这种二维对象,如果执行reindex方法时只提供一个列表参数,则默认是修改行索引。可以用关键字参数columns指定修改的是列索引: ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 36,901
精华内容 14,760
关键字:

pandas列索引