精华内容
下载资源
问答
  • pandas多列拼接成一列函数.str.cat()

    千次阅读 2019-08-08 11:26:29
    cat()连接字符串 Series.str.cat(others=None, sep=None, na_rep=None) 参数: others : 列表或复合列表,默认为None,如果为None则连接本身的元素 ...如果为None缺失值被忽略。 返回值: concat : 序列(Series...

    cat()连接字符串
    Series.str.cat(others=None, sep=None, na_rep=None)
    参数:
    others : 列表或复合列表,默认为None,如果为None则连接本身的元素
    sep : 字符串 或者None,默认为None
    na_rep : 字符串或者 None, 默认 None。如果为None缺失值将被忽略。
    返回值:
    concat : 序列(Series)/索引(Index)/字符串(str)

    #如果连接的是两个序列,则会对应
    >>> Series(['a', 'b', 'c']).str.cat(['A', 'B', 'C'], sep=',')
    0    a,A
    1    b,B
    2    c,C
    dtype: object
    #否则则会连接自身序列里的值
    >>> Series(['a', 'b', 'c']).str.cat(sep=',')
    'a,b,c'
    #也可以同时连接复合列表
    >>> Series(['a', 'b']).str.cat([['x', 'y'], ['1', '2']], sep=',')
    0    a,x,1
    1    b,y,2
    dtype: object
    

    原文链接:https://blog.csdn.net/claroja/article/details/64922568

    例一:

    df["location"].str.cat(df["location_road"],sep"-")
    

    二、含有数值列的合并

    str.cat()函数使用的前提是两列的内容都是字符串,如果是数值型的话会报错。

    这个时候就需要先对整数型的列先做一下转换:
    df[“price”]=df[“price”].map(lambda x:str(x))

    df[“price”]=df[“price”].astype(“str”)
    df[“com_name”].str.cat(df[“price”],sep="-")

    三、在某列加上某一特定的字符串

    如果只是想在某一列上的所以字符串都加上一个相同的字符串.
    我们得先建一列:
    df2[“temporary”]=“元”
    然后就可以使用cat()函数进行拼接:
    df2[“price”]=df2[“price”].astype(“str”)
    df2.com_name.str.cat([df2.price,df2.temporary],sep="-")
    或是
    df2[“com_name”].str.cat([df2[“price”],df2[“temporary”]],sep="-")
    这样就可以把多列进行拼接了,需要注意的是多列拼接的时候需要用中括号把多列括起来。

    链接:https://www.jianshu.com/p/c1d99d14603d

    展开全文
  • pandas多列拼接(左右关系)

    千次阅读 2020-04-10 15:12:46
    df['addr2']=df['addr_bd'].str.cat(df['addr_gd'])#用两列拼接结果创建新 df['addr2']=df['addr_bd'].str.cat(df['addr_gd'],sep='|')#拼接结果添加分隔符 df['addr2']=df['addr_bd'].str.cat([df['addr_gd'],df...
    df['addr2']=df['addr_bd'].str.cat(df['addr_gd'])#用两列拼接结果创建新列
    df['addr2']=df['addr_bd'].str.cat(df['addr_gd'],sep='|')#拼接结果添加分隔符
    
    
    #多列时添加中括号变成列表,分隔符会在每一次拼接中添加
    df['addr2']=df['addr_bd'].str.cat([df['addr_gd'],df['addr_ab],df['addr_dv']],sep='|')
    

    参考文章:https://www.jianshu.com/p/c1d99d14603d

    展开全文
  • 将多列这样以时间戳为index的Series数据拼接为整体的DataFrame(只带有一列index) 数据举例: (1)温度数据 2020-03-20 00:00:00 10.911639 2020-03-20 00:30:00 10.561648 2020-03-20 01:00:00 10.410831 2020-03-...

    背景:
    遇到这样的需求:
    将多列这样以时间戳为index的Series数据拼接为整体的DataFrame(只带有一列index)
    数据举例:
    (1)温度数据

    2020-03-20 00:00:00    10.911639
    2020-03-20 00:30:00    10.561648
    2020-03-20 01:00:00    10.410831
    2020-03-20 01:30:00     9.993831
    2020-03-20 02:00:00     9.996133
    2020-03-20 02:30:00     9.807382
    2020-03-20 03:00:00     9.831737
    2020-03-20 03:30:00     9.767458
    2020-03-20 04:00:00     9.789868
    2020-03-20 04:30:00     9.993025
    2020-03-20 05:00:00    10.203707
    2020-03-20 05:30:00    10.460783
    2020-03-20 06:00:00    10.900585
    2020-03-20 06:30:00    11.154725
    2020-03-20 07:00:00    11.765203
    2020-03-20 07:30:00    12.377077
    2020-03-20 08:00:00    13.013389
    2020-03-20 08:30:00    13.685595
    2020-03-20 09:00:00    14.327092
    2020-03-20 09:30:00    14.862767
    2020-03-20 10:00:00    15.264174
    

    (2) 湿度数据

    2020-03-20 00:00:00    30.071777
    2020-03-20 00:30:00    31.718174
    2020-03-20 01:00:00    32.415719
    2020-03-20 01:30:00    33.542252
    2020-03-20 02:00:00    33.725316
    2020-03-20 02:30:00    34.507023
    2020-03-20 03:00:00    34.402693
    2020-03-20 03:30:00    35.050728
    2020-03-20 04:00:00    35.082839
    2020-03-20 04:30:00    34.889389
    2020-03-20 05:00:00    34.481423
    2020-03-20 05:30:00    33.377774
    2020-03-20 06:00:00    31.306436
    2020-03-20 06:30:00    30.868772
    2020-03-20 07:00:00    29.368311
    2020-03-20 07:30:00    27.515762
    2020-03-20 08:00:00    24.488863
    2020-03-20 08:30:00    22.346596
    2020-03-20 09:00:00    19.126895
    2020-03-20 09:30:00    17.111340
    2020-03-20 10:00:00    13.799469
    

    解决的问题就是:保留一列时间戳作index,把剩下多列的Series.values拼接在一起。
    (1)首先,找一组Series作为第一列,比如温度,先将series转换DataFrame:
    self.preData[0]表示Series的温度数据,本文在self.preData列表中存放了5组上面说的Series数据。

     frame = {'Date Time': self.preData[0].index, 'Temperature': self.preData[0].values}
     frame = pd.DataFrame(frame)	# 转换DataFrame
    

    (2)
    将第一列时间戳作为index

    frame['Date Time'] = pd.to_datetime(frame['Date Time'])
    frame.set_index('Date Time', inplace=True)
    

    (3) 按列拼接

    frame['Humidity'] = self.preData[1].values      # 温度列的DataFrame,与其他列的Series拼接
    frame['Wind'] = self.preData[2].values
    frame['WindSpeed'] = self.preData[3].values
    frame['itPower'] = self.preData[4].values
    

    因为列还算少,可直接指定列名。列太多可能要另想办法,希望对您有帮助

    展开全文
  • 例子: import pandas as pd data=[['a','b','c'],['d','e','f'],['a','a','b']] df=pd.DataFrame(data,columns=['f1','f2','f3']) df= f1 f2 f3 ...新增一,值为拼接已有的三数据,可以直接如...

    例子:

    import pandas as pd
    data=[['a','b','c'],['d','e','f'],['a','a','b']]
    df=pd.DataFrame(data,columns=['f1','f2','f3'])
    df=
      f1 f2 f3   
    0  a  b  c  
    1  d  e  f  
    2  a  a  b  
    

    新增一列,值为拼接已有的三列数据,可以直接如下操作:

    df['f4']=df['f1']+df['f2']+df['f3']
    df=
    	f1	f2	f3	f4
    0	a	b	c	abc
    1	d	e	f	def
    2	a	a	b	aab
    

    但是如果列数很多,这么做就很不方便,可以用这种方法:

    df['f4']= [''.join(i) for i in df.values]
    df=
    	f1	f2	f3	f4
    0	a	b	c	abc
    1	d	e	f	def
    2	a	a	b	aab
    

    也可以用逗号去拼接:

    df['f4']= [','.join(i) for i in df.values]
    df=
    	f1	f2	f3	 f4
    0	a	b	c	a,b,c
    1	d	e	f	d,e,f
    2	a	a	b	a,a,b
    
    展开全文
  • pandas基本操作及拼接

    2021-01-04 09:24:49
    统计三、pandas拼接操作 本文参考W3Cschool——“pandas中文教程”,进行归纳学习。附原教程链接,需要自取。 什么是pandaspandas是在numpy的基础上开发的数据处理工具包,提供了快速、灵活的数据结构。 它适用...
  • pandas将N合并成一

    2020-04-14 10:23:09
    拼接报文时,有需要50,合并为1的情况,这些列里有空格值、字母、数值,已经转为字符型了,想其合并。 尝试的代码 ``` aaa = pd.DataFrame() bbb = pd.DataFrame({'一':['''AAA''','''BBB''','''...
  • pandas Series 和 DataFrame拼接总结

    千次阅读 2020-02-16 16:53:37
    pandas Series and DataFrame 拼接: 使用jupyter notebook import numpy as np import pandas as pd def make_df(cols,ind): data={c:[str(c)+str(i) for i in ind]for c in cols} return pd.DataFrame(data,....
  • 如图,手头上有5个xlsx文件,其中“评先得分”中的姓名最多最全,其他表格的姓名包含在“评先得分”中,且这些表格中都只有一个“sheet",要“评先得分”与其他4个表格横向合并,找“姓名”公共进行横向拼接。...
  • Pandas:一列拆分为多列

    千次阅读 2020-05-08 14:11:21
    需要YEAR_UNIT_DEPOSIT_PRO这一的数据按照指定分隔符‘|’拆分为12,并拼接到原始数据中生成新的dataframe。 方法如下: # 数据拆分、拼接 new_names = ['gjj_pro_' + str(x + 1) for x in range(12)] # 为...
  • pandas DataFrame表格()拼接(concat,append,join,merge)

    万次阅读 多人点赞 2019-09-19 10:58:35
    axis设置用于df间行拼接(增加行)或列拼接(增加列)进行内联或外联拼接操作 append() dataframe数据类型的方法,提供了行方向(堆叠行)的拼接操作 join() dataframe数据类型的方法,提供了列方向(拼接列).....
  • 需要YEAR_UNIT_DEPOSIT_PRO这⼀的数据按照指定分隔符‘|’拆分为12,并拼接到 原始数据中⽣成新的dataframe。 ⽅法如下: 数据拆分、拼接 gjj_pro = gjj_pboc['YEAR_UNIT_DEPOSIT_PRO'].str.split('|', ...
  • pandas: dataframe的拼接与合并

    千次阅读 2019-01-15 20:26:59
    python 把几个DataFrame合并成一个DataFrame——merge,append,...pandas provides various facilities for easily combining together Series, DataFrame, and Panel objects with various kinds of set logic for t...
  • Python数据分析pandas之数据拼接与连接 数据拼接处理 ...数据拼接主要是对行(列)名相同的元素进行拼接,行拼接则会使行变,而列不变,而列拼接则是列变,而行固定。 Numpy数组axis=0行拼接 # 1
  • pandas多拼接(merge, join, concat)

    万次阅读 多人点赞 2019-02-25 15:13:34
    python中拼接简要概括(参考张俊红的书《对比excel学python数据分析》),以便自我查阅: merge() 主要用于表横向拼接 concat() 主要用于纵向拼接 1,merge()横向拼接 (一)当能够找到公共(两表中该...
  • pandas数据拼接

    2020-03-22 09:43:18
    pandas数据拼接有可能会用到,比如出现重复数据,需要合并两份数据的交集,并集就是个不错的选择,知识追寻者本着技不压身的态度蛮学习了一下下; 二 数据拼接 在进行学习数据转换之前,先学习一些数拼接相关的...
  • pandas(四)pandas拼接操作

    千次阅读 2018-06-29 20:16:50
    Logout4-pandas_combine Last Checkpoint: 06/14/2018 (unsaved changes)Python 3 Not TrustedFileEditViewInsertCellKernelWidgetsHelpCodeMarkdownRaw NBConvertHeading-pandas拼接操作pandas拼接分为两种...
  • Pandas拼接操作

    2018-08-26 13:00:48
    import numpy as np ...pandas拼接分为两种:级联:pd.concat,pd.append;合并:pd.merge,pd.join ''' '''0回顾numpy的级联 练习:1.生成2个3*3的矩阵,对其分别进行两个维度上的级联 ''' nd = np...
  • pandas数据拼接有可能会用到,比如出现重复数据,需要合并两份数据的交集,并集就是个不错的选择,知识追寻者本着技不压身的态度蛮学习了一下下; 二 数据拼接 在进行学习数据转换之前,先学习一些数拼接相关的...
  • pandas-df拼接

    2021-02-23 23:35:01
    """ import pandas as pd left = pd.DataFrame({ 'id':[1,2,3,4,5], 'a': ['a1', 'a2', 'a3', 'a4', 'a5'], 'b':['b1','b2','b3','b4','b5']}) """ a b id 0 a1 b1 1 1 a2 b2 2 2 a3 b3 3 3 a4 b4 4 4 a5 b5 5 """ ...
  • pandas拼接操作

    2019-08-26 10:27:44
    文章目录1. pandas.concat()函数2....在数据处理过程中会遇到个数据集之间进行拼接的操作,一般针对的是DataFrame类型的数据进行拼接操作。 1. pandas.concat()函数 代码展示 pd.concat(objs, axis=0,...
  • expand=True参数字符串拆分成多列,返回一个数据框。 如果不设定为True的话,则会得到一个Series,如下: 4.df与df2合并 原表格按照列方向删除Name列,然后拼接df2水平连接。 参考引用: PANDAS 数据合并与重塑...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 4,401
精华内容 1,760
关键字:

pandas将多列拼接