您现在的位置是:首页 > 编程语言学习 > 前端编程语言 > 文章正文 前端编程语言

python中pandas操作apply返回多列的实现

2022-08-09 09:50:28 前端编程语言

简介我们可以用DataFrame的apply函数实现对多列,多行的操作。需要记住的是,参数axis设为1是对列进行操作,参数axis设为0是对行操作。默认是对...

我们可以用DataFrame的apply函数实现对多列,多行的操作。

需要记住的是,参数axis设为1是对列进行操作,参数axis设为0是对行操作。默认是对行操作。

apply 返回多列

  1. # height = [70, 90, 100, 120, 140, 160, 180, 200,220,240, 260] # 长度为 11 
  2. # df.shape   (1000, 11) 
  3. # 对df的每一行的每一个元素操作,然后再返回多列 
  4. #----------返回多列----------------- 
  5. df = df.apply(lambda x: pd.Series([math.atan(i[0]/(i[1])*180/math.pi for i in zip(height, x)]).astype(float), axis=1) 
  6. .rename(columns=dict(zip(list(range(0, 11)), df.columns))) 
  7.  
  8. #df['slope'] = df_10min.apply(lambda x: math.atan(210 / (x['ws_260'] - x['ws_50'] + 1e-7))*180/math.pi, axis=1) 
  9. import pandas as pd 
  10. df_tmp = pd.DataFrame([ 
  11.     {"a":"data1""cnt":100},{"a":"data2""cnt":200}, 
  12. ]) 
  13.  
  14. df_tmp 
  15. a    cnt 
  16. data1    100 
  17. data2    200 

方法一:使用apply 的参数result_type 来处理

  1. def formatrow(row): 
  2.     a = row["a"] + str(row["cnt"]) 
  3.     b = str(row["cnt"]) + row["a"
  4.     return a, b  
  5.   
  6. df_tmp[["fomat1""format2"]] = df_tmp.apply(formatrow, axis=1, result_type="expand"
  7. df_tmp 
  8. a    cnt    fomat1    format2 
  9. data1    100    data1100    100data1 
  10. data2    200    data2200    200data2 


方法一:使用zip打包返回结果来处理

  1. df_tmp["fomat1-1"], df_tmp["format2-2"] = zip(*df_tmp.apply(formatrow, axis=1)) 
  2. df_tmp 
  3. a    cnt    fomat1    format2    fomat1-1    format2-2 
  4. data1    100    data1100    100data1    data1100    100data1 
  5. data2    200    data2200    200data2    data2200    200data2 

生成新列

现在有如下一个DataFrame:

  1. np.random.seed(1) 
  2. df = pd.DataFrame(np.random.randn(4,2), columns=['A''B']) 
  3. df 
  4. >>> 
  5.    AB 
  6. 01.624345-0.611756 
  7. 1-0.528172-1.072969 
  8. 20.865408-2.301539 
  9. 31.744812-0.761207 

对A, B两列操作,生成C列, 其中C是字符串,由A ± B组成。下面看一下结果就明白了。

  1. df['C'] = df.apply(lambda x: '{:.2f}±{:.2f}'.format(x['A'], x['B']), axis=1) 

看一下效果

A B C0 1.624345 -0.611756 1.62±-0.611 -0.528172 -1.072969 -0.53±-1.072 0.865408 -2.301539 0.87±-2.303 1.744812 -0.761207 1.74±-0.76

多行操作举例

同理可以作用在多行上。

# 对第 10 行进行操作,基于第2、3两行
df.loc[10] = df.apply(lambda x: '{:.2f}±{:.2f}'.format(x[2], x[3]) )

看一下实现的效果

A B0 1.624345 -0.6117561 -0.528172 -1.0729692 0.865408 -2.3015393 1.744812 -0.76120710 0.87±1.74 -2.30±-0.76

 

相关文章

站点信息