如何改变数据帧的格式？

MONTH WEEKDAY EVAL 0 1 0 0 400 1 0 1 20 1 1 0 300 1 1 1 20 2 0 0 200 2 0 1 35 2 1 0 450 2 1 1 26

1条回答

网友

1楼 · 发布于 2024-05-26 11:12:33

我认为您需要通过^{}重塑，然后需要一些数据清理：

df = df.set_index(['MONTH','WEEKDAY','EVAL'])['0'].unstack()

#if get ValueError: Index contains duplicate entries, cannot reshape
#if duplicates and necessary aggregate data with mean, sum...
#df = df.groupby(['MONTH','WEEKDAY','EVAL'])['0'].mean().unstack()
#df = df.pivot_table(index=['MONTH','WEEKDAY'], columns='EVAL', values='0', aggfunc='mean')

print (df)
EVAL             0   1
MONTH WEEKDAY         
1     0        400  20
      1        300  20
2     0        200  35
      1        450  26

df = df.sort_index(level=[1,0])
       .reset_index(level=0, drop=True)
       .add_prefix('EVAL_')
       .reset_index()
       .rename_axis(None, axis=1)
print (df)
   WEEKDAY  EVAL_0  EVAL_1
0        0     400      20
1        0     200      35
2        1     300      20
3        1     450      26

带副本的样本：

print (df)
   MONTH  WEEKDAY  EVAL    0
0      1        0     0  400
1      1        0     1   20
2      1        1     0  300
3      1        1     1   20
4      2        0     0  200
5      2        0     1   35
6      2        1     0  450
7      2        1     1   26
8      2        1     1  100 <-duplicate

df = df.groupby(['MONTH','WEEKDAY','EVAL'])['0'].mean().unstack()

df = df.sort_index(level=[1,0])
       .reset_index(level=0, drop=True)
       .add_prefix('EVAL_')
       .reset_index()
       .rename_axis(None, axis=1)
print (df)
   WEEKDAY  EVAL_0  EVAL_1
0        0     400      20
1        0     200      35
2        1     300      20
3        1     450      63 <- value is mean of (100 + 26)/2

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何改变数据帧的格式？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >