大熊猫对多级列使用get_dummies()方法

In [1]: df = pd.DataFrame({('A','one'):['a','a','b'], ('A','two'):['b','a','a'], ('B','one'):['b','b','a'], ('B','two'):['a','a','a'], ('C','one'):['b','a','b'], ('C','two'):['a','b','a'],}) df Out[1]: A B C one two one two one two 0 a b b a b a 1 a a b a a b 2 b a a a b a

A B C one_a one_b two one_a one_b two one_a one_b two 0 1 0 b 0 1 a 0 1 a 1 1 0 a 0 1 a 1 0 b 2 0 1 a 1 0 a 0 1 a

In [2]: df.loc[:, (slice(None),'one')] = pd.get_dummies(df.loc[:, (slice(None),'one')]) df Out[2]: A B C one two one two one two 0 NaN b NaN a NaN a 1 NaN a NaN a NaN b 2 NaN a NaN a NaN a

1条回答

网友

1楼 · 发布于 2024-04-18 13:20:00

熊猫赋

pd.get_dummies(df.stack(0).one, prefix='one').stack().unstack(0).T.join(
      df.xs('two', axis=1, level=1, drop_level=False)
).sort_index(1)

      A               B               C          
  one_a one_b two one_a one_b two one_a one_b two
0     1     0   b     0     1   a     0     1   a
1     1     0   a     0     1   a     1     0   b
2     0     1   a     1     0   a     0     1   a

备选方案

def f(d, n, k):
    d = d[n]
    o = d.pop(k)
    return pd.get_dummies(o, prefix=k).join(d)

pd.concat({n: f(d, n, 'one') for n, d in df.groupby(axis=1, level=0)}, axis=1)

      A               B               C          
  one_a one_b two one_a one_b two one_a one_b two
0     1     0   b     0     1   a     0     1   a
1     1     0   a     0     1   a     1     0   b
2     0     1   a     1     0   a     0     1   a

相关问题更多 >

编程相关推荐

热门问题

热门文章