pd.get_dummies仅将伪值名称保留为伪列名

2024-05-14 03:17:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我正试着做一个pd,让你的假人把它连接回数据帧。它进行得很顺利,但我只想将伪值名称作为伪列名返回。我有一个非常大的框架。有没有办法解决这个问题,而不是重命名列?感谢您的支持

数据帧

Number   Fruit
  One    Apple
  Two    Orange
  Three  Banana
  Four   Lemon

代码

dum = pd.get_dummies(df, columns=['Fruit'])
df = pd.concat([df, dum], axis=1)
df

电流输出

Number   Fruit   Fruit_Apple   Fruit_Orange   Fruit_Banana   Fruit_Lemon
  One    Apple        1             0              0              0
  Two    Orange       0             1              0              0
  Three  Banana       0             0              1              0
  Four   Lemon        0             0              0              1

期望输出

Number   Fruit      Apple         Orange         Banana         Lemon
  One    Apple        1             0              0              0
  Two    Orange       0             1              0              0
  Three  Banana       0             0              1              0
  Four   Lemon        0             0              0              1

Tags: 数据numberappledfonepdlemonbanana
1条回答
网友
1楼 · 发布于 2024-05-14 03:17:57

让我们使用pd.get_假人中的一些参数来消除前缀和前缀分隔符:

dum = pd.get_dummies(df, columns=['Fruit'], prefix='', prefix_sep='')
pd.concat([df, dum], axis=1)

输出:

  Number   Fruit Number  Apple  Banana  Lemon  Orange
0    One   Apple    One      1       0      0       0
1    Two  Orange    Two      0       0      0       1
2  Three  Banana  Three      0       1      0       0
3   Four   Lemon   Four      0       0      1       0

相关问题 更多 >