如何格式化混乱的数据集?

2024-06-16 09:54:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我的问题的当前格式如下:

其中'HOODNUM', 'HOODNAM', 'ENUM_FSA' , 'Unnamed:1'是列

我的目标是将这些数据格式化如下:

HOODNUM   HOODNAM                     ZipCode
1         West Humber-Clairville .    M9V
1         West Humber-Clairville      M9W

如何使用python解决这个问题

我试过了

df = df.stack()
df = pd.DataFrame(data=df)

结果是:

HOODNUM  HOODNAME                                     
1        West Humber-Clairville      
                                            ENUM_FSA      M9V
                                            Unnamed: 1    M9W

HOODNUMHOODNAME是索引,但它不是我想要的格式

df = df.set_index(['HOODNUM','HOODNAME'])
df = df.stack()
df = pd.DataFrame(data=df)

Tags: dfstack格式enumfsapdwestunnamed