从多列获取Pandas DataFrame标签索引

2024-04-25 07:44:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在研究如何基于列值获取PandasDataFrame中标签的索引。我有以下DataFrame

d = {'col1': ['label1', 'label2', 'label3'], 
     'col2': ['label2', 'label3', 'label1'], 
     'col3': ['label2', 'label1', 'label3'],
     'col4': ['label3', 'label1', 'label2']}

df = pd.DataFrame(data = d)

格式如下:

     col1    col2    col3    col4
0  label1  label2  label2  label3
1  label2  label3  label1  label1
2  label3  label1  label3  label2

我想把它变成以下形式:

       label1 label2 label3
col1      0      1      2
col2      2      0      1
col3      1      0      2
col4      1      2      0

它告诉原始数据帧df中相应列中每个标签的索引。例如,在col3中,标签1-3的索引分别是1、0和2。你知道吗


Tags: dataframedfdata格式标签col2col3col1
2条回答

^{}^{}^{}一起使用:

df1 = df.stack().reset_index(name='v').pivot('level_1','v','level_0')
print (df1)
  v        label1  label2  label3
level_1                        
col1          0       1       2
col2          2       0       1
col3          1       0       2
col4          1       2       0  

或带有^{}^{}^{}

df1 = df.reset_index().melt('index').pivot('variable','value','index')
print (df1)
 value     label1  label2  label3
variable                        
col1           0       1       2
col2           2       0       1
col3           1       0       2
col4           1       2       0

最后一步是删除索引和列名:

df1.index.name = None
df1.columns.name = None
print (df1)
      label1  label2  label3
col1       0       1       2
col2       2       0       1
col3       1       0       2
col4       1       2       0     

您可以^{}然后^{}

res = pd.DataFrame(df.T.values.argsort(1),
                   columns=np.sort(df.iloc[:, 0].values),
                   index=df.columns)

print(res)

      label1  label2  label3
col1       0       1       2
col2       2       0       1
col3       1       0       2
col4       1       2       0

相关问题 更多 >