将数据帧重新排列堆栈转换为两个值列(对于factorplots)

2024-04-25 10:28:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我一直在尝试重新排列我的数据帧,将其用作factorplot的输入。原始数据如下所示:

  A B C  D
1 0 1 2 "T"
2 1 2 3 "F"
3 2 1 0 "F"
4 1 0 2 "T"
...

我的问题是如何将其重新排列成以下形式:

  col val val2
1  A   0  "T"
1  B   1  "T"
1  C   2  "T"
2  A   1  "F"
...

我试着:

df = DF.cumsum(axis=0).stack().reset_index(name="val")

但是,这只生成一个值列,而不是两个。。谢谢你的支持


Tags: 数据namedf原始数据indexstackcolval
2条回答

考虑您的数据帧df

df = pd.DataFrame([
        [0, 1, 2, 'T'],
        [1, 2, 3, 'F'],
        [2, 1, 3, 'F'],
        [1, 0, 2, 'T'],
    ], [1, 2, 3, 4], list('ABCD'))

enter image description here

解决方案

df.set_index('D', append=True) \
    .rename_axis(['col'], 1) \
    .rename_axis([None, 'val2']) \
    .stack().to_frame('val') \
    .reset_index(['col', 'val2']) \
    [['col', 'val', 'val2']]

enter image description here

我会用融化剂,你想怎么分类都行

pd.melt(df.reset_index(),id_vars=['index','D'], value_vars=['A','B','C']).sort_values(by='index')
Out[40]: 
    index  D variable  value
0       1  T        A      0
4       1  T        B      1
8       1  T        C      2
1       2  F        A      1
5       2  F        B      2
9       2  F        C      3
2       3  F        A      2
6       3  F        B      1
10      3  F        C      0
3       4  T        A      1
7       4  T        B      0
11      4  T        C      2

很明显,你可以随意命名这个列

df.set_index('index').rename(columns={'D': 'col', 'variable': 'val2', 'value': 'val'})

相关问题 更多 >