如何将列名称放入特定条件的数据框单元格中

2024-04-19 09:45:52 发布

您现在位置:Python中文网/ 问答频道 /正文

我有这样一个数据帧:

         ADR     WD      EF    INF    SSI   DI
0        1.0    NaN     NaN    NaN    NaN  NaN
1        NaN    NaN     1      1      NaN  NaN
2        NaN    NaN     NaN    NaN    1    NaN
3        NaN    1       1      1      NaN  NaN
4        NaN    1.0     NaN    NaN    NaN  NaN

我希望结果是这样的:

[["ADR"],["EF","INF"],["SSI"],["WD","EF","INF"],["WD"]]

如您所见,如果列中有1,则该列的名称已被替换。所有的都被放在另一个数组里。你知道吗

我看过这篇文章link,但它没有帮助我,因为名字已经静态地改变了。你知道吗

谢谢:)


Tags: 数据名称静态link数组nan名字inf
3条回答

用途:

df1 = df.stack().reset_index()
df1.columns = ['a','b','c']
df1 = df1[df1['c'] == 1]

a = df1.groupby('a')['b'].apply(list).tolist()
print (a)
[['ADR'], ['EF', 'INF'], ['SSI'], ['WD', 'EF', 'INF'], ['WD']]

选项1 replacestackgroupby

df.replace(1.0, df.columns.to_series()).stack().groupby(level=0).apply(list).tolist()

选项2
apply

df.apply(lambda x: list(x[x.notnull()].index), 1).values.tolist()

两者都产生:

[['ADR'], ['EF', 'INF'], ['SSI'], ['WD', 'EF', 'INF'], ['WD']]

IIUCdot

df.notnull().dot(df.columns+',').str[:-1].str.split(',').tolist()
Out[753]: [['ADR'], ['EF', 'INF'], ['SSI'], ['WD', 'EF', 'INF'], ['WD']]

相关问题 更多 >