我有这个数据帧:
ID key
0 1 A
1 1 B
2 2 C
3 3 D
4 3 E
5 3 E
我想根据需要创建额外的key
列,以便在存在重复的IDs
时将数据存储在key
列中
这是输出的一个片段:
ID key key2
0 1 A B # Note: ID#1 appeared twice in the dataframe, so the key value "B"
# associated with the duplicate ID will be stored in the new column "key2"
完整输出应如下所示:
ID key key2 key3
0 1 A B NaN
1 2 C NaN NaN
2 3 D E E # The ID#3 has repeated three times. The key of
# of the second repeat "E" will be stored under the "key2" column
# and the third repeat "E" will be stored in the new column "key3"
有什么建议或想法我应该如何处理这个问题吗?你知道吗
谢谢你
可以将^{} 与^{} 一起使用:
查看
groupby
和apply
。它们各自的文档是here和here。您可以unstack
(docs)创建的多索引的额外级别。你知道吗输出
如果希望
ID
作为列,可以调用此数据帧上的reset_index
。你知道吗相关问题 更多 >
编程相关推荐