我不能对基于列表的数据帧使用groupby

2024-04-20 12:09:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个由三列组成的数据帧df“id”,“nodes\u set”,“description”,其中“nodes\u set”是字符串列表

我试着根据它们的序列值将其分为以下几组:

df_by_nodes_set = df.groupby('nodes_set')
list(df_by_nodes_set)

我认为问题在于我正在尝试将groupby用于列表,但我不确定如何处理这个问题


Tags: 数据字符串iddf列表by序列description
1条回答
网友
1楼 · 发布于 2024-04-20 12:09:37

问题还不清楚,但如果您需要按列表分组,则可以将该列表转换为哈希或简单地连接元素以获得id,如下所示:

df = pd.DataFrame([[i, list(range(i)),'sample ' + str(i)] for i in range(5)] , columns = ["id", "nodes_set", "description"])

nodes_set_key = df['nodes_set'].apply(lambda x: '_'.join(map(str, x)))
df.groupby(nodes_set_key).last()

以下是代码输出:

enter image description here

相关问题 更多 >