我有一个数据框架,其中包含几个带有数组的列。以下是其中一列的示例:
key arraylist
0 PROJECT-13051 [value1, value2, value4]
1 PROJECT-13050 [value2, value3, value4]
2 PROJECT-13049 [value1, value2, value3]
3 PROJECT-13048 [value3, value4, value5]
4 PROJECT-13047 [value1, value2, value5]
我以逗号分隔的形式从sql数据库中提取这些数据,然后使用以下内容设置为列表:
df[arraylist] = df[arraylist].apply(literal_eval)
我希望按arraylist列分组,并获得数组中每个值的大小:
df.groupby('arraylist').size()
这将导致错误TypeError:unhabable类型:“list”
我希望得到如下输出:
arraylist
value1 3
value2 4
value3 3
value4 3
value5 2
dtype: int64
任何帮助都将不胜感激
尝试使用^{} +^{} :
可选的^{} 用于按OP排序:
或使用^{} 进行正确的自然字母数字排序:
使用的数据帧和导入:
相关问题 更多 >
编程相关推荐