我有一个熊猫数据框df:
+------+---------+
| team | user |
+------+---------+
| A | elmer |
| A | daffy |
| A | bugs |
| B | dawg |
| A | foghorn |
| B | speedy |
| A | goofy |
| A | marvin |
| B | pepe |
| C | petunia |
| C | porky |
+------+---------
我想找到或编写一个函数来返回一个数据帧,我将使用以下命令在MySQL中返回该数据帧:
SELECT
team,
GROUP_CONCAT(user)
FROM
df
GROUP BY
team
对于以下结果:
+------+---------------------------------------+
| team | group_concat(user) |
+------+---------------------------------------+
| A | elmer,daffy,bugs,foghorn,goofy,marvin |
| B | dawg,speedy,pepe |
| C | petunia,porky |
+------+---------------------------------------+
我可以通过遍历行并添加到字典中来想出令人讨厌的方法,但必须有更好的方法。
如果您想使用
agg
,一个更通用的解决方案是:执行以下操作:
要获取字符串的
Series
,或者获取字符串的
Series
个list
。结果如下:
请注意,一般情况下,对这些类型的
Series
的任何进一步操作都会很慢,并且通常不鼓励。如果有另一种方法可以聚合而不将list
放入Series
中,则应该考虑使用这种方法。相关问题 更多 >
编程相关推荐