我有一个dataframe,它有一个包含多个值的列,用逗号分隔,如下所示:
Country
Australia, Cuba, Argentina
Australia
United States, Canada, United Kingdom, Argentina
我想对每个唯一的值进行计数,类似于value\u counts,如下所示:
^{pr2}$我最简单的方法如下所示,但我怀疑这可以更高效、更整洁地完成。在
from collections import Counter
Counter(pd.DataFrame(data['Country'].str.split(',', expand=True)).values.ravel())
干杯
另一个选择是
split
,然后使用value_counts
我认为,对于pandas版本>;=0.25.0,这是最有效的方法。因为
explode
函数在pandas 0.25.0发布后是有效的。在您可以使用
get_dummies
相关问题 更多 >
编程相关推荐