我在pandas/python中有一个表,我正在执行以下操作:
grouped_data = df_comments_cols['article_id'].groupby(df_comments_cols['user_id'])
现在要计算每个用户的文章数,我执行以下操作:
ct_grouped_data = grouped_data.count()
上面统计每个用户的文章id的数量。然而,有时每个用户有多个相同的文章id(从某种意义上说,一个用户已经与该文章进行了多次交互),我只想计算每个用户的唯一文章id—有没有一种快速的方法来做到这一点?在
提前谢谢。在
我想您可能需要的是
nunique
,您可以像这样调用GroupBy
对象:相关问题 更多 >
编程相关推荐