从如下所示的数据帧开始:
userId | preference
1 | coffee
2 | cake
2 | tea
3 | tea
3 | tea
3 | tea
4 | apple
4 | tea
我需要将上述内容转换为:
userId | preference
2 | cake
2 | tea
4 | apple
4 | tea
注意:用户标识1和用户标识3被删除,因为它们只有一个唯一的首选项。我只希望保留具有2个或更多唯一首选项的用户标识。我一直被困在这个问题上。尝试使用.grouby
,但没有结果
Tags:
获取每个用户标识的唯一值计数,如果大于1,则保留,否则放弃
分组筛选似乎也适用于您的案例
输出:
相关问题 更多 >
编程相关推荐