我有一些服务器日志数据,显示了用户和项目的交互。我不想知道有多少次用户看了一个项目,只是它发生了。在Pandas中有没有一种方法可以一次聚合两个列来完成这一任务而不需要循环?你知道吗
举个例子:
import pandas as pd
a = pd.DataFrame([['A', 2], ['A', 2], ['A', 3], ['B', 1], ['B', 1], ['B', 1], ['B', 3]], columns=['UserID', 'ItemID'])
print a
# Desired output:
print pd.DataFrame([['A', 2], ['A', 3], ['B', 1], ['B', 3]], columns=['UserID', 'ItemID'])
UserID ItemID
0 A 2
1 A 2
2 A 3
3 B 1
4 B 1
5 B 1
6 B 3
UserID ItemID
0 A 2
1 A 3
2 B 1
3 B 3
怎么样:
相关问题 更多 >
编程相关推荐