我有以下格式的数据集:
query_phone Day Actor ObjGrp
0 495393475 2017-09-21 Joana din
1 676793475 2017-09-21 marta ver
2 806494953 2017-09-21 joao hav
3 595243631 2017-09-21 mark din
4 444709531 2017-09-25 caty ver
5 447159403 2017-09-25 rodin tug
6 762976443 2017-09-25 rodin tug
7 865853581 2017-09-25 john han
8 441331962 2017-09-25 van ver
9 261331962 2017-09-25 van ver
10 455924196 2017-09-25 david wog
我可以说,数据帧有80000行。你知道吗
我想画出它的分布图。我的意思是画一条线,对于每一个组合,电话,日期,演员和对象告诉我这个实例出现了多少次,这样我就可以知道代表性的行为。你知道吗
有人知道怎么做吗?我找到的所有绘图方式,不仅不接受字符串类型,也不让我选择y轴作为数量。你知道吗
谢谢你
在这个Post中有一个讨论,@DSM展示了如何将给定列中具有相同值的条目连接起来,正如最初的文章作者所建议的:
这是假设您将数据作为数据帧打开。你知道吗
如果你看一看groupby函数documentation,你会发现你可以将这些iten按不止一列进行分组,如果我正确理解了你的问题,它会为你返回一个列表,你可以很容易地看到重复并研究它们的频率。你知道吗
相关问题 更多 >
编程相关推荐