python中按索引绘制字符串数据

2024-04-24 00:51:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我有以下格式的数据集:

             query_phone         Day   Actor      ObjGrp
0              495393475  2017-09-21   Joana      din
1              676793475  2017-09-21   marta      ver
2              806494953  2017-09-21   joao       hav
3              595243631  2017-09-21   mark       din
4              444709531  2017-09-25   caty       ver
5              447159403  2017-09-25   rodin      tug
6              762976443  2017-09-25   rodin      tug
7              865853581  2017-09-25   john       han
8              441331962  2017-09-25   van        ver
9              261331962  2017-09-25   van        ver
10             455924196  2017-09-25   david      wog

我可以说,数据帧有80000行。你知道吗

我想画出它的分布图。我的意思是画一条线,对于每一个组合,电话,日期,演员和对象告诉我这个实例出现了多少次,这样我就可以知道代表性的行为。你知道吗

有人知道怎么做吗?我找到的所有绘图方式,不仅不接受字符串类型,也不让我选择y轴作为数量。你知道吗

谢谢你


Tags: 数据格式phonequeryvanactordayver
1条回答
网友
1楼 · 发布于 2024-04-24 00:51:33

在这个Post中有一个讨论,@DSM展示了如何将给定列中具有相同值的条目连接起来,正如最初的文章作者所建议的:

pd.concat(g for _, g in df.groupby("ID") if len(g) > 1)

这是假设您将数据作为数据帧打开。你知道吗

如果你看一看groupby函数documentation,你会发现你可以将这些iten按不止一列进行分组,如果我正确理解了你的问题,它会为你返回一个列表,你可以很容易地看到重复并研究它们的频率。你知道吗

相关问题 更多 >