我有一个数据框,其值如下:
name action time
------------------------------
Sam enters building 20:00
Chris enters building 20:15
Sam walks up stairs 20:20
Steve leaves building 20:25
James enters building 20:30
Chris takes elevator 20:32
Sam leaves building 20:35
Chris leaves building 20:40
Sam enters building 20:45
...
我想得到每个人不同行动的数量。这一点我可以通过df.groupby(['name','action'], as_index=False).size()
来实现
然而,这给了我一个视觉效果,我不能做太多。我想将这些计数用于不同的目的。我如何将这些数据放入一个可访问的数据框中,以便获得每个人进出大楼的次数等信息。例如,我可以像df['name' == 'Sam' & 'action'=='enters building]
一样调用,并将该计数分配给一个变量
你也可以使用你最初的想法。 在本例中,您将获得熊猫系列。您可以直接为感兴趣的值编制索引
要使其成为数据帧,可以使用
.reset_index()
,然后将其设置为df只需使用
count
即可-size
不是pandas
中的聚合函数,这就是为什么命令as_index=False
不起任何作用产出:
相关问题 更多 >
编程相关推荐