我试图统计包含datetime列('%Y-%m-%d %H:%M:%S')
的数据帧中的值出现次数。你知道吗
数据:
Date Employee Operation Order
2001-01-01 08:32:17 User1 Approved #00045
2001-01-01 08:36:23 User1 Edited #00045
2001-01-01 08:41:04 User1 Rejected #00046
2001-01-01 08:42:56 User1 Deleted #00046
2001-01-02 09:01:11 User1 Created #00047
...
2019-10-03 17:23:45 User1 Approved #72681
我遇到的问题是每天统计特定操作的发生次数。更确切地说,我正试图建立一个图表,显示User1如何处理他/她的订单的趋势,例如,能够显示User1在2005年有大量拒绝/删除操作,在2019年有大量批准/完成的操作。目的是学习如何解析大块数据。你知道吗
我读过this answer,这和我的问题有点关系。然而,问题是这个问题中使用的df只包含2列。我的df包含4列。这是否意味着我需要首先创建一个新的df(pseudo: df1 = df['Date'] + df['Operation'])
,它只包含2个特定的列,或者有其他方法可以做到这一点?你知道吗
我认为最好根据日期、用户和时间创建组操作。用于您可以使用^{} +^{} 。
然后可以使用^{} 计算每个组的出现次数。您可以使用^{} 生成如下所示的数据帧:
也可以使用dt.year 按年而不是按天分组:
或按年份和month:
细节
1。数据帧示例:
df=df.reset_index()
。要将日期转换为日期时间,请使用df['Date']=pd.to_datetime(df['date'])
相关问题 更多 >
编程相关推荐