我有一个包含伪数据的文件(txt),包含以下3列:
user_13 visit_19 1330760979
user_14 visit_20 1330732782
user_14 visit_21 1330769600
user_14 visit_22 1330783341
user_14 visit_23 1330796012
user_14 visit_24 1330797842
使用熊猫,我如何从第三栏的时间戳中找出16:00-22:00之间访问该页面的用户数量
一个用户可能有多次访问,为了符合列表的要求,第一次和最后一次访问必须在16:00和22:00之间
我在下面发布的代码实现了您的目标。我还上传了完整的Jupyter笔记本here
正在初始化数据帧:
将时间戳转换为日期时间,在小时之后:
选择所需的daypart范围,然后将所选内容放在Dataframe上:
正在创建要聚合的辅助列:
聚合用户和访问:
输出:非唯一用户计数、唯一用户计数、访问计数:
相关问题 更多 >
编程相关推荐