我有一个csv文件,因此列表或数据框包含访问营地的开始和结束日期。在
start_date end_date
0 2016-01-21 2016-01-24
1 2016-01-28 2016-01-29
2 2016-02-02 2016-02-10
3 2016-02-08 2016-02-12
...
我想计算一个数据帧,其中一行表示时间段内的每一天,一列计算累计访问量,一列表示当天驻留的访客数,以及累计访问天数总和。在
我目前有一些黑客代码,它将访问者数据读入一个普通的python列表visitor_array
,并为周期/年中的每个日期创建另一个列表year_array
。然后,它在year_array
中的每个日期循环,visitor_array
上有一个内部循环,并在{
然后我将year_array
转换为pandas数据帧,创建一些cumsum列并忙于绘制等等
在大熊猫身上,有没有更优雅的Python/潘达西的方式来完成这些?在
考虑到
df
具有起始/结束值的数据帧,以及d
的最终数据帧,我会做如下的事情:代码:
结果输出
^{pr2}$print(d.loc['2016-01-21':'2016-01-29'])
的一些摘录:愿此代码有所帮助!在
相关问题 更多 >
编程相关推荐