我在熊猫中有下表DataFrame
:
q_string q_visits q_date
0 nucleus 1790 2012-10-02 00:00:00
1 neuron 364 2012-10-02 00:00:00
2 current 280 2012-10-02 00:00:00
3 molecular 259 2012-10-02 00:00:00
4 stem 201 2012-10-02 00:00:00
该表按天包含服务器日志中的查询卷。我想做两件事:
q_visits
。一、 例如,一个术语的每月查询量除以所有术语当月的总查询量。做这个最好的方法是什么?
如果我理解正确:
对于(1)执行以下操作:
通过从你给出的数值、随机日期和访问次数中进行抽样,制作一些假数据:
之所以有
NaN
是因为在那几个月里没有使用该查询字符串的访问。对于(2),按日期分组,然后除以和:
只是为了让你相信(2)在做你想做的事:
如果要将
resamp
转换为DataFrame
,并删除NaN
的do:当然,您也可以为
g
这样做:最后,如果要按不同的顺序排列列,请使用
reindex
:相关问题 更多 >
编程相关推荐