我是python新手,因此希望能得到一些帮助! 我想在滚动的基础上计算周期的日期。 我有如下输入数据:
Date RF1 RF2
01-01-2008 TRUE FALSE
02-01-2008 TRUE FALSE
03-01-2008 FALSE FALSE
04-01-2008 FALSE FALSE
05-01-2008 FALSE FALSE
06-01-2008 FALSE FALSE
07-01-2008 FALSE FALSE
08-01-2008 FALSE FALSE
09-01-2008 FALSE FALSE
10-01-2008 FALSE FALSE
11-01-2008 FALSE FALSE
我想在20天的滚动基础上计算250天的不同时段,然后检查在该时段中有多少次出现False
例如:我的第一个周期是2008年1月1日+250天
那么我的第二个周期应该是1月21日+250天,以此类推
然后,对于每个时段,我需要检查每列出现False的次数
请帮忙
假设您有
data
类的以下内容然后你可以计算出错误的数量
您可以使用
rolling
和sum
,然后resample
和first
使用矢量化的Pandas方法处理数据帧,前提是Date
列包含真正的Timestamp
对象。如果包含字符串,则必须首先使用以下命令将其转换为时间戳:我还将假定
RF1
和RF2
列包含真正的布尔值。在这里,如果它们是字符串,则应首先将它们转换为布尔值:我已经用以下方法构建了一个与您的数据框相近的示例:
它给出:
我会首先计算250天内每个完整周期的真实值滚动总和,然后每20天对结果重新采样:
它给出:
相关问题 更多 >
编程相关推荐