我试图计算特定列“df1”的当前行值在前5行(并排2列)的低-高范围值之间的次数。这是一个后续问题-迪克斯特已经完成了繁重的工作。
Series().between()方法不合作,抱怨AttributeError: 'Series' object has no attribute 'columns'
。我不明白我是如何涉及columns
属性的。
list1 = [[21,101],[22,110],[25,113],[24,112],[21,109],[28,108],[30,102],[26,106],[25,111],[24,110]]
dict1 = {}
dict1['df1'] = pd.DataFrame(list1,index=pd.date_range('2000-1-1',periods=10, freq='D'), columns=list('AB'))
dict1['df2'] = pd.DataFrame(dict1['df1'] * (1-.05))
pan_so = pd.Panel(dict1)
pan_so = pan_so.transpose(2,1,0)
x = pan_so.ix[0,:,:]
def btwn(x): # x is a dataframe
y = x['df1'].rolling(center=False,window=6)
z = x['df2'].rolling(center=False,window=6)
x['cnt_btwn'] = pd.Series(pd.Series(y[:-1]).between(z[-1], y[-1], inclusive=True).sum())
return x
btwn(x)
我做错什么了?谢谢!
这个
y[:-1]
访问不支持列索引的Rolling
对象,这就是代码中[:-1]
的含义。在过滤之前,您应该应用一个转换函数并得到一个实际的序列。相关问题 更多 >
编程相关推荐