在pandas中,可以通过传递可解释为日期的字符串来索引时间序列。这也适用于数据帧:
>>> dates = pd.date_range('2000-01-01', periods=8, freq='M')
>>> df = pd.DataFrame(np.random.randn(8, 4), index=dates, columns=['A', 'B', 'C', 'D'])
>>> df
A B C D
2000-01-31 0.096115 0.069723 -1.546733 -1.661178
2000-02-29 0.256296 1.838310 0.227132 1.765269
2000-03-31 0.315862 0.167007 -1.340888 1.005260
2000-04-30 1.238728 -2.325420 1.371134 -0.373232
2000-05-31 0.639211 -0.209961 -1.006498 0.005214
2000-06-30 0.091590 -0.664554 -2.037539 -1.335070
2000-07-31 0.275373 -0.398758 0.402848 0.441035
2000-08-31 2.189259 -1.236159 -0.579680 0.878355
>>> df['2000-05']
A B C D
2000-05-31 0.639211 -0.209961 -1.006498 0.005214
当时间戳是列名时,我正在寻找这样做的方法。你知道吗
>>> df = df.T
>>> df['2000-05']
这就产生了TypeError: only integer scalar arrays can be converted to a scalar index
。同样的情况也适用于
>>> df.loc[:, '2000-05']
我能想到的最直接的解决办法是
>>> df.T['2000-05'].T
2000-05-31
A 0.639211
B -0.209961
C -1.006498
D 0.005214
但我想知道是否还有其他好的解决办法。我想对于非常大的数据帧,进行换位可能会对性能产生影响,这在这里是可以避免的。你知道吗
还有^{} ,它允许您使用datetime对象,而不是将列名视为字符串。你知道吗
这将需要两个日期,不过-
before
和after
参数充当要保留的期间的帐头。你知道吗也许你可以试试
str
,contains
嗯,总是有
filter
选项。你知道吗filter
为您提供了更大的灵活性,例如,使用正则表达式:相关问题 更多 >
编程相关推荐