我的意思是 熊猫就是这样设计的吗?所有的时间序列函数都是建立在这个假设之上的吗?
几周前,我在试验pandas.rolling_mean,它似乎希望datetime在索引中。你知道吗
给定这样的数据帧:
df = pd.DataFrame({'date' : ['23/10/2017', '24/10/2017', '25/10/2017','26/10/2017','27/10/2017'], 'dax-close' : [13003.14, 13013.19, 12953.41,13133.28,13217.54]})
df['date'] = pd.to_datetime(df['date'])
df
…始终这样做是否重要:
df.set_index('date', inplace=True)
df
…作为分析的第一步?你知道吗
简而言之,timeseries数据通常将date作为DatetimeIndex。许多pandas函数确实利用了这一点,例如^{} 是一个很大的函数。你知道吗
也就是说,您不需要将日期作为索引,例如,您甚至可能有多个Datetime列,那么您将vanilla resample称为。。。但是,您可以使用^{} 在列上定义“重采样”(或者作为更大/多列groupby的一部分)
前者提供了更大的灵活性,因为您可以按多个列进行分组:
相关问题 更多 >
编程相关推荐