我有一个时间序列数据,它的时间格式是“yyyy-mm-dd hh:mm:ss
”。我想把我的行分成训练集和测试集。但我尝试的所有方法都失败了。你知道吗
如何将以下数据拆分为测试集和训练集:
DATE-TIME TEMP PRE
2018-08-4 15:18:49 209.3851 4045.4414
2018-08-4 15:18:50 209.3851 4045.4314
2018-08-4 15:18:51 209.3581 4045.4268
2018-08-4 15:18:52 209.3553 4045.4343
2018-08-4 15:18:53 209.3553 4045.4307
...
以下代码无效:
...
split_date = pd.Timestamp('2018-08-4 15:18:52')
train = data.loc[:split_date]
test = data.loc[split_date:]
...
我假设你的时间戳已经分类了,所以你可以使用
结果:
列车:
测试:
也许您必须先将columntype转换为datetime格式:
如果时间戳是索引,而不是数据帧的一列,只需将
df['DATE-TIME']
替换为df.index
作为一种替代方法,您可以查看
sklearn
的TimeSeriesSplit。你知道吗相关问题 更多 >
编程相关推荐