我试着把我的数据从每天的频率增加到每小时一次,并向前填充丢失的数据。在
我从以下代码开始:
df1 = pd.read_csv("DATA.csv")
df1.head(5)
然后,我使用以下命令转换为日期时间字符串并将日期/时间设置为索引:
^{pr2}$我试着每小时重新取样如下:
df1['DT'] = df1.resample('H').ffill()
但我得到了以下错误:
TypeError: Only valid with DatetimeIndex, TimedeltaIndex or PeriodIndex, but got an instance of 'RangeIndex'
我以为我的数据类型已经是pd.to_日期时间以上代码。我所尝试的一切似乎都没有奏效。谁能帮帮我吗?在
我的预期产出如下:
DT VALUE
2016-08-01 00:00:00 0.000000
2016-08-01 01:00:00 0.000000
2016-08-01 02:00:00 0.000000
等等
文件本身大约有1000行。前50行左右为零,以便澄清哪里有实际数据:
DT VALUE
2018-12-13 00:00:00 24000.000000
2018-12-13 01:00:00 24000.000000
2018-12-13 02:00:00 24000.000000
...
2018-12-13 23:00:00 24000.000000
2018-12-14 00:00:00 26000.000000
2018-12-14 01:00:00 26000.000000
等等
我假设你提到的数据集的一些初始行
然后,像这样在
^{pr2}$DT
上建立索引输出:
^{3}$现在,重新采样你的数据帧
输出:显示输出的一些初始值
试着把它分配回来
或者
^{pr2}$相关问题 更多 >
编程相关推荐