执行时:
import pandas
x = pandas.read_csv('data.csv', parse_dates=True, index_col='DateTime',
names=['DateTime', 'X'], header=None, sep=';')
使用这个data.csv
文件:
1449054136.83;15.31
1449054137.43;16.19
1449054138.04;19.22
1449054138.65;15.12
1449054139.25;13.12
(第1列是一个UNIX时间戳,即自1970年1月1日起经过的秒数),当使用x.resample('15S')
每隔15秒对数据重新采样时,会出现此错误:
TypeError: Only valid with DatetimeIndex, TimedeltaIndex or PeriodIndex
就像“datetime”信息没有被解析一样:
X
DateTime
1.449054e+09 15.31
1.449054e+09 16.19
...
如何使用pandas模块导入日期存储为时间戳的.CSV?
然后,一旦我能够导入CSV,如何访问日期为2015-12-02 12:02:18的行?
您可以自己分析日期:
结果是:
使用
to_datetime
并传递unit='s'
将单元解析为unix时间戳,这将更快:计时:
以及
因此,在这个小数据集上使用
to_datetime
要快2倍多,我希望这比其他方法的伸缩性要好得多我的解决方案与迈克的类似:
相关问题 更多 >
编程相关推荐