返回最大值d的HDFStore查询

2024-04-20 11:30:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个大的数据集(>;100M行),我把它放进了HDF存储库,以便用Pandas进行分析。它太大了,不能完整地放入内存中。我希望能够在数据集的setup字段中选择具有最大或最小datetime值的行。你知道吗

所以,类似于

df.ix[df['setup'].idxmax()]

如果整个数据集都在内存中。有什么建议吗?你知道吗


Tags: 数据内存gtpandasdfdatetimesetup建议