大Pandas有效的日期范围筛选

2024-04-19 11:41:14 发布

您现在位置:Python中文网/ 问答频道 /正文

大型数据帧有一个date列。通过使用pandas.read_csv(..., parse_dates=["date"])读取数据,我假设列已经转换为表示日期的有效数据类型。在

现在的任务是选择属于某个日期范围的所有项目,例如("2018-01-01", "2018-12-31")。通过将date列排序并使用二进制搜索来定位边界索引,这可能会非常快。在

但我该怎么告诉熊猫呢?按列排序并对其执行查询就足够了吗?我应该把它变成pandas.DateTimeIndex并使用.loc?在

一个可能的警告是项目已经有一个MultiIndex,需要保持完整。另外,我不希望内存中有一个以上的数据帧副本。在


Tags: csv数据项目定位pandasreaddate排序