大型数据帧有一个date
列。通过使用pandas.read_csv(..., parse_dates=["date"])
读取数据,我假设列已经转换为表示日期的有效数据类型。在
现在的任务是选择属于某个日期范围的所有项目,例如("2018-01-01", "2018-12-31")
。通过将date
列排序并使用二进制搜索来定位边界索引,这可能会非常快。在
但我该怎么告诉熊猫呢?按列排序并对其执行查询就足够了吗?我应该把它变成pandas.DateTimeIndex
并使用.loc
?在
一个可能的警告是项目已经有一个MultiIndex
,需要保持完整。另外,我不希望内存中有一个以上的数据帧副本。在
目前没有回答
相关问题 更多 >
编程相关推荐