索引是否使pandas数据帧片段更快?

2024-04-19 18:10:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个熊猫数据框,里面有超过百万条记录。其中一列是datetime。我的数据示例如下:

time,x,y,z
2015-05-01 10:00:00,111,222,333
2015-05-01 10:00:03,112,223,334
...

我需要在特定时期内有效地获得记录。下面这种幼稚的方式很费时。

new_df = df[(df["time"] > start_time) & (df["time"] < end_time)]

我知道,在像MySQL这样的DBMS上,通过指定时间段,按时间字段索引对于获取记录是有效的。

我的问题是

  1. df.index = df.time这样的熊猫索引是否使切片过程更快?
  2. 如果问题1的答案是“否”,那么在大熊猫的特定时间段内获得记录的常见有效方法是什么?

Tags: 数据示例dfnewdatetimetime方式记录