我有一个带有时间索引的df,还有几个带有数值的列,但在某些情况下也包含缺少的值。 例如:
timeindex ColA ColB ColC
00:02:00 454 436 4334
00:04:00 653
00:06:00 3423 4354
00:08:00 3432
00:10:00 2343
00:12:00 32432 23423
我想创建dataframe的一个子集,这样对于每一个连续的3行组,它都会选择丢失值最少的行。 因此,对于上述df,子TDF如下所示:
timeindex ColA ColB ColC
00:02:00 454 436 4334
00:12:00 32432 23423
你能告诉我怎样才能做到这一点吗
使用
df.filter
选择列,检查轴1上的空字符串sum
,然后最后groupby.idxmax
如果您想清空而不是无:
替换此行:
按此行:
相关问题 更多 >
编程相关推荐