屏蔽数据帧中最大值之前出现的所有值

Mule Creek Saddle Mtn. Calvert Creek Date 2011-05-01 23.400000 35.599998 8.6 2011-05-02 23.400000 35.599998 8.0 2011-05-03 23.400000 35.700001 7.6 2011-05-04 23.400000 50.000000 7.1 2011-05-05 23.100000 35.799999 6.4 2011-05-06 23.000000 35.799999 5.7 2011-05-07 40.000000 35.900002 4.7 2011-05-08 23.100000 36.500000 12.0 2011-05-09 23.299999 37.500000 4.4 2011-05-10 23.200001 37.500000 3.6

Mule Creek Saddle Mtn. Calvert Creek Date 2011-05-01 NaN NaN NaN 2011-05-02 NaN NaN NaN 2011-05-03 NaN NaN NaN 2011-05-04 NaN 50.000000 NaN 2011-05-05 NaN 35.799999 NaN 2011-05-06 NaN 35.799999 NaN 2011-05-07 40.000000 35.900002 NaN 2011-05-08 23.100000 36.500000 12.0 2011-05-09 23.299999 37.500000 4.4 2011-05-10 23.200001 37.500000 3.6

3条回答

网友

1楼 · 编辑于 2024-05-14 13:33:04

我会使用max和cumprod。你知道吗

df[(df < df.max()).cumprod().ne(1)]

            Mule Creek  Saddle Mtn.  Calvert Creek
Date                                              
2011-05-01         NaN          NaN            NaN
2011-05-02         NaN          NaN            NaN
2011-05-03         NaN          NaN            NaN
2011-05-04         NaN    50.000000            NaN
2011-05-05         NaN    35.799999            NaN
2011-05-06         NaN    35.799999            NaN
2011-05-07   40.000000    35.900002            NaN
2011-05-08   23.100000    36.500000           12.0
2011-05-09   23.299999    37.500000            4.4
2011-05-10   23.200001    37.500000            3.6

但也许还有其他方法。你知道吗

网友

2楼 · 编辑于 2024-05-14 13:33:04

可以检查累计最大值与最大值相同的位置：

df.where(df.cummax() == df.max())

            Mule Creek  Saddle Mtn.  Calvert Creek
Date                                              
2011-05-01         NaN          NaN            NaN
2011-05-02         NaN          NaN            NaN
2011-05-03         NaN          NaN            NaN
2011-05-04         NaN    50.000000            NaN
2011-05-05         NaN    35.799999            NaN
2011-05-06         NaN    35.799999            NaN
2011-05-07   40.000000    35.900002            NaN
2011-05-08   23.100000    36.500000           12.0
2011-05-09   23.299999    37.500000            4.4
2011-05-10   23.200001    37.500000            3.6

网友

3楼 · 编辑于 2024-05-14 13:33:04

简单但可能低效的方法：

for c in df.columns:
  df[c].loc[df[c].index[0]: df[c].idxmax()] = np.nan

相关问题更多 >

编程相关推荐

热门问题

热门文章