找到最大值后，在单独的列中找到后续的最小值

Date Time Ticker High Low Range 0 01/02/18 7:05 USD/JPY 112.170 112.150 1 01/02/18 7:10 USD/JPY 112.175 112.140 2 01/02/18 7:15 USD/JPY 112.185 112.170 3 01/02/18 7:20 USD/JPY 112.180 112.155 112.180-112.080 = .10 4 01/02/18 7:25 USD/JPY 112.160 112.145 5 01/02/18 7:30 USD/JPY 112.160 112.155 6 01/02/18 7:35 USD/JPY 112.160 112.120 7 01/02/18 7:40 USD/JPY 112.145 112.100 8 01/02/18 7:45 USD/JPY 112.120 112.085 9 01/02/18 7:50 USD/JPY 112.155 112.080 10 01/02/18 7:55 USD/JPY 112.150 112.130 32898 07/05/19 11:35 USD/JPY 108.545 108.525 32899 07/05/19 11:40 USD/JPY 108.550 108.535 32900 07/05/19 11:45 USD/JPY 108.560 108.530 108.560-108.525 = .035 32901 07/05/19 11:50 USD/JPY 108.550 108.540 32902 07/05/19 11:55 USD/JPY 108.535 108.525 32903 07/05/19 12:00 USD/JPY 108.550 108.530 32904 07/05/19 12:05 USD/JPY 108.555 108.530 32905 07/05/19 12:10 USD/JPY 108.560 108.540 32906 07/05/19 12:15 USD/JPY 108.560 108.540

2条回答

网友

1楼 · 编辑于 2024-04-26 07:38:22

要在最大值之后获得最小值，可以过滤groupby组中的行：

df.groupby('Date').apply(lambda x: x.High.max() - x[x.index > x.High.idxmax()].Low.min())

结果：

Date
01/02/18    0.105
07/05/19    0.035

为了验证这是否正确，您必须将第一行的下限设置为112.000，即使一天的绝对最小值出现在最大值之前。

如果您也需要时间信息，请将其转换为数据帧并插入时间列：

res = df.groupby('Date').apply(lambda x: x.High.max() - x[x.index > x.High.idxmax()].Low.min()).to_frame('Range')
res.insert(0,'Time',df.loc[df.groupby('Date')['High'].idxmax(),'Time'].values)

最终结果：

           Time  Range
Date                  
01/02/18   7:15  0.105
07/05/19  11:45  0.035

更新
如果您希望将范围作为新列插入原始数据帧中：

df.loc[df.groupby('Date')['High'].idxmax().values,'Range']=df.groupby('Date').apply(lambda x: x.High.max() - x[x.index > x.High.idxmax()].Low.min()).values

输出：

           Date   Time   Ticker     High      Low  Range
0      01/02/18   7:05  USD/JPY  112.170  112.000    NaN
1      01/02/18   7:10  USD/JPY  112.175  112.140    NaN
2      01/02/18   7:15  USD/JPY  112.185  112.170  0.105
3      01/02/18   7:20  USD/JPY  112.180  112.155    NaN
4      01/02/18   7:25  USD/JPY  112.160  112.145    NaN
5      01/02/18   7:30  USD/JPY  112.160  112.155    NaN
6      01/02/18   7:35  USD/JPY  112.160  112.120    NaN
7      01/02/18   7:40  USD/JPY  112.145  112.100    NaN
8      01/02/18   7:45  USD/JPY  112.120  112.085    NaN
9      01/02/18   7:50  USD/JPY  112.155  112.080    NaN
10     01/02/18   7:55  USD/JPY  112.150  112.130    NaN
32898  07/05/19  11:35  USD/JPY  108.545  108.525    NaN
32899  07/05/19  11:40  USD/JPY  108.550  108.535    NaN
32900  07/05/19  11:45  USD/JPY  108.560  108.530  0.035
32901  07/05/19  11:50  USD/JPY  108.550  108.540    NaN
32902  07/05/19  11:55  USD/JPY  108.535  108.525    NaN
32903  07/05/19  12:00  USD/JPY  108.550  108.530    NaN
32904  07/05/19  12:05  USD/JPY  108.555  108.530    NaN
32905  07/05/19  12:10  USD/JPY  108.560  108.540    NaN
32906  07/05/19  12:15  USD/JPY  108.560  108.540    NaN

网友

2楼 · 编辑于 2024-04-26 07:38:22

就像我已经说过的，第一个max出现在7:15，而不是7:20。总之，我的方法是：

new_df = df.groupby('Date').agg({'High': 'idxmax', 'Low':'min'})

# copy the time
new_df['Time'] = df.loc[new_df.High, 'Time'].values

# compute the range
new_df['Range'] = df.loc[new_df.High, 'High'].values - new_df.Low

new_df.drop(['High','Low'], axis=1)

提供：

           Time  Range
Date                  
01/02/18   7:15  0.105
07/05/19  11:45  0.035

相关问题更多 >

编程相关推荐

热门问题

热门文章