在Datafram中，每组取下一个较低的值

A B C 0 01:00:00 24 Andrew 1 01:00:00 17 Edd 2 01:00:00 12 Emma 3 01:00:00 18 Fred 4 02:00:00 38 Andrew 5 02:00:00 35 Edd 6 02:00:00 45 Emma 7 02:00:00 49 Fred

1条回答

网友

1楼 · 发布于 2024-05-15 14:32:14

使用带有^{}的自定义lambda函数返回第一个最大行，同时将条件更改为>：

i = (df.sort_values('B', ascending=False)
      .groupby('A')['B']
      .apply(lambda x: ((x.min() + 10 >= x).idxmax())))
df = df.loc[i]
print (df)
          A   B     C
3  01:00:00  18  Fred
6  02:00:00  45  Emma

或者首先过滤出每个组中具有更高值的所有行，然后按列B和最后^{}筛选^{}，只保留最后一个重复行：

df1 = df[df.groupby('A')['B'].transform('min') + 10 >= df['B']]
df1 = df1.sort_values('B').drop_duplicates('A', keep='last')
print (df1)
          A   B     C
3  01:00:00  18  Fred
6  02:00:00  45  Emma

编程相关推荐

用于切换状态结果的枚举的java输入
检测*NIX上打开的端口时出现java问题
java捕获和保存屏幕截图
java SLF4JLogback：基于日志级别的多模式
Java从字符串中删除动态子字符串
在spring引导中contextLoads测试时运行java Liquibase
基于规则集的任意嵌套POJO的java任意就地转换
java如何做，边做边循环这段代码？
java是什么导致jmh测量中的错误？
java Spring RabbitTemplate执行方法可见性

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Datafram中，每组取下一个较低的值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >