我是一名需要清理数据的地质学家。 我有一个包含钻孔间隔的.csv文件,我将其作为熊猫数据框导入,如下所示:
hole_name from to interval_type
0 A 0 1 Gold
1 A 1 2 Gold
2 A 2 4 Inferred_fault
3 A 4 6 NaN
4 A 6 7 NaN
5 A 7 8 NaN
6 A 8 9 Inferred_fault
7 A 9 10 NaN
8 A 10 11 Inferred_fault
9 B2 11 12 Inferred_fault
10 B2 12 13 Inferred_fault
11 B2 13 14 NaN
对于每个单独的“孔名称”,我想对与同一“间隔类型”关联的连续间隔的“从”和“到”范围进行分组/合并。可以删除NaN值,它们对我没有任何用处(但我已经知道如何做,所以这很好)
根据上面的例子,我想得到如下结果:
hole_name from to interval_type
0 A 0 2 Gold
2 A 2 4 Inferred_fault
3 A 4 8 NaN
6 A 8 9 Inferred_fault
7 A 9 10 NaN
8 A 10 11 Inferred_fault
9 B2 11 13 Inferred_fault
11 B2 13 14 NaN
我环顾四周,试图使用groupby或pyranges,但不知道如何做到这一点。。。 非常感谢您的帮助
您可以首先构建一个用于分组的指示符列。然后使用agg合并子组以从和到
这应该可以做到:
result
应该是:编辑:将
hole_name
添加到groupby
函数中相关问题 更多 >
编程相关推荐