我有一个3D数据集(东距(X)、北距(Y)、高程(Z)),并且有一些我们可以称之为a、B、C的有害元素的值。间隔是每20英尺一次,除非在Z值的末尾,否则它可能更小,因为它不能保证你会有偶数的20秒
我想获取这个数据集,并创建一个新的数据集,它的平均值是40秒,而不是20秒。如果没有一对,则只输入最后一个值。它按ID求平均值。例如,如下所示
import pandas as pd
phx = pd.read_csv('./data.csv')
phx = phx.sort_values(['ID','midZ'],ascending=False).groupby('ID').head(3)
这将按ID和降序midZ对其进行排序,这正是我所需要的。下一步是在步骤=2中求平均值,但如果有奇数,则只保留最后一个。我一直在谷歌上搜索和尝试各种各样的东西,但它不起作用。我试过这个:
step = 2
phxdf = phx.groupby(phx.index//step).mean()
但这并没有给我所需要的
任何帮助都将不胜感激。蒂亚
考虑在{{CD2>}的^ {CD1>}上,以{{CD3}}为上倍数计算条件为40的伪分组列。然后,在{}旁边运行{}聚合{}:
数据
聚合
相关问题 更多 >
编程相关推荐