在大Pandas和群居动物中寻找连续三行的平均值

2024-05-23 20:14:39 发布

您现在位置:Python中文网/ 问答频道 /正文

我有数百人的GPS数据集(csv格式),我必须研究他们的流动性。我已经设法计算出每两点之间的距离,然后通过简单地除以这两点之间的时间增量来计算速度。我用熊猫和昵称分组做了所有这些计算(这很重要,因为每个人有不同的轨迹,你不能混合距离和速度)。你知道吗

下一步我要做的是计算平均每三个或四个速度来清除一些GPS数据错误。我已经尝试过这个,它的工作很好,但我找不到方法来分组它的昵称,因为每个用户的速度是混合的。有什么想法吗?你知道吗

enter image description here

enter image description here


Tags: csv数据距离轨迹格式错误时间增量
1条回答
网友
1楼 · 发布于 2024-05-23 20:14:39

这可以简单地通过使用索引作为对行进行分组的方法来实现

df['bins'] = df.index // n

然后在“垃圾箱”上分组。把它放在一个更干净的函数中,下面是代码

import pandas as pd

df = pd.DataFrame({'A':[1,2,3,3,4,4,4],'B':[1,2,3,4,5,6,7]})
def n_average(df, n):
    df['bin'] = df.index // n
    grouped_df = df.groupby(['bin']).mean()
    return grouped_df
n_average(df, 3)

相关问题 更多 >