2024-05-23 20:14:39 发布
网友
我有数百人的GPS数据集(csv格式),我必须研究他们的流动性。我已经设法计算出每两点之间的距离,然后通过简单地除以这两点之间的时间增量来计算速度。我用熊猫和昵称分组做了所有这些计算(这很重要,因为每个人有不同的轨迹,你不能混合距离和速度)。你知道吗
下一步我要做的是计算平均每三个或四个速度来清除一些GPS数据错误。我已经尝试过这个,它的工作很好,但我找不到方法来分组它的昵称,因为每个用户的速度是混合的。有什么想法吗?你知道吗
这可以简单地通过使用索引作为对行进行分组的方法来实现
df['bins'] = df.index // n
然后在“垃圾箱”上分组。把它放在一个更干净的函数中,下面是代码
import pandas as pd df = pd.DataFrame({'A':[1,2,3,3,4,4,4],'B':[1,2,3,4,5,6,7]}) def n_average(df, n): df['bin'] = df.index // n grouped_df = df.groupby(['bin']).mean() return grouped_df n_average(df, 3)
这可以简单地通过使用索引作为对行进行分组的方法来实现
然后在“垃圾箱”上分组。把它放在一个更干净的函数中,下面是代码
相关问题 更多 >
编程相关推荐