比较/聚类轨迹(x,y)点的GPS数据)并挖掘d

2024-04-29 17:21:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我有两个关于分析GPS数据集的问题。

1)提取轨迹我有一个庞大的数据库,记录了(latitude, longitude, date-time)形式的GPS坐标。根据连续记录的日期时间值,我试图提取出此人所遵循的所有轨迹/路径。例如,假设从时间M开始,(x,y)对一直在变化,直到时间N。在N之后,(x,y)对的变化减少,此时我得出结论,从时间MN的路径可以称为轨迹。在提取轨迹时,这是一个不错的方法吗?你能推荐什么著名的方法/方法/算法吗?有没有任何数据结构或格式,你想建议我保持这些点在一个有效的方式?也许,对于每一个轨迹,计算出速度和加速度是有用的?

2)挖掘轨迹一旦我跟踪了所有轨迹/路径,我如何比较/聚类它们?我想知道起点或终点是否相似,那么中间路径如何比较?

我如何比较这两条路径/路线,并得出它们是否相似的结论。此外,如何将相似的路径聚集在一起?

如果你能给我指一个关于这件事的研究或类似的东西,我将不胜感激。

开发将使用Python,但欢迎各种库建议。

提前谢谢。


Tags: 数据方法路径算法数据库datetime轨迹
2条回答

1)提取轨迹 我认为你的方向是对的。gps数据中可能会有一些噪声,随机行走时,应该做一些光滑的样条来克服它。


2)挖掘轨迹 在类似的轨迹中是否有商业意义?(这将有助于构建距离度量,然后您可以使用一些mahoot聚类算法) 一。我认为一些人停下来的地方更有趣,这样你就可以生成地方受欢迎程度的统计数据。 2。如果您需要路由相似性来查找到同一起点和终点的不同路径,则需要首先对起点和终点位置进行聚类,然后根据(最大间距、整数距离-一些众所周知的函数度量)对曲线进行相似处理

看看苏黎世大学地理系的工作,尤其是Patrick LaubeSomayeh Dodge

看看报纸

Individual Movements and Geographical Data Mining. Clustering Algorithms for Highlighting Hotspots in Personal Navigation Routes

linkpresentation)。介绍了DBSCAN核密度估计方法在GPS数据中的应用。

此外,诺基亚Mobile Data Challenge 2012 Workshop的论文在这里也有帮助,特别是:

MobReduce: Reducing State Complexity of Mobility Traces (link)

作者:Fabian Hartmann、Christoph p.Mayer、Ingmar Baumgart和

A Trajectory Cleaning Framework for Trajectory Clustering(link)

作者:艾伯塔大学的Agzam Idrissov,Mario A.Nascimento

相关问题 更多 >