Python，numpy，scipy：如何从GPS坐标中排除位置误差？（平均lon，lat）

lon = numpy.array() lat = numpy.array() flag = True while flag: lon1 = lon[:-1] lon2 = lon[1:] lat1 = lat[:-1] lat2 = lat[1:] '''distance''' x = (lon2 - lon1) y = (lat2 - lat1) d = numpy.sqrt(x * x + y * y) min = numpy.min(d) if min < GPS_sensor_error: j = numpy.where(d == min)[0][0] lon[j] = (lon[j] + lon[j + 1]) / 2 lat[j] = (lat[j] + lat[j + 1]) / 2 lon = numpy.delete(lon, j + 1) lat = numpy.delete(lat, j + 1) else: flag = False

2条回答

网友

1楼 · 编辑于 2024-04-23 19:38:07

从数据科学的角度来看，你所做的是不正确的。你不能只使用平均误差距离作为一个截止点，认为你的数据会更正确。您正在比较的两个点的误差可能大于或小于15米，它们可以相互移动或彼此移动。如果你没有另一个精确的数据集，就无法判断什么是正确的。无法使此数据集更精确。在

不过，我认为您的目标是简化数据集，而不是使其更精确。为此，您可以使用Douglas–Peucker algorithm。我建议您将数据加载到启用Postgis的数据库（Postgresql+postgis），然后使用simplify函数。这将需要一些数据库设置时间，但这将大大加快你的速度。不过，如果你想用纯python编写，那么question有一个非常好的片段。在

顺便说一句，如果你用lat计算距离，lon不要用毕达哥拉斯。它是无效的，因为lat，lon不是欧几里德式的。使用haversine算法。在

网友

2楼 · 编辑于 2024-04-23 19:38:07

只使用numpy基元，不需要python循环，就可以轻松地完成所有计算。在

首先，将距离函数定义为对numpy数组进行操作的函数（我假设您已经这样做了）：

def dist(lon1, lat1, lon2, lat2):
    """Compute the distance between (lon1, lat1) and (lon2, lat2). 
       Both may be numpy arrays."""
    ...

然后将其应用于您的数据：

^{pr2}$

这个符号表示您将比较i^th点与i+1^th。在

接下来找到d大于阈值的索引：

I = d > GPS_sensor_error

现在只保留这些和第一点！在

lon_out = numpy.hstack([[lon[0]], lon[1:][I]]) # could also use numpy.where
lat_out = numpy.hstack([[lat[0]], lat[1:][I]])

更新：

如果要保持相同的点数，即将lon[i]设置为最后一个有效值，请使用以下技巧，而不是前两行：

idx, = numpy.where(I)
idx = numpy.hstack([[0], idx])
J = numpy.cumsum(I) # the trick
lon_out = lon[idx[J]]
lat_out = lat[idx[J]]

相关问题更多 >

编程相关推荐

热门问题

热门文章