我有两个数据集,数据集有经度和纬度值。在
让我们说:
- the first dataset has "n" rows of data with
point_x1, x1
- the second dataset has "m" rows of data with
point_x2, x2
其中m>;n
编辑:注意:m
将为20000或更多,n
将为5000或更多。
我想对两个数据集进行分组或合并。在
我想找出每个点的最接近点
然后
想为dataset2中的每一行创建一个新的数据point_x2, x2, x1
(其中点x1最接近点x2)。在
数据集1示例:
-91.850532 40.376043 x1_a1
-91.850519 40.376043 x1_a2
-91.850504 40.376043 x1_a3
-91.850487 40.376043 x1_a4
-91.850399 40.376044 x1_a5
-91.850353 40.376044 x1_a6
数据集2示例:
^{pr2}$我不太懂数据科学或地理分析。在方法上寻求帮助。在
请建议我怎么做。在
我写了一些样本密码。你可以这样尝试:
我不确定它是否有用,但我想出了一个比威廉更紧凑的版本:
它在两组点之间使用简单的欧几里得,对于dataset1中的每个点,获取dataset2中离它最近的点的名称。我相信从现在开始你可以很容易地适应你的需要。在
相关问题 更多 >
编程相关推荐