Python遍历2个文件之间的匹配,用匹配结果附加新列

2024-04-26 03:43:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在处理自行车共享信息的两个数据帧。一个名为“stations1”的数据帧有105行长,由自行车共享站的地理信息组成:站号、地址、纬度和经度。另一个名为“trips1”的数据帧有10000多条线路,由自行车共享客户的出行信息组成,包括起点站号和终点站号

我必须使用“trips1”df上的起始站号,在“stations1”中搜索匹配的站号,直到找到匹配的站号,并将站的纬度和经度地址附加到“trips”数据帧中

下面是我正在处理的数据帧的示例代码。我必须将trips1文件中的起始站号与stations1文件中的站号匹配,并将相应的“lat”和“lng”值附加到trips1数据帧中

import pandas as pd

data1 = [[31111, 38.917, -77.025],[31602, 38.931, -77.031],[31110, 38.923,-77.501], [31107, 38.915, -77.038]]
labels = ['number','lat','lng']
stations1 = pd.DataFrame(data=data1, columns=labels)
stations1.head()


data2 = [[31602, 31111, 2],[31111, 31110, 3],[31111, 31111, 4], [31111,31107, 1], [31107, 31110, 3], [31110, 31602, 3]]
labels = ['start_station_number', 'end_station_number', 'hours_used']
trips1 = pd.DataFrame(data=data2, columns=labels)
trips1.head()

我是Python的新手,所以我不确定如何开始我的循环。任何帮助指导我进入正确的领域,或指导我如何开始我的循环将不胜感激


Tags: 文件数据信息numberlabels地址自行车pd