我正在处理自行车共享信息的两个数据帧。一个名为“stations1”的数据帧有105行长,由自行车共享站的地理信息组成:站号、地址、纬度和经度。另一个名为“trips1”的数据帧有10000多条线路,由自行车共享客户的出行信息组成,包括起点站号和终点站号
我必须使用“trips1”df上的起始站号,在“stations1”中搜索匹配的站号,直到找到匹配的站号,并将站的纬度和经度地址附加到“trips”数据帧中
下面是我正在处理的数据帧的示例代码。我必须将trips1文件中的起始站号与stations1文件中的站号匹配,并将相应的“lat”和“lng”值附加到trips1数据帧中
import pandas as pd
data1 = [[31111, 38.917, -77.025],[31602, 38.931, -77.031],[31110, 38.923,-77.501], [31107, 38.915, -77.038]]
labels = ['number','lat','lng']
stations1 = pd.DataFrame(data=data1, columns=labels)
stations1.head()
data2 = [[31602, 31111, 2],[31111, 31110, 3],[31111, 31111, 4], [31111,31107, 1], [31107, 31110, 3], [31110, 31602, 3]]
labels = ['start_station_number', 'end_station_number', 'hours_used']
trips1 = pd.DataFrame(data=data2, columns=labels)
trips1.head()
我是Python的新手,所以我不确定如何开始我的循环。任何帮助指导我进入正确的领域,或指导我如何开始我的循环将不胜感激
目前没有回答
相关问题 更多 >
编程相关推荐