使用结构化查询在使用GeoPy的数据帧中对记录进行地理编码

from geopy.extra.rate_limiter import RateLimiter from geopy.geocoders import Nominatim Ngeolocator = Nominatim(user_agent="myGeocoder") Ngeocode = RateLimiter(Ngeolocator.geocode, min_delay_seconds=1) df = pandas.DataFrame(["Bob", "Joe", "Ed"]) df["CLEANtown"] = ['Harmony', 'Fargo', ''] df["CLEANcounty"] = ['', '', 'Traill'] df["CLEANstate"] = ['Minnesota', 'North Dakota', 'North Dakota'] df["full"]=['Harmony, Minnesota','Fargo, North Dakota','Traill County, North Dakota'] df.columns = ["name"] + list(df.columns[1:])

1条回答

网友

1楼 · 发布于 2024-05-14 06:05:34

一种方法是使用数据帧的apply方法而不是序列。这将把整排传递给lambda。例如：

df["easycode"] = df.apply(
    lambda row: Ngeocode(
        {
            "city": row["CLEANtown"],
            "county": row["CLEANcounty"],
            "state": row["CLEANstate"],
        },
        language="en",
        addressdetails=True,
    ).raw,
    axis=1,
)

类似地，若您想先制作一行词典，可以执行以下操作：

df["full"] = df.apply(
    lambda row: {
        "city": row["CLEANtown"],
        "county": row["CLEANcounty"],
        "state": row["CLEANstate"],
    },
    axis=1,
)
df["easycode"] = df["full"].apply(
    lambda x: Ngeocode(
        x,
        language="en",
        addressdetails=True,
    ).raw
)

相关问题更多 >

编程相关推荐

热门问题

热门文章