如何使用python只从地址列中删除房子/建筑号

2024-04-29 14:12:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我的数据帧中有一列地址。我想从字符串中删除门牌号,只使用街道名称来制作treemap或wordcloud。 然而,有些地址在街道名称前有时是3位数,有时甚至更多。另外,有些街道名称本身有编号,因此我无法使用%d删除中的数字结构分裂或正则表达式。我最近开始学习python,所以不知道如何拆分这种字符串。任何帮助将不胜感激。在

下面是列中给出的地址示例:
北豪诺街3150号
东经103街139号
412 E下瓦克公路
东经94街300号
J大街S 10340号
南KEDVALE大道619号


Tags: 数据字符串名称示例地址数字街道结构
3条回答

我刚开始使用Python中的正则表达式,但下面是我的尝试:

\d+\s[A-Z]\s+(.+)

如果您想查看匹配项,这里有一个快速链接:https://regex101.com/r/rzNgTL/1

假设所有的家庭地址中都没有空格,可以将字符串除以第一个空格。用法示例:

s="3150 N Honore St"
new_s=s.split(" ",1)[1]

要分解它-s.split(" ",1)在第一个空格处拆分字符串,但只分割一次。这将形成一个字符串列表,看起来像['3150','N Honore St']。因为您只需要后一部分,[1]会选择它。在

您可以使用正则表达式:^\d*\s

https://regex101.com/r/B7DbxW/1

相关问题 更多 >