我的数据帧中有一列地址。我想从字符串中删除门牌号,只使用街道名称来制作treemap或wordcloud。
然而,有些地址在街道名称前有时是3位数,有时甚至更多。另外,有些街道名称本身有编号,因此我无法使用%d删除中的数字结构分裂或正则表达式。我最近开始学习python,所以不知道如何拆分这种字符串。任何帮助将不胜感激。在
下面是列中给出的地址示例:
北豪诺街3150号
东经103街139号
412 E下瓦克公路
东经94街300号
J大街S 10340号
南KEDVALE大道619号
Tags:
我刚开始使用Python中的正则表达式,但下面是我的尝试:
如果您想查看匹配项,这里有一个快速链接:https://regex101.com/r/rzNgTL/1
假设所有的家庭地址中都没有空格,可以将字符串除以第一个空格。用法示例:
要分解它-
s.split(" ",1)
在第一个空格处拆分字符串,但只分割一次。这将形成一个字符串列表,看起来像['3150','N Honore St']
。因为您只需要后一部分,[1]
会选择它。在您可以使用正则表达式:
^\d*\s
https://regex101.com/r/B7DbxW/1
相关问题 更多 >
编程相关推荐