按数字或字母符号拆分多列

id v1 v2 v3 0 1 泥岗路红岗花园12栋110房 NaN 1 2 沙井街道万丰路东侧 2 3 中心区 N15区幸福·海岸10栋A座11A 3 4 龙岗镇南联村长海雅园2栋D301D302房产 4 5 蛇口工业区兴华路海滨花园多层海滨花园兰山楼06栋504房产 5 6 宝安路松园·南九巷综合楼10栋103 NaN 6 7 宝安路松园·南九巷综合楼10栋203 NaN 7 8 龙岗镇中心城尚景华园12栋307房 8 9 沙河西路西博海名苑1栋30C房产 NaN 9 10 华侨城香山中路天鹅堡三期P栋4D房 NaN 10 11 布吉镇德福花园德福豪苑C4栋C5栋C4座1403房 NaN

id v1 v2 v3 0 1 泥岗路红岗花园 NaN 1 2 沙井街道万丰路东侧 2 3 中心区 NaN 幸福·海岸 3 4 龙岗镇南联村长海雅园 4 5 蛇口工业区兴华路海滨花园多层海滨花园兰山楼 5 6 宝安路松园·南九巷综合楼 NaN 6 7 宝安路松园·南九巷综合楼 NaN 7 8 龙岗镇中心城尚景华园 8 9 沙河西路西博海名苑 NaN 9 10 华侨城香山中路天鹅堡三期 NaN 10 11 布吉镇德福花园德福豪苑 NaN

1条回答

网友

1楼 · 发布于 2024-06-06 16:04:43

您可以删除需要修改的列中第一个ASCII字母数字字符之后的所有文本：

cols = ['v1', 'v2', 'v3']
df[cols] = df[cols].apply(lambda x: x.str.replace(r'[A-Za-z0-9].*', ''))

如果列可以包含多行文本，请使用

r'(?s)[A-Za-z0-9].*'

其中(?s)内联修饰符也会让.匹配换行符

相关问题更多 >

编程相关推荐

热门问题

热门文章