我正在尝试清理一组字符串以删除不需要的字符
输入
Lethal Lunch t5+ 0 0 D 10 t5+ Michael Bell . Alex Jary7 .
Muscika 1 v5+ W5+ 0 0 D 5 v5+ W5+ D O'Meara . Cam Hardie . C5
Typhoon Ten 1 0 0 D 13 R Hannon . Luke Catton7 .
Wentworth Falls 1 cp5+ 0 0 C D 45 cp5+ G Harker . Connor Beasley .
One Night Stand 0 0 D 34 W Jarvis . Silvestre De Sousa . 30 C1 C5
Dancinginthewoods 1 0 0 D 24 D Ivory . 14 Jamie Spencer . 30
Case Key 1 v3 0 0 D 13 v3 M Appleby . Andrew Mullen . 14
想要的产出
Lethal Lunch
Muscika
Typhoon Ten
Wentworth Falls
One Night Stand
Dancinginthewoods
Case Key
我试过这个
re.findall('([a-zA-Z ]*)\d*.*',final_df.loc[index, 'Horse'])
这将删除数字后的所有内容,但在第一个条目上保留t。我想知道有没有更好的办法
我会用
re.split
来代替:结果
说明:它在指定模式匹配的位置拆分字符串,然后获取第一部分。您可能想要调整它,以便其他模式也匹配
大熊猫中的我刚刚注意到你似乎在使用熊猫——假设你的df看起来是这样的:
你能行
要获得此信息:
这样的东西够了吗
我们基本上忽略了带有数字或奇怪符号的单词。 输出:
像这样的方法应该会奏效:
相关问题 更多 >
编程相关推荐