从字符串中提取名称和数字

re.findall(r"(.*?)([a-zA-Z0-9]+): (\d+)*", s) [('Waz ', 'D', '5'), (' l gu ', 'l', '5'), (' ', 'GrinVe', '3'), (' P ', 'LUK', '2'), (' ', 'Cubbi', '1'), (' 2 nd ', 'dok', '1'), (' maf ', '74', '1'), (' ', 'abr12', '1')]

3条回答

网友

1楼 · 编辑于 2024-06-09 10:44:32

它归结为在组合: \d上拆分，没有别的（除了在这里和那里抑制前导和后导空格）。它所需要的只是一个不包含冒号:的任意长度的组，后跟该冒号，然后是一行数字。你知道吗

import re
s = 'Waz D: 5 l gu l: 5 GrinVe: 3 P LUK: 2 Cubbi: 1 2 nd dok: 1 maf 74: 1 abr12: 1 Waza D 5'

print (re.findall(r'([^:]+):\s*(\d+)\s+', s))

结果：

[('Waz D', '5'),
 ('l gu l', '5'),
 ('GrinVe', '3'),
 ('P LUK', '2'),
 ('Cubbi', '1'),
 ('2 nd dok', '1'),
 ('maf 74', '1'),
 ('abr12', '1')]

网友

2楼 · 编辑于 2024-06-09 10:44:32

贪婪地使用空格，不要把它放入匹配的组中。你知道吗

>>> import re
>>> s = 'Waz D: 5 l gu l: 5 GrinVe: 3 P LUK: 2 Cubbi: 1 2 nd dok: 1 maf 74: 1 abr12: 1 Waza D 5'
>>> 
>>> re.findall('([^:]+?):\s*(\d+)\s*', s)
[('Waz D', '5'), ('l gu l', '5'), ('GrinVe', '3'), ('P LUK', '2'), ('Cubbi', '1'), ('2 nd dok', '1'), ('maf 74', '1'), ('abr12', '1')]

网友

3楼 · 编辑于 2024-06-09 10:44:32

如果我们假设字符串后面总是跟一个分号空格数字空格序列，您可以这样做：

re.findall(r"(.+?):\s(\d+)\s", s)

[('Waz D', '5'),
 ('l gu l', '5'),
 ('GrinVe', '3'),
 ('P LUK', '2'),
 ('Cubbi', '1'),
 ('2 nd dok', '1'),
 ('maf 74', '1'),
 ('abr12', '1')]

相关问题更多 >

编程相关推荐

热门问题

热门文章

从字符串中提取名称和数字

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >