具有多个捕获组的正则表达式与定义的不匹配

网友

1楼 · 编辑于 2024-06-11 15:47:38

你可以做：

re.search(r'^\s*\([^\s]*\s+([^\s]+)\s+', line).group(1)

^\s*\([^\s]*\s+匹配从开始Turkey之前的部分
([^\s]+)匹配Turkey并将其放入捕获的组中，然后\s+匹配一个或多个空格

示例：

>>> line = "    (aka Turkey (1955)) (USA) (short title)"
>>> re.search(r'^\s*\([^\s]*\s+([^\s]+)\s+', line).group(1)
'Turkey'

网友

2楼 · 编辑于 2024-06-11 15:47:38

改变一下你所拥有的：

使用(.*)而不是([^\(]*?)\s*这将捕获到开头的所有内容(甚至多个单词。你知道吗

你忘了在年组开始前逃过开篇(。你知道吗

regex = r'\s*\(aka\s*([^\(]*?)\s*\((?:19|20)[0-9][0-9])'
#

然而，要使用一个更简单的模式，并考虑到Wolf的评论，并且认为像您试图捕捉的标题一般不止一个词，您可以使用：

regex = r'\(aka\s*([^\(]*?)\s*\('
# or:
regex = r'\(aka\s*([\w\s]*?)\s*\('

网友

3楼 · 编辑于 2024-06-11 15:47:38

r'\s*\(aka\s(.*)\s((?:19|20)[0-9][0-9])'的问题是，你不能在一年中用括号转义。如果您使用：r'\s*\(aka\s(.*)\s*\((?:19|20)[0-9][0-9]\)'，您将匹配“Turkey”，因此我建议使用类似r'\s*\(aka\s([^\s]*)\s*\((?:19|20)[0-9][0-9]\)'的内容。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

具有多个捕获组的正则表达式与定义的不匹配

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >