Python正则表达式在连字符后查找非数字范围的匹配组，如果范围不存在，则忽略模式的其余部分

3条回答

网友

1楼 · 编辑于 2024-04-26 18:11:11

您可以使用re.findall：

import re
s = ['v1.1.2-beta.2.zip', 'v1.1.2.zip']
final_results = [re.findall('[a-zA-Z]{1}[\d\.]+|(?<=\-)[a-zA-Z]+|\d+(?=\.zip)', i) for i in s]
groupings = ["{}\n{}".format(a, '\n'.join(f'Group {i}: {c}' for i, c in enumerate(b, 1))) for a, b in zip(s, final_results)]
for i in groupings:
  print(i)
  print('-'*10)

输出：

v1.1.2-beta.2.zip
Group 1: v1.1.2
Group 2: beta
Group 3: 2
     
v1.1.2.zip
Group 1: v1.1.2.

注意，从re.findall得到的结果是：

[['v1.1.2', 'beta', '2'], ['v1.1.2.']]

网友

2楼 · 编辑于 2024-04-26 18:11:11

下面是我将如何使用re.search来处理这个问题。请注意，这里不需要四处查看；只需要一个相当复杂的模式就可以了。你知道吗

import re

regex = r"(v\d+(?:\.\d+)*)(?:-(\w+)\.(\d+))?\.zip"

str1 = "v1.1.2-beta.2.zip"
str2 = "v1.1.2.zip"
match = re.search(regex, str1)

print(match.group(1))
print(match.group(2))
print(match.group(3))

print("\n")
match = re.search(regex, str2)

print(match.group(1))

v1.1.2
beta
2

v1.1.2

Demo

如果您对regex没有太多的经验，那么提供每个步骤的解释可能不会让您跟上进度。不过，我将对一些括号中出现的?:的用法进行评论。在这种情况下，?:告诉regex引擎而不是捕获内部内容。我们这样做是因为您只想捕获（最多）三个特定的内容。你知道吗

网友

3楼 · 编辑于 2024-04-26 18:11:11

我们可以使用以下正则表达式：

(v\d+(?:\.\d+)*)(?:[-]([A-Za-z]+))?((?:\.\d+)*)\.zip

这样就产生了三个组：第一组是版本，第二组是可选的：破折号-后跟字母字符，然后是可选的点序列，后跟数字，最后是.zip。你知道吗

如果我们忽略了\.zip后缀（我假设这是很普通的），那么仍然有三个组：

(v\d+(?:\.\d+)*)：以v开头，后跟\d+（一个或多个数字）的正则表达式组。然后我们有一个非捕获组（一个以(?:..)开始的组，它捕获\.\d+一个点，后跟一个或多个数字序列。我们重复这样的子组零次或多次。你知道吗

(?:[-]([A-Za-z]+))?：以连字符[-]开始，然后是一个或多个[A-Za-z]字符的捕获组。但是，capture组是可选的（末尾的?）。你知道吗

((?:\.\d+)*)：又有这样的\.\d+非捕获子群的群，所以我们捕获一个点，后跟一个数字序列，这个模式被重复零次或多次。你知道吗

例如：

rgx = re.compile(r'(v\d+(?:\.\d+)*)([-][A-Za-z]+)?((?:\.\d+)*)\.zip')

然后我们得到：

>>> rgx.findall('v1.1.2-beta.2.zip')
[('v1.1.2', '-beta', '.2')]
>>> rgx.findall('v1.1.2.zip')
[('v1.1.2', '', '')]

Demo

相关问题更多 >

编程相关推荐

热门问题

热门文章