Python regex get在模式中出现次数为零或更多

import re path = "C:/Projects/foo/dev/model/props/furniture/couch/data/fbx" regex = re.compile("(.+)/dev/model/(.+)/(.+)/data/fbx") m = regex.search(path) if m: print m.groups() # ('C:/Projects/foo', 'props/furniture', 'couch')

import re path = "C:/Projects/foo/dev/model/props/furniture/couch/data/fbx" regex = re.compile(r"""((?:^(?:[\w:]+/?)+)|(?:(?<=/)(?:[\w]+/?)+))/dev/model/""") print 'search start' m = regex.search(path) print 'search done' if m: print 'match', m, m.groups() else: print 'no match'

3条回答

网友

1楼 · 编辑于 2024-05-16 18:52:24

regexp中的[]不会对regexp进行分组。它用于指定字符类。

也许这会奏效-

\w*/{0,10}

对于分组，只需使用()

(\w*/){0,10}

编辑

基于您编辑的问题，我认为您需要的是0-3次目录名匹配，然后一个文件名也匹配。

假设文件名中只有字母（并且可选的扩展名不超过三个字符）

^((?:[:\w]+/){0,3})(\w+(?:\.\w{1,3})?)?$

这个很大，但可以分成两部分

这是你已经有的

((?:[:\w]+/){0,3})

还有我要补充的

(\w+(?:\.\w{1,3})?)?

这是结尾的可选文件名。（如果不是可选的，可以删除最后一个?）。文件名本身可以只由字母组成，也可以有最多3个字符的扩展名

添加^和$将停止虚假匹配

>>> pat=re.compile('^((?:[:\w]+/){0,3})(\w+(?:\.\w{1,3})?)?$')
>>> my_str='fwefw/wfwf/wefwf/dde.cdf'
>>> pat.search(my_str).groups()
('fwefw/wfwf/wefwf/', 'dde.cdf')
>>> my_str='fwefw/dde.cdf'
>>> pat.search(my_str).groups()
('fwefw/', 'dde.cdf')

网友

2楼 · 编辑于 2024-05-16 18:52:24

相反，由于catastrophic backtracking的原因，这个过程非常缓慢

((?:^(?:[\w:]+/?)+)|(?:(?<=/)(?:[\w]+/?)+))/dev/model/

试试这个

(^[\w:]+(?:/\w+)*|(?<=/)\w+(?:/\w+)*)/dev/model/

或者这个

(^[\w:]+[\w/]*|(?<=/)[\w/]+)/dev/model/

您可能需要考虑一种方法，首先使用re.match和(\w:)?(/\w+)+$等模式验证字符串

然后，当您已经可以期望某个结构时，可以使用更简单的regex来提取数据：

/?([^/]*(?:/[^/]+)*)/dev/model/

网友

3楼 · 编辑于 2024-05-16 18:52:24

你不能像这里那样把[]放在[]里面。相反，你想用括号来分组。

试试这个：

>>> re.match(r'(\w*/){0,10}', 'abc/def/ghi/').group()
'abc/def/ghi/'

相关问题更多 >

编程相关推荐

热门问题

热门文章