python中的Regex：匹配可选子字符串的副本

import re datasetName = "diskLineLuminosity:halpha:rest:z1.0:contam_NII:recent" M = re.search("^(disk|spheroid)LineLuminosity:([^:]+):([^:]+):z([\d\.]+)(:recent)?(:contam_[^:]+)?(:dust[^:]+)?",datasetName)

def getDatasetNameInformation(datasetName): INFO = re.search("^(disk|spheroid)LineLuminosity:([^:]+):([^:]+):z([\d\.]+)(:recent)?(:contam_[^:]+)?(:dust[^:]+)?",datasetName) if not INFO: raise ParseError("Cannot parse '"+datasetName+"'!") return INFO

2条回答

网友

1楼 · 编辑于 2024-04-26 03:52:31

您可以使用((?::contam_[^:]+)*)捕获所有这些contam_：这将在一个组中捕获所有这些contam_。然后启动第二个正则表达式，仅对该匹配应用它，并将该结果用作第一个结果中的嵌套列表：

import re
datasetName = "diskLineLuminosity:halpha:rest:z1.0:recent:contam_NII:contam_NII:dust"
M = re.search("^(disk|spheroid)LineLuminosity:([^:]+):([^:]+):z([\d\.]+)(?::(recent))?((?::contam_[^:]+)*)(?::(dust))?",datasetName)
lst = list(M.groups())
if lst[5]:
    lst[5] = re.findall(":contam_([^:]+)", lst[5])

print(lst)

输出：

['disk', 'halpha', 'rest', '1.0', 'recent', ['NII', 'NII'], 'dust']

网友

2楼 · 编辑于 2024-04-26 03:52:31

如果您仍在学习正则表达式（老实说，以后也一样），那么请养成尽可能多地使用verbose模式的习惯，这样可以生成更好的代码和更可读的表达式

也就是说，你可以

^
(disk|spheroid)
LineLuminosity:
([^:]+):
([^:]+):
z([\d\.]+)
((?::contam_[^:]+)+)?
(:recent)?
(:dust[^:]*)?

只是稍微改变了顺序，在contam部分中使用了一个非捕获组，请参见a demo on regex101.com

相关问题更多 >

编程相关推荐

热门问题

热门文章