正则表达式搜索带有UUID的HTML标记

2024-03-28 10:15:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图将一个HTML标记与一个UUID属性id进行匹配。我用一个外部资源测试了它,以确保regex在相同的输入字符串中是正确的。UUID是动态提取的,因此需要替换字符串。你知道吗

我期望的输出是最后一行的打印:

<tr class="ref_row" id="b9060ff1-015d-4089-a193-8fef57e7c2ef">

这是我尝试的代码:

content = '<tbody><tr class="ref_row" id="b9060ff1-015d-4089-a193-8fef57e7c2ef"><td><b>01/08/2016 14:41:00</b></td>'
ref = 'b9060ff1-015d-4089-a193-8fef57e7c2ef'
regex = '<[^>]+?id=\"%s\"[^<]*?>' % ref
element_to_link = re.search(regex, content)
print element_to_link.string

打印时得到的输出是整个输入字符串,这表明regex不正确。这是怎么回事?你知道吗

请不要建议我使用美丽的汤,这应该是可能的正则表达式。你知道吗


Tags: to字符串refiduuidlinkelementcontent
2条回答

在Python re模块文档中,MatchObject.string属性返回“传递给match()或search()的字符串”。使用MatchObject的方法之一,如group()、groups()或groupdict()。你知道吗

你为什么不用分组法?这对我很有用:

element_to_link.group(0)

相关问题 更多 >