我试图将一个HTML标记与一个UUID属性id
进行匹配。我用一个外部资源测试了它,以确保regex在相同的输入字符串中是正确的。UUID是动态提取的,因此需要替换字符串。你知道吗
我期望的输出是最后一行的打印:
<tr class="ref_row" id="b9060ff1-015d-4089-a193-8fef57e7c2ef">
这是我尝试的代码:
content = '<tbody><tr class="ref_row" id="b9060ff1-015d-4089-a193-8fef57e7c2ef"><td><b>01/08/2016 14:41:00</b></td>'
ref = 'b9060ff1-015d-4089-a193-8fef57e7c2ef'
regex = '<[^>]+?id=\"%s\"[^<]*?>' % ref
element_to_link = re.search(regex, content)
print element_to_link.string
打印时得到的输出是整个输入字符串,这表明regex不正确。这是怎么回事?你知道吗
请不要建议我使用美丽的汤,这应该是可能的正则表达式。你知道吗
在Python re模块文档中,MatchObject.string属性返回“传递给match()或search()的字符串”。使用MatchObject的方法之一,如group()、groups()或groupdict()。你知道吗
你为什么不用分组法?这对我很有用:
相关问题 更多 >
编程相关推荐