我有一些类似这样的HTML:
<ul>
<li>Item 1</li><br>
<li>Item 2</li><br>
<li>Item 3</li><br>
</ul>
<img src="someImage.png"><br>
我想用regex从<li>
标记和<img>
标记后面删除<br>
标记,尽管我不知道该怎么做。HTML不保持不变,因此图像和列表可能位于不同的位置,或者可能有其他内容,尽管在</li>
和</img>
之后总是有<br>
我可以用什么正则表达式来用python解决这个问题?谢谢。你知道吗
编辑:
我试着用这个(<img.+?>)<br>
来处理图像,但是没有用。你知道吗
我不想简单地删除所有的<br>
标记,因为在HTML中可能有一些有用的标记,而是希望删除列表项和图像之后的标记。你知道吗
以下是从列表中删除
<br>
的方法:对于图像来说也是一样的。你知道吗
这是删除
br
标记的一种方法:如果文档中有许多
br
标记,则必须将数据存储在如下变量中:然后这将删除整个
data
文档中的所有br
标记。你知道吗如果您只想删除
br
标记之后的li
标记,那么您可以这样做:无需使用正则表达式即可解决此问题(请在此处插入对传奇regex/html答案的引用):
相关问题 更多 >
编程相关推荐