如何通过标记匹配删除元素

2022-08-10 13:43:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我想从存储html的变量中删除由特定元素/类包围的部分,但我不知道如何删除。你知道吗

例如,以下html文档存储在变量“content”中

<div class="content">
  <h1>content</h1>
  <p>content<p>
  <p>content</p>
<div>

<!-- want to delete from here -->
<div class="Footer">
 <div class=Footer-item>
  ...
  ...

 </div>
</div>

我试着实现如下

from urllib.parse import urlparse

newcontent = content.find("div", {"class":"Footer"}).extract()

但是,发生了以下错误

TypeError: slice indices must be integers or None or have an __index__ method

如果你有好的解决办法,请告诉我。你知道吗


Tags: ortofrom文档div元素herehtmlcontentitemdeleteh1classfooterwant