擅长:python、mysql、java
<p>根据@tauran发布的内容,你可能想做这样的事情:</p>
<pre><code>from HTMLParser import HTMLParser
class MyHTMLParser(HTMLParser):
def print_p_contents(self, html):
self.tag_stack = []
self.feed(html)
def handle_starttag(self, tag, attrs):
self.tag_stack.append(tag.lower())
def handle_endtag(self, tag):
self.tag_stack.pop()
def handle_data(self, data):
if self.tag_stack[-1] == 'p':
print data
p = MyHTMLParser()
p.print_p_contents('<p>test</p>')
</code></pre>
<p>现在,您可能希望将所有<code><p></code>内容推送到一个列表中,并作为结果或类似的其他内容返回该列表。</p>
<p>TIL:在使用这样的库时,您需要考虑使用<strong>堆栈</strong>!</p>