擅长:python、mysql、java
<p>为了提取标语的内容:</p>
<pre><code> <a href="/sitemap">Sitemap</a>
</code></pre>
<p>。。。我会用:</p>
<pre><code> >>> import re
>>> s = '''
<div id=hotlinklist>
<a href="foo1.com">Foo1</a>
<div id=hotlink>
<a href="/">Home</a>
</div>
<div id=hotlink>
<a href="/extract">Extract</a>
</div>
<div id=hotlink>
<a href="/sitemap">Sitemap</a>
</div>
</div>'''
>>> m = re.compile(r'<a href="/sitemap">(.*?)</a>').search(s)
>>> m.group(1)
'Sitemap'
</code></pre>