擅长:python、mysql、java
<p>您可以使用<a href="http://www.crummy.com/software/BeautifulSoup/" rel="nofollow">Beautiful Soup</a>来完成这类任务。它非常简单,易于安装,并且有大量文档。</p>
<p>您的示例中有一些li标记未关闭。我已经做了更正,这是如何得到所有的李标签</p>
<pre><code>from bs4 import BeautifulSoup
var = '''<li> <a href="/...html">Energy</a></li>
<ul>
<li><a href="/...html">Coal</a></li>
<li><a href="/...html">Oil </a></li>
<li><a href="/...html">Carbon</a></li>
<li><a href="/...html">Oxygen</a></li>'''
soup = BeautifulSoup(var)
for a in soup.find_all('a'):
print a.string
</code></pre>
<p>它将打印:</p>
<blockquote>
<p>Energy<br/>
Coa<br/>
Oil<br/>
Carbon<br/>
Oxygen<br/></p>
</blockquote>
<p>有关文档和更多示例,请参见美化组<a href="http://www.crummy.com/software/BeautifulSoup/bs4/doc/" rel="nofollow">doc</a></p>