擅长:python、mysql、java
<p>为此目的使用正则表达式是错误的方法。因为您使用的是python,所以有一个非常棒的库可以从HTML文档中提取部分:<a href="http://www.google.ch/url?sa=t&source=web&cd=1&ved=0CCcQFjAA&url=http://www.crummy.com/software/BeautifulSoup/&rct=j&q=beautifulsoup&ei=RCOUTvXVOeff4QS3htCqCA&usg=AFQjCNHAxwplurFOBqg5cehWQEVKi-TuLQ&cad=rja" rel="nofollow">BeautifulSoup</a>。</p>