擅长:python、mysql、java
<p>如果我必须使用正则表达式,我会使用类似</p>
<pre><code><a href.*?><u>(.*?)<\/u><\/a>
</code></pre>
<p>然后替换为列表理解</p>
^{pr2}$
<p>但是考虑使用<code>beautifulsoup</code>或其他html解析器,正如其他答案中所指出的那样,这将为您提供一个更通用的解决方案</p>
<h2>正则表达式解释</h2>
<ul>
<li><code><a href.*?></code>匹配<code>a href</code>标记,非贪心,直到第一个右括号</li>
<li><code><u></code>匹配u标记</li>
<li><code>(.*?)</code>匹配要保留的字符串</li>
<li><code><\/u><\/a></code>匹配结束标记</li>
</ul>