擅长:python、mysql、java
<p>您可以使用正则表达式进行简单的解析,但这取决于您到底想要什么。在</p>
<p>您可以使用类似于:</p>
<pre><code><t = html text>
import re
for f in re.findall('([a-zA-Z0-9]+\.jpg)[^\.]',t):
print f
</code></pre>
<p>要在当前列表中查找任何jpg文件,但如果文件名有<code>.</code>,则必须修改regex。在</p>
<p>如果不需要重复项,可以将其包装在一个集合中,例如:</p>
^{pr2}$
<p>正则表达式说明:</p>
<pre><code>[a-zA-z0-9]+
</code></pre>
<p>这将选择一个或多个字符的任意序列,即字母或数字。在</p>
<pre><code>\.jpg
</code></pre>
<p>这将选择确切的字符串<code>.jpg</code></p>
<pre><code>[^\.]
</code></pre>
<p>这意味着下一个字符不能是<code>.</code></p>
<p>除了最后一部分之外的所有内容的括号都是正则表达式选择的所有内容。在</p>