我希望能够解析一个网页并返回标题中包含4个字母的任何元素。在
例如:
<li><a href="test.com/dogs" title="dogs"></a></li>
<li><a href="test.com/cat" title="cat"></a></li>
<li><a href="test.com/horse" title="horse"></a></li>
<li><a href="test.com/eels" title="eels"></a></li>
在本例中,我希望返回一个包含“dogs”和“eels”的数组,因为标题正好包含4个字符。我该怎么做呢?谢谢!在
您应该使用BeautifulSoup。在
使用它,您可以执行以下操作:
我知道解析html有被认为是不好的优点,但我确实喜欢staright forward方法。在
相关问题 更多 >
编程相关推荐