我有一个包含以下元素的HTML网页:
<div class="content_page">
<a href="/earth" class="nametessera" >earth</a>
</div>
<div class="content_page">
<a href="/world" class="nametessera" >world</a>
</div>
<div class="content_page">
<a href="/planet" class="nametessera">planet</a>
</div>
...
我需要找回地球,世界,行星等等。 所以我需要用类“nametsera”检索标签A的所有链接。在
如何使用python实现这一点?在
简短回答:
使用beautifulSoup解析页面,获取URL,然后使用urlib2或pycurl下载提到的URL。在
[编辑:]
添加到下面的示例中,但只使用div中包含的href
同样,你也可以这样做
^{pr2}$使用Beautiful Soup解析HTML。在
文档是here。在
相关问题 更多 >
编程相关推荐