如何从网页中检索这些元素？

<div class="content_page"> <a href="/earth" class="nametessera" >earth</a> </div> <div class="content_page"> <a href="/world" class="nametessera" >world</a> </div> <div class="content_page"> <a href="/planet" class="nametessera">planet</a> </div> ...

2条回答

网友

1楼 · 编辑于 2024-04-24 14:40:45

简短回答：

使用beautifulSoup解析页面，获取URL，然后使用urlib2或pycurl下载提到的URL。在

[编辑：]

添加到下面的示例中，但只使用div中包含的href

>>> alldiv = soup.findAll('div', { "class" : "content_page" })
>>> for div in alldiv: print div.a
... 
<a href="/earth" class="nametessera">earth</a>
<a href="/world" class="nametessera">world</a>
<a href="/planet" class="nametessera">planet</a>
>>> for div in alldiv: print div.a['href']
... 
/earth
/world
/plan

同样，你也可以这样做

^{pr2}$

网友

2楼 · 编辑于 2024-04-24 14:40:45

使用Beautiful Soup解析HTML。在

文档是here。在

编程相关推荐

java使用和返回方法
java如何为安卓开发设置eclipse？
java为泛型类中的通配符传递任何具体类都会产生错误。为什么？
带有正则表达式过滤器的MongoDB Java驱动程序聚合
运行使用OPENQUERY访问链接服务器的TSQL查询时出现java JDBC错误
java使用GZIP、JSON响应和JQuery
java如何使用onSaveInstanceState保存复选框状态
在Java中根据XSD 1.1验证XML时出错
如何在Java中以编程方式运行GlueGen发射器？
Java PathIterator如何准确计算形状对象的中心？

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从网页中检索这些元素？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >