我正在尝试解析一个html页面,我已经成功地到达了htmldom树的子区域,但是我被困在了一个有span标记的地方。你知道吗
示例:我最初对页面进行如下解析:
user_url = base_url + str(user_id) + "/" + display_name
user_page = urllib2.urlopen(user_url)
souping_page = bs(user_page)
badges = souping_page.body.find('div', attrs={'class': 'badges'})
徽章会给我以下信息:
<span><span title="3 gold badges"><span class="badge1"></span><span class="badgecount">3</span></span><span title="23 silver badges"><span class="badge2"></span><span class="badgecount">23</span></span><span title="43 bronze badges"><span class="badge3"></span><span class="badgecount">43</span></span></span>
但是我试图通过遍历dom结构来提取<span title="3 gold badges">
和所有其他span title
属性。我怎么能在美丽之路做到这一点。你知道吗
您可以简单地执行以下操作:
相关问题 更多 >
编程相关推荐