我编写了一个简单的爬行程序来craw“http://fortune.com/fortune500/”,并希望获得<option value = "...">...</option>
的值,但是当使用webelement.文本要获取带有标记名(“option”)的内容,则不显示任何内容。我想知道为什么?谁能帮我解决这个问题?在
# -*- coding: utf-8 -*-
import mechanize
from bs4 import BeautifulSoup
import re
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.ui import Select
from selenium.common.exceptions import NoSuchElementException
from selenium.common.exceptions import NoAlertPresentException
import unittest, time, re
#-----------selenium part(ignored)----------------#
browser = webdriver.Chrome() # Get local session of firefox
browser.get("http://fortune.com/fortune500/")
time.sleep(1) # Let the page load, will be added to the API
industry_button = browser.find_element_by_name('filters[Industry]')
print industry_button
count = 0;
industry_value = industry_button.find_elements_by_tag_name('option')
for number in industry_value:
count += 1
print number
print count
Selenium使处理} class 提供了一个易于使用的接口。例如,
select->option
HTML结构变得容易——有一个^{.options
将列出所有可用的选项。对于每个选项,您可以获得.text
来获取内部HTML,或者.get_attribute('value')
来获取value
属性的值。在另外,显式地等待切换按钮出现,而不是
time.sleep()
。在印刷品:
^{pr2}$.text
返回该元素的innerHTML
,而不是值。您想要得到value
属性。在可能是周围的东西:
相关问题 更多 >
编程相关推荐