我有下面的代码来刮网站,这是没有问题的,然后我只想使用硒,所以我把代码改成这个,然后我有错误,我不知道为什么,有人帮我吗?在
在webdriver.PhantomJS()错误
Exception: Message: {"errorMessage":"Element does not exist in cache"
在网络驱动程序.Chrome()错误:
^{pr2}$仅硒代码
driver = webdriver.Chrome() # or webdriver.PhantomJS()
a = driver.find_elements_by_css_selector(findTag + "." + findValue + " a")
img = driver.find_elements_by_css_selector(findTag + "#" + findValue + "img")
href = a.get_attribute('href')
src = img.get_attribute("src")
硒+美容组代码:
driver = webdriver.Chrome() # or webdriver.PhantomJS()
soup = bs4.BeautifulSoup(driver.page_source, "html.parser")
a = soup.find(findTag, class_=findValue).find_all("a")
img = soup.find(findTag, id=findValue).find_all("img")
href = a.get("href")
src = img.get("src")
你尝试过等待吗?具体如下:
希望这有帮助:)
关于等待:http://selenium-python.readthedocs.io/waits.html
编辑:不是等待问题
只需导航到selenium页面,输入您的凭证,然后使用beauthoulsoup来刮取页面。那就没事了:)
^{pr2}$输出:
相关问题 更多 >
编程相关推荐