试图让Selenium下载基于JavaScript的数据…我瘦了

import urllib.request from bs4 import BeautifulSoup url = "https://www.nissanusa.com/dealer-locator.html" text = urllib.request.urlopen(url).read() soup = BeautifulSoup(text) data = soup.findAll('div',attrs={'class':'dealer-info'}) for div in data: links = div.findAll('a') for a in links: print(a['href'])

1条回答

网友

1楼 · 发布于 2024-04-26 21:36:27

使用selenium打开/导航到页面，然后将页面源代码传递给BeautifulSoup

from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait
from bs4 import BeautifulSoup

browser = webdriver.Chrome()
wait = WebDriverWait(browser, 10)

url = 'https://www.nissanusa.com/dealer-locator.html'
browser.get(url)

time.sleep(10) // wait page open complete

html = browser.page_source
soup = BeautifulSoup(html, "html.parser")

data = soup.findAll('div',attrs={'class':'dealer-info'})
for div in data:
    links = div.findAll('a')
    for a in links:
        print(a['href'])

相关问题更多 >

编程相关推荐

热门问题

热门文章

试图让Selenium下载基于JavaScript的数据…我瘦了

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >