为什么在无头模式下，所有的HTML都不会被删除？

options = webdriver.ChromeOptions() options.add_argument("headless") driver = webdriver.Chrome(<chromedriver path>, chrome_options=options) driver.get("https://www.atptour.com/en/rankings/singles") html = driver.page_source soup = bs(html, "html.parser") dropdown = soup.find("ul", class_="dropdown")

2条回答

网友

1楼 · 编辑于 2024-05-28 23:15:24

如果将该html（通过无头模式返回）打印到文件并在浏览器中打开，您将看到：

因此，您的交互被验证码阻止。为什么chrome中的无头模式被阻止，而常规模式则不被阻止？不知道，他们的识别算法就是这样工作的

网友

2楼 · 编辑于 2024-05-28 23:15:24

Headless使用以下命令运行不同的用户代理，修复了由于机器人检测而导致的错误。另外，添加窗口大小可以使查找元素更加安全

options.add_argument(" window-size=1920,1080")
agent="Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1866.237 Safari/537.36"
options.add_argument(f'user-agent={agent}')

相关问题更多 >

编程相关推荐

热门问题

热门文章