Python&beautifulsoup4/Selenium无法从kicksusa.com？

import requests import csv import io import os import re from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.webdriver.chrome.options import Options from datetime import datetime from bs4 import BeautifulSoup data1 = requests.get('https://www.kicksusa.com/') soup1 = BeautifulSoup(data1.text, 'html.parser') button = soup1.find('span', attrs={'class': 'shop-btn'}).text.strip() print(button)

3条回答

网友

1楼 · 编辑于 2024-04-26 05:10:32

请试试下面的方法代码。它应该返回你的文本巴顿。希望这个帮助。在

from selenium import webdriver
options = webdriver.ChromeOptions()
options.add_argument(' headless')
options.add_argument(" start-maximized")
options.add_argument(' disable-browser-side-navigation')
options.add_argument('window-size=1920x1080');
driver = webdriver.Chrome(chrome_options=options)
driver.get('https://www.kicksusa.com/')
url = driver.find_element_by_css_selector("span.shop-btn")
print(driver.execute_script("return arguments[0].innerHTML", url))

网友

2楼 · 编辑于 2024-04-26 05:10:32

对于需要重复的链接，可以使用下面的css选择器限制为每对链接中的第一个

#products-grid .item [href]:first-child

即

^{pr2}$

网友

3楼 · 编辑于 2024-04-26 05:10:32

问题是您被检测为bot并得到如下响应：

<html style="height:100%">
    <head>
        <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
        <meta name="format-detection" content="telephone=no">
        <meta name="viewport" content="initial-scale=1.0">
        <meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1">
        <script type="text/javascript" src="/_Incapsula_Resource?SWJIYLWA=719d34d31c8e3a6e6fffd425f7e032f3"></script>
    </head>
    <body style="margin:0px;height:100%">
    <iframe src="/_Incapsula_Resource?CWUDNSAI=20&xinfo=5-36224256-0%200NNN%20RT%281552245394179%20277%29%20q%280%20-1%20-1%200%29%20r%280%20-1%29%20B15%2811%2c110765%2c0%29%20U2&incident_id=314001710050302156-195663432827669173&edet=15&cinfo=0b000000"
            frameborder=0 width="100%" height="100%" marginheight="0px" marginwidth="0px">Request unsuccessful. Incapsula
        incident ID: 314001710050302156-195663432827669173
    </iframe>
    </body>
</html>

请求和美化团队

如果要使用requests和bs，请从浏览器开发工具visid_incap_和{}从请求头复制到{}，并在{}中使用它们：

^{pr2}$

硒

当您运行Selenium时，有时会得到相同的响应：

重新加载页面对我有用。尝试以下代码：

from selenium import webdriver

driver = webdriver.Chrome()
driver.get('https://www.kicksusa.com/')

if len(driver.find_elements_by_css_selector("[name=ROBOTS]")) > 0:
    driver.get('https://www.kicksusa.com/')

shop_buttons = driver.find_elements_by_css_selector("span.shop-btn")
for button in shop_buttons:
    print(button.text)

请求和美化团队

硒

相关问题更多 >

编程相关推荐

热门问题

热门文章