我正试图拉的标题和链接,每个所谓的抽奖名单在这个网站上。然而,当我试图搜集这些数据时,似乎找不到。你知道吗
我已经尝试过删除页面上的所有链接,但我认为这些“框”可能是通过javascript加载的。你知道吗
我收到的结果是一些与我想得到的无关的链接。应该有40+链接显示在这个列表中,但大多数没有显示。任何帮助都是很好的,我在这上面呆了一段时间
由于某些原因,在我进行刮除时,此链接和其他许多链接没有显示:
我的代码:
def raffle_page_collection():
chrome_driver()
page = requests.get('https://www.soleretriever.com/yeezy-boost-350-v2-black/')
soup = BeautifulSoup(page.text,'html.parser')
product_header = soup.find('h1').text
product_colorway = soup.find('h2').text
product_sku_and_release_date_and_price = soup.find('h3').text
container = soup.find(class_='main-container')
raffles = container.find_all('a')
raffle_list = []
for items in raffles:
raffle_list.append(items.get('href'))
print(raffle_list)
你应该试试图书馆。它允许您删除动态呈现请求(js或ajax)页面数据。你知道吗
试试这个:
订单号:
对于chrome浏览器:
http://chromedriver.chromium.org/downloads
为chrome浏览器安装web驱动程序:
https://christopher.su/2015/selenium-chromedriver-ubuntu/
硒教程
https://selenium-python.readthedocs.io/
相关问题 更多 >
编程相关推荐