Selenium无法获取PDF链接的HTML

import os, sys, time, random import requests from selenium import webdriver from bs4 import BeautifulSoup url = 'https://mila.umontreal.ca/en/cours/deep-learning-summer-school-2017/slides' browser = webdriver.Chrome() browser.get(url) browser.implicitly_wait(3) html = browser.page_source links = browser.find_elements_by_class_name('flip-entry') print(links) browser.quit()

2条回答

网友

1楼 · 编辑于 2024-04-20 05:38:16

from bs4 import BeautifulSoup
from selenium import webdriver

url = 'https://mila.umontreal.ca/en/cours/deep-learning-summer-school-2017/slides'
browser = webdriver.Chrome()
browser.get(url)
browser.switch_to_frame(browser.find_element_by_class_name('iframe-class'))
links = browser.find_elements_by_class_name('.flip-entry a')
for link in links:
    print(link.get_attribute("href"))
browser.quit()

网友

2楼 · 编辑于 2024-04-20 05:38:16

原因是主页上没有链接。您正在IFrame中获取链接。这个IFrame指向https://drive.google.com/embeddedfolderview?hl=fr&id=0ByUKRdiCDK7-c0k1TWlLM1U1RXc#list

您可以直接在代码中浏览该URL，而不是在主页上。或者你可以切换到画面

browser.switch_to_frame(browser.find_element_by_class_name("iframe-class"))
links = browser.find_elements_by_css_selector('.flip-entry a')

for link in links:
    print(link.get_attribute("href"))

相关问题更多 >

编程相关推荐

热门问题

热门文章

Selenium无法获取PDF链接的HTML

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >