由于某些原因，数据只能带来部分而不是全部。不确定后台是否有动态数据

from selenium import webdriver driver = webdriver.Chrome() url = 'https://www.udemy.com/selenium-webdriver-with-python3/' driver.get(url) main_titles = driver.find_elements_by_class_name("lecture-title-text") sub_titles = driver.find_elements_by_class_name("title")

2条回答

网友

1楼 · 编辑于 2024-04-24 11:20:38

好的，我已经把评论中的建议看了一遍，已经解决了。我把它写在这里，以防将来有人想看看这个解决方案是怎么回事。你知道吗

1）使用建议，我发出了一个命令，点击“24个更多部分”展开选项卡，然后将其刮除，效果非常好！你知道吗

driver.find_element_by_class_name("js-load-more").click()
titles = driver.find_elements_by_class_name("lecture-title-text")
for each in titles:
    print (each.text)

这就扯掉了所有34个章节的标题。你知道吗

2）根据Matt的建议，我找到了WebElement，并使用get_属性（'textContent'）提取文本数据。有很多空格，所以我使用split（）只获取字符串。你知道吗

sub_titles = driver.find_elements_by_class_name("title")
for each in sub_titles:
    print (each.get_attribute('textContent').strip())

这把所有的头衔都扯了！你知道吗

网友

2楼 · 编辑于 2024-04-24 11:20:38

之所以你只得到前10节课，是因为只有前10节课显示。您可能已登录到浏览器，因此当您要签出它时，它会显示每个部分。但对我和你的刮刀来说，它只显示前10个。在查找标题之前，您需要单击.section-container more-sections按钮。你知道吗

至于title没有被正确地刮取的奇怪情况：这是因为当一个元素被隐藏时text属性总是未定义的，这就是为什么它只适用于第一个部分。我会尝试使用WebElement.get_attribute('textContent')来刮取文本。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章