刮LinkedIn

names=[] for link in search_urls: url = link driver.get(url) html = driver.page_source index= html.find("<span class=\"name actor-name\"") html2=html[index:] while html2.find("<span class=\"name actor-name\"") != -1: index=html2.find("<span class=\"name actor-name\"") remaining=html2[index:] start=remaining.find(">") end=remaining.find("</") names.append(remaining[start+1:end]) remaining=remaining[end:] index=remaining.find("</span>") html2=remaining[index:]

1条回答

网友

1楼 · 发布于 2024-05-19 02:28:43

它使用scroll事件从ajax获得更多结果，使用.location_once_scrolled_into_view来滚动。在

names=[]

for link in search_urls:
    url = link
    driver.get(url)
    hasScroll = True
    while hasScroll:
        try:
            hasScroll = driver.find_element_by_css_selector('.search-result__occlusion-hint')
            hasScroll.location_once_scrolled_into_view
            # wait ajax request, increase if needed
            time.sleep(2)
        except:
            break

    # no more scrollable content, extract it
    actorNames = driver.find_elements_by_css_selector('.name.actor-name')
    names = [name.text for name in actorNames]

相关问题更多 >

编程相关推荐

热门问题

热门文章

刮LinkedIn

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >