如何在selenium的多个剧集中找到剧集链接

episode_num = 1 chrome_driver = Chrome() chrome_driver.get("https://www.thewatchcartoononline.tv/anime/south-park-season-1") # This xpath takes you to the div of the episode list and then it search for a link which has a certain text in it links = chrome_driver.find_elements_by_xpath( f"//*[@id='sidebar_right3']//" f"a[contains(text(), 'Episode {episode_num}')]" )

2条回答

网友

1楼 · 编辑于 2024-06-02 04:31:05

尝试以下xpath。使用last（）选项，这将给出计数1

links = chrome_driver.find_elements_by_xpath("(//*[@id='sidebar_right3']//a[contains(text(), 'Episode {episode_num}')])[last()]")
print(len(links))

网友

2楼 · 编辑于 2024-06-02 04:31:05

编辑：

嗯，有点难看，但在Xpath 1.0中，我认为这是最好的选择

links = chrome_driver.find_elements_by_xpath(f"//*[@id='sidebar_right3']//a[(contains(., 'Episode {episode_num} ')) or (substring(text(), string-length(text()) - string-length('Episode {episode_num}') +1) = 'Episode {episode_num}') or (contains(., 'Episode {episode_num}-')) ]")

为episode_num = 10查找第10-11集，但不为episode_num = 11查找第10-11集

检查：

是Episode x在text()
text()以Episode x结尾
是Episode x-在text()

我正在检查这些剧集的网址。依赖@href而不是text()不是更好的方法吗？这稍微短一点：

links = chrome_driver.find_elements_by_xpath(f"//*[@id='sidebar_right3']//a[(contains(@href, 'episode-{episode_num}-')) or (substring(@href, string-length(@href) - string-length('episode-{episode_num}') +1) = 'episode-{episode_num}')]")

检查：

是episode-x-在url中吗
url以episode-x结尾

相关问题更多 >

编程相关推荐

热门问题

热门文章