将HTMLsource作为一个HTML对象，并能够使用DOM操作在其中工作

driver = webdriver.Chrome() driver.get(url) mylist = [] my_tables = driver.find_elements_by_tag_name('table') #operation1 for tr in my_tables.find_elements_by_tag_name('tr'): #operation2 mylist.append(tr)

2条回答

网友

1楼 · 编辑于 2024-04-25 12:00:54

一段时间后，我找到了解决办法：

将文件转储为字符串并保存在本地html文件中
在本地打开html文件。你知道吗
如果你想回到网站，写driver.back()

网友

2楼 · 编辑于 2024-04-25 12:00:54

我不认为你能做你想做的仅仅用硒。Selenium“驱动”一个正在运行的web浏览器，如果浏览器中的Javascript每秒更新一次页面的内容，那么您将遇到这些计时问题。你知道吗

您可以使用Selenium驱动浏览器以字符串的形式获取页面HTML的快照（正如您在上一段中所描述的那样）。你知道吗

然后可以使用Beautiful Soup这样的库来解析HTML字符串并提取所需的数据。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

将HTMLsource作为一个HTML对象，并能够使用DOM操作在其中工作

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >