如何从中获取html硒.webdriver在Python中?

2024-04-27 00:10:41 发布

您现在位置:Python中文网/ 问答频道 /正文

谢谢你的关注,也为我糟糕的英语感到抱歉。你知道吗

当我在输入框中输入一些单词并单击.it就像:

  • 加载雅虎主页
  • 搜索“某物”(输入someword并单击按钮)
  • 获取返回html

mywebsit通过javaScrip返回消息

这是我的密码

browser = webdriver.Firefox()

browser.get('http://flvxz.com/')

input_box = browser.find_element_by_id("videoPageURI")  # Find the search box
button = browser.find_element_by_id("fetchButton")  # find the button

input_box.send_keys(url)  # input some string
button.click()  # click

那么,我怎样才能得到新的html呢?我试着如下,不工作。你知道吗

html = browser.find_element_by_tag_name('html').text();

我的问题:

  1. 如何获取html?你知道吗
  2. 有没有更好的方法或工具来做这项工作(我不喜欢它开放 窗口,但我喜欢它控制浏览器的方式?你知道吗

非常感谢你,我正在提高我的英语。。。你知道吗


Tags: thebrowserboxidinputbyhtmlit
1条回答
网友
1楼 · 发布于 2024-04-27 00:10:41

第1点。如何获取html代码:

首先,您可能需要等待页面完全加载(请参见this article

那么您只需访问page_source属性:

html = browser.page_source

第2点。有没有更好的方法:

据我所知,这是正确的方法,硒。 有其他方法可以在页面中找到所需的元素,但在性能方面不会有太大变化。你知道吗

如果您不需要看到实际显示的页面,我建议使用无头浏览器(例如PhantomJS)而不是Firefox

driver=webdriver.PhantomJS('your pahtomjs exe file location')

有关详细信息,请参见this SO QA 以及this tutorial如何用python设置PhantomJS

相关问题 更多 >