我正在使用Django开发一个书签应用程序,希望从使用javascript生成标题的网页中提取标题。我已经看过windmill并安装/运行了selenium,这很有用,但我相信这些工具不仅仅是获取网页标题所需的工具。我目前正在尝试使用spynner,但是在页面完全呈现后没有成功地检索内容。这是我目前拥有的代码。。。
from spynner import Browser
from pyquery import PyQuery
browser = Browser()
browser.set_html_parser(PyQuery)
browser.load("https://www.coursera.org/course/techcity")
在pythonshell中执行最后一行时,我收到一个SpynnerTimeout:Timeout reached:10秒错误。如果我再次执行最后一条语句,它将返回True,但只返回运行javascript之前的页面,它没有“正确”的页面标题。我还尝试了以下方法:
^{pr2}$但这也返回了不正确的标题-'Coursera.org网站'(即运行javascript之前的标题)。
以下是我的问题:
目前没有回答
相关问题 更多 >
编程相关推荐