我试图从一个网页上找出一个数字,特别是目前的总统支持率来自RealClearPolitics。在
下面是我使用的代码,尝试使用urllib2获取网页,lxml解析它,并使用chrome报告的xpath。问题是,我最后得到的只是一张空名单。在
import urllib2
from lxml import etree
url = "http://www.realclearpolitics.com/epolls/other/president_obama_job_approval-1044.html"
page = urllib2.urlopen(url)
tree = etree.parse(page.content, etree.HTMLParser())
rcp=tree.xpath('//*[@id="polling-data-rcp"]/table/tbody/tr[2]/td[4]')
print rcp
任何帮助都将不胜感激!在
tr[2]/td[4]
不对。参见:因此您需要使用正确的XPath查询:
Python代码是:
输出:
^{pr2}$相关问题 更多 >
编程相关推荐