这是我的代码:
from lxml import html
import requests
page = requests.get('https://en.wikipedia.org/wiki/Nabucco')
tree = html.fromstring(page.content)
title = tree.xpath('//*[@id="mw-content-text"]/table[1]/tbody/tr[1]/th/i')
print(title)
问题:print(title)打印“[]”,空列表。我希望这上面印着“纳布科”。XPath表达式来自Chrome检查器“Copy XPath”函数。在
为什么这个没用?lxml和Chrome的xpath引擎之间是否存在分歧?还是我错过了什么?我对python、lxml和xpath有些陌生。在
这是因为
tbody
标记。您可以在浏览器中看到它,因为标记是inserted by the browser.requests
不是浏览器,只需按原样下载页面源:替换:
有:
^{pr2}$相关问题 更多 >
编程相关推荐