我试图理解使用lxml提取文本的过程 尝试简单的python程序
from lxml import html
import requests
page = requests.get('http://www.foo bar')
tree = html.fromstring(page.content)
name = tree.xpath('//*[@id="yui_3_17_2_1_1487276887950_2408"]/div[@class="locu-menu-item-name"]/text')
print(name)
结果为[]
值对于嵌套标记,xpath为: //*[@id=“yui_3_17_2_1_1487276887950_103789”]/div[1]/div[1]
值是<div class="locu-menu-item-name">Italian Lemon Sorbetto</div>
是这样嵌套的
任何帮助都会很好。在
xpath中有错误。要获得文本,您应该在结尾使用}。所以您的xpath应该是这样的:
/text()
,而不是{当您使用
^{pr2}$/text
时,这意味着您正在查找嵌套的标记文本。在相关问题 更多 >
编程相关推荐