在python中用BeautifulSoup刮xpath

2022-07-06 11:06:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我在用python做一个webscraper。我想从一个网页,我有xPath的代码行。xPath是/html/body/div[2]/div[2]/svg/text[1]/tspan[4]

我可以到达div[2],但不能再往前走了。我的代码是:

one_a_tag = soup.findAll('div')[2]

如何到达xPath的目的地


Tags: 代码textsvgdiv网页htmltagbodyonexpathsoup目的地webscraperfindalltspan
1条回答
网友
1楼 ·

如果要使用xpath定位项,那么必须使用lxml方法

from lxml import html
import requests

URL = "Your page url here"
page = requests.get(URL)
tree = html.fromstring(page.content)

myItem = tree.xpath('/html/body/div[2]/div[2]/svg/text[1]/tspan[4]')
print(myItem)
print(myItem.text)