使用lxm解析HTML中的段落

2024-04-29 14:51:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我不熟悉lxml,希望从给定的url中提取<p>PARAGRAPHS</p>和{},并将它们用于进一步的步骤。在

我以post中的一个示例为例,尝试了以下代码,但运气不佳:

html = lxml.html('http://www.google.com/intl/en/about/corporate/index.html')
url = 'http://www.google.com/intl/en/about/corporate/index.html'
print html.parse.xpath('//p/text()')

我试图查看lxml.html中的示例,但没有找到任何使用url的示例。在

你能告诉我我该用什么方法吗?谢谢。在


Tags: comhttpurl示例indexhtmlwwwgoogle