Python爬虫html.fromstring

2024-05-19 00:24:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图用这个代码解析网页。在

ac = requests.get('link....')
html_text = ac.text
lx = html.fromstring(html_text)

当我运行这个代码时,我得到了这个错误

^{pr2}$

我找到了导致错误的html标记:

<ie:menuitem id="MSOMenu_Help" iconsrc="/_layouts/images/HelpIcon.gif" onmenuclick="MSOWebPartPage_SetNewWindowLocation(MenuWebPart.getAttribute('helpLink'), MenuWebPart.getAttribute('helpMode'))" text="Help" type="option" style="display:none">

</ie:menuitem>

Tags: 代码text网页gethtml错误linkhelp
1条回答
网友
1楼 · 发布于 2024-05-19 00:24:33

你找到了HTML标签来说明错误,但是你修复了吗?如果没有,请尝试以下操作:

ac = requests.get('link....') lx = html.fromstring(ac.content) valueOfHTMLTag = lx.xpath('//TAG[@class/id="Name"]/text()')

您在哪里换乘:

  • 标记中要获取其值的标记。在
  • 选择标记的类或id
  • 标记的id/类名

这将返回一个数组,其中包含该标记的值和正确的class/id

希望这有帮助!在

相关问题 更多 >

    热门问题