用XPath获取(X)HTML文档中meta元素的charset属性

0 投票

1 回答

763 浏览

提问于 2025-04-16 15:27

我正在用Python做一些网页抓取的工作。不过，正如你所知道的，有些网页使用不同的字符编码。我需要获取这些网页的字符编码。简单来说，对于lxml来说，什么是xpath模式？

谢谢。

lxml xpath 网页抓取 charset

1 个回答

这个：

/html/head/meta[@http-equiv='Content-Type']/@content

HTML5：

/html/head/meta/@charset

回答于 2025-04-16 由 Python大师

分享举报