如何用Python从HTML代码中获取特定id?

-2 投票
1 回答
589 浏览
提问于 2025-04-17 13:55

我有很多HTML响应代码,其中有一部分是这样的:

</td>
</tr>
    <input id="hiddenloginurl" type="hidden" name="loginurl" value="/sensor.htm?id=10240">
</table>

我该如何用Python解析这些HTML代码并获取这个ID呢?问题是,每次新的API调用时,这个ID都会改变。

1 个回答

0

BeautifulSoup

Beautiful Soup 是一个很简单的工具,可以帮助你浏览、搜索和修改解析树。可以把它看作是一个用来分析文档并提取你需要内容的工具包。写一个应用程序所需的代码量不多。

Beautiful Soup 会自动把你输入的文档转换成 Unicode 格式,而输出的文档则会变成 UTF-8 格式。你不需要担心编码的问题,除非文档没有指定编码,而 Beautiful Soup 也无法自动识别。这种情况下,你只需要告诉它原始的编码是什么。

Beautiful Soup 是建立在流行的 Python 解析器之上的,比如 lxml 和 html5lib,这样你就可以尝试不同的解析方法,或者在速度和灵活性之间做出选择。

你也可以看看这个类似的问题: 用 BeautifulSoup 提取属性值

inputTag = soup.find(attrs={"name": "stainfo"})
output = inputTag['value']

撰写回答