如何用Python从HTML代码中获取特定id？

-2 投票

1 回答

589 浏览

提问于 2025-04-17 13:55

我有很多HTML响应代码，其中有一部分是这样的：

</td>
</tr>
    <input id="hiddenloginurl" type="hidden" name="loginurl" value="/sensor.htm?id=10240">
</table>

我该如何用Python解析这些HTML代码并获取这个ID呢？问题是，每次新的API调用时，这个ID都会改变。

1 个回答

BeautifulSoup

Beautiful Soup 是一个很简单的工具，可以帮助你浏览、搜索和修改解析树。可以把它看作是一个用来分析文档并提取你需要内容的工具包。写一个应用程序所需的代码量不多。

Beautiful Soup 会自动把你输入的文档转换成 Unicode 格式，而输出的文档则会变成 UTF-8 格式。你不需要担心编码的问题，除非文档没有指定编码，而 Beautiful Soup 也无法自动识别。这种情况下，你只需要告诉它原始的编码是什么。

Beautiful Soup 是建立在流行的 Python 解析器之上的，比如 lxml 和 html5lib，这样你就可以尝试不同的解析方法，或者在速度和灵活性之间做出选择。

你也可以看看这个类似的问题：用 BeautifulSoup 提取属性值

inputTag = soup.find(attrs={"name": "stainfo"})
output = inputTag['value']

回答于 2025-04-17 由 Python大师

分享举报

如何用Python从HTML代码中获取特定id？

1 个回答

撰写回答