在BeautifulSoup中匹配标签

1 投票

2 回答

551 浏览

提问于 2025-04-15 15:47

我正在尝试计算从BeautifulSoup结果中得到的“soup”里的标签数量。我想用正则表达式来实现，但遇到了一些问题。

reg_exp_tag = re.compile("<[^>*>")
tags = re.findall(reg_exp_tag, soup(cast as a string))

但是使用re时，reg_exp_tag却不行，出现了意外的正则表达式结束错误。

如果有人能帮忙，我将非常感激！

谢谢

正则表达式错误处理 html解析 beautifulsoup 标签匹配

2 个回答

如果你已经用BeautifulSoup解析过HTML了，为什么还要再解析一次呢？试试这个：

num_tags = len(soup.findAll())

回答于 2025-04-15 由 Python大师

分享举报

难道应该是 "<[^>]*>" 而不是 "<[^>*>" 吗？

（这个类需要用一个 ] 来结束）

回答于 2025-04-15 由 Python大师

分享举报