提取没有类属性的元素

36 投票
2 回答
36292 浏览
提问于 2025-04-17 11:56

我需要找到一个特定类型的HTML元素。

不过,页面上有很多这种类型的元素,而且它们的类名各不相同。

我需要的是一个没有任何类属性的元素。

我应该找一个class == ''的元素,还是有其他方法呢?

2 个回答

17

Beautiful Soup 4.1.2 版本 开始,你可以使用 class_ 这个参数

如果你想选择一个没有类属性的元素,只需要指定 None

soup.find_all(class_=None)

另外,指定 False 也可以达到同样的效果:

soup.find_all(class_=False)
60

使用

soup.findAll(attrs={'class': None})

引用文档中的内容:

如果你需要对一些属性名进行限制,这些属性名是Python的保留字,比如class、for或者import;或者这些属性名是Beautiful Soup搜索方法中的非关键字参数,比如name、recursive、limit、text,或者attrs本身,你可以使用attrs。

撰写回答