提取没有类属性的元素
我需要找到一个特定类型的HTML元素。
不过,页面上有很多这种类型的元素,而且它们的类名各不相同。
我需要的是一个没有任何类属性的元素。
我应该找一个class == ''
的元素,还是有其他方法呢?
2 个回答
17
从 Beautiful Soup 4.1.2 版本 开始,你可以使用 class_
这个参数。
如果你想选择一个没有类属性的元素,只需要指定 None
:
soup.find_all(class_=None)
另外,指定 False
也可以达到同样的效果:
soup.find_all(class_=False)
60
使用
soup.findAll(attrs={'class': None})
引用文档中的内容:
如果你需要对一些属性名进行限制,这些属性名是Python的保留字,比如class、for或者import;或者这些属性名是Beautiful Soup搜索方法中的非关键字参数,比如name、recursive、limit、text,或者attrs本身,你可以使用attrs。