用BeautifulSoup查找顶级标签

1 投票
1 回答
842 浏览
提问于 2025-04-17 00:04

我在研究一些BeautifulSoup的内容。在这个例子中,我的树结构看起来是这样的:

soup = "<table class="myTable"><tr>...</tr></table>"

当我调用下面的代码时:

soup.findAll(attrs={'class':'myTable'})

我没有得到任何返回,而我本来期待能返回那个顶层标签。但是如果我搜索的标签不在顶层,比如下面这个:

soup = "<body><table class="myTable"><tr>...</tr></table></body>"

那么我就能找到这个表格。我觉得我可能漏掉了什么明显的东西。如果没有的话,有没有办法找到所有内容,包括顶层标签呢?

1 个回答

1

我无法重现这个问题。我觉得找到最外层的标签应该是有效的:

In [92]: import BeautifulSoup
In [94]: soup=BeautifulSoup.BeautifulSoup('<table class="myTable"><tr>...</tr></table>')

In [95]: soup.findAll(attrs={'class':'myTable'})
Out[95]: [<table class="myTable"><tr>...</tr></table>]

撰写回答