用BeautifulSoup查找顶级标签
我在研究一些BeautifulSoup的内容。在这个例子中,我的树结构看起来是这样的:
soup = "<table class="myTable"><tr>...</tr></table>"
当我调用下面的代码时:
soup.findAll(attrs={'class':'myTable'})
我没有得到任何返回,而我本来期待能返回那个顶层标签。但是如果我搜索的标签不在顶层,比如下面这个:
soup = "<body><table class="myTable"><tr>...</tr></table></body>"
那么我就能找到这个表格。我觉得我可能漏掉了什么明显的东西。如果没有的话,有没有办法找到所有内容,包括顶层标签呢?
1 个回答
1
我无法重现这个问题。我觉得找到最外层的标签应该是有效的:
In [92]: import BeautifulSoup
In [94]: soup=BeautifulSoup.BeautifulSoup('<table class="myTable"><tr>...</tr></table>')
In [95]: soup.findAll(attrs={'class':'myTable'})
Out[95]: [<table class="myTable"><tr>...</tr></table>]