如何用靓汤寻找节点

2024-05-08 00:03:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个html代码:

<table>
<tr>
   <td><table><tr><td>1</td></tr><tr><td>2</td></tr></table></td>
</tr>
<tr>
   <td><table><tr><td>3</td></tr><tr><td>4</td></tr></table></td>
</tr>
</table>

我想在第一个表中找到所有的tr。 我通常用

^{pr2}$

但我将得到所有tr(主表和子表中的tr)。如何只在主表中获取tr?在


Tags: 代码htmltabletrtdpr2子表主表
1条回答
网友
1楼 · 发布于 2024-05-08 00:03:35

这个怎么样?在

from bs4 import BeautifulSoup

soup = BeautifulSoup("""
<table>
<tr>
   <td><table><tr><td>1</td></tr><tr><td>2</td></tr></table></td>
</tr>
<tr>
   <td><table><tr><td>3</td></tr><tr><td>4</td></tr></table></td>
</tr>
</table>
""")

for tr in soup.find('table').find_all('tr', recursive=False):
    print tr

recursive=False只帮助查找顶级标记(请参见docs)。在

相关问题 更多 >