刮削台与美化组,如何用换行符分隔元素?

2024-04-29 01:35:18 发布

您现在位置:Python中文网/ 问答频道 /正文

这是我的HTML表的行的外观:

<tr class='row'><td>100
    <td >George</a>
    <td class=a>123<td class=a>321
    <td>Alby<td>Dalton

这是我的python代码:

for tr in tabel.find('tr'):
    td = tr.find('td')
    print(td.text)

我的输出:

100
George
123321
AlbyDalton

我希望获得的输出:

100
George
123
321
Alby
Dalton

Tags: 代码inforhtmlfindtrclasstd
1条回答
网友
1楼 · 发布于 2024-04-29 01:35:18

可以使用^{}方法添加换行符\n作为separator参数

from bs4 import BeautifulSoup

html = """
<tr class='row'><td>100
    <td >George</a>
    <td class=a>123<td class=a>321
    <td>Alby<td>Dalton
    """
soup = BeautifulSoup(html, "html.parser")

for tag in soup.find_all("tr", class_="row"):
    print(tag.get_text(separator="\n", strip=True))

输出:

100
George
123
321
Alby
Dalton

相关问题 更多 >