在python中从span标记提取内容

2条回答

网友

1楼 · 编辑于 2024-04-27 19:03:55

类'KeyInformation-label_v2'只返回属性的名称。您需要类'KeyInformation-value_v2'来获取值

您还可以为每个列表添加标题。请注意，有一些重复项

titles = soup('div', {'class':'KeyInformation-attribute_v2'})
labels = soup('span', {'class':'KeyInformation-label_v2'})
values = soup('span', {'class':'KeyInformation-value_v2'})

for title, (label, value) in zip(titles, zip(labels, values)):
    print(title.find('a')['title'], label.string, value.string.strip())

输出：

Loft en Renta Amueblado Una Recámara Cerca Udem  Recámara 1
Loft en Renta Amueblado Una Recámara Cerca Udem  Baño 1
Loft en Renta Amueblado Una Recámara Cerca Udem  Construidos  50 m²
Loft en Renta Amueblado Una Recámara Cerca Udem  Recámara 1
Loft en Renta Amueblado Una Recámara Cerca Udem  Baño 1
Loft en Renta Amueblado Una Recámara Cerca Udem  Construidos  50 m²
DEPARTAMENTO EN RENTA SAN JERONIMO EQUIPADO Recámaras 3
DEPARTAMENTO EN RENTA SAN JERONIMO EQUIPADO Baños 2
...

网友

2楼 · 编辑于 2024-04-27 19:03:55

对于标记内的文本，需要使用tag.string方法

来自美丽的汤documentation：

soup = BeautifulSoup('<b class="boldest">Extremely bold</b>', 'html.parser')
tag = soup.b
tag.string
# 'Extremely bold'

相关问题更多 >

编程相关推荐

热门问题

热门文章

在python中从span标记提取内容

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >