Python靓汤从帕伦得到孩子

1条回答

网友

1楼 · 发布于 2024-04-20 15:05:05

按class = sidebar sbt筛选出必要的div。使用get_text()获取每个div的文本，并检查此div是否包含您所需的信息。然后找到p以排除不必要的texts，使用get_text()并去掉多余的空格和新行。按空格分割字符串，得到列表中的3个元素。再次加入以获得您想要的string。在

注意：可能有更简单的方法来处理string。在

import requests
from bs4 import BeautifulSoup

url = "http://www.zoopla.co.uk/for-sale/details/44118383?search_identifier=e31406ce57c4397baa6701b11e7cdab1"

html = requests.get(url)
soup = BeautifulSoup(html.text, "lxml")

divs = soup.find_all("div", class_="sidebar sbt")

for div in divs:
    text = div.get_text().lower()
    if(text.find("first listed") > -1):
        text = div.find("p").get_text()
        text = text.replace("\n","",10)
        text = text.strip()
        text_list = text.split()[-3:]
        text = " ".join(text_list)
        print(text)
        break

如果您需要第一个列出部分的全部string，请避免拆分和连接。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python靓汤从帕伦得到孩子

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >