我正在尝试用python3(使用PyCharm)来抓取这个网站的HTML:https://www.idealista.com/venta-viviendas/madrid-madrid/。 我只对房子的价格感兴趣,所以我把搜索范围缩小到某些跨度,比如:
import requests
from bs4 import BeautifulSoup
page = requests.get('https://www.idealista.com/venta-viviendas/madrid-madrid/')
soup = BeautifulSoup(page.text, 'html.parser')
prices=soup.findAll("span", {"class": "item-price h2-simulated"})
print(len(prices))
print(prices)
当我运行它时,我得到这个:0 []
也就是说它什么也没找到。此外,如果我打印所有内容:print(soup)那么大的一个页面,我得到的html内容很少,所以它显然不能获取所有内容。你知道吗
网站是动态的,因此,您需要使用浏览器操作工具,如^{} :
输出:
相关问题 更多 >
编程相关推荐