我正试图用python脚本提取有关机票价格的信息。请看图片:
我想解析所有的价格(比如树底部的“121”)。我已经构建了一个简单的脚本,我的问题是我不知道如何从页面的“inspect元素”后面的代码中获得正确的部分。我的代码如下:
import urllib3
from bs4 import BeautifulSoup as BS
http = urllib3.PoolManager()
ULR = "https://greatescape.co/?datesType=oneway&dateRangeType=exact&departDate=2019-08-19&origin=EAP&originType=city&continent=europe&flightType=3&city=WAW"
response = http.request('GET', URL)
soup = BS(response.data, "html.parser")
body = soup.find('body')
__next = body.find('div', {'id':'__next'})
ui_container = __next.find('div', {'class':'ui-container'})
bottom_container_root = ui_container.find('div', {'class':'bottom-container-root'})
print(bottom_container_root)
问题是我被困在ui-container
的水平。bottom-container-root
是空变量,尽管它是ui-container
下的直接子变量。有人能告诉我如何正确解析这棵树吗?你知道吗
我没有在网络报废的经验,但它碰巧是一个更大的工作流程,我正在建设的一步。你知道吗
.find_next_siblings
和.next_element
在浏览容器时非常有用。你知道吗下面是一些示例用法。你知道吗
相关问题 更多 >
编程相关推荐