我想从一个网站上刮一张桌子。 问题是它有一个选择器来选择表是按国家、州还是按城市聚合的,这会更改显示的数据。默认情况下,该表显示“国家”级别的数据,但我希望在“州”级别上对数据进行刮取。这是网站:
https://www.opentable.com/state-of-industry
我使用的代码如下:
page = requests.get('https://www.opentable.com/state-of-industry')
soup = BeautifulSoup(page.content, 'html.parser')
tables = soup.find_all("table")
table = tables[0]
tab_data = [[cell.text for cell in row.find_all(["th","td"])]
for row in table.find_all("tr")]
df = pd.DataFrame(tab_data)
这给了我一个“国家”表,我怎样才能得到“国家”表呢
谢谢
请尝试下面使用Selenium实现的代码。下面的脚本首先打开浏览器,然后等待下拉列表被定位,循环遍历所有3个下拉选项。但是,有一个按钮显示下载数据集,当您单击它时,将在一个csv文件中提供所有3个选项数据。我已经实现了下面的脚本,它现在通过单击按钮来模拟和下载数据集,但您可以将其用于其他用途或需求,因为您要求提供一个示例
相关问题 更多 >
编程相关推荐