使用下拉菜单并单击按钮获取显示的表格,对web报废数据进行处理

2024-05-16 22:09:14 发布

您现在位置:Python中文网/ 问答频道 /正文

我完全不熟悉网络垃圾处理,从未使用过它,现在我正在进行作物产量分析,因为我需要获取气候信息数据,该数据可在本网站上获得https://www.indiawaterportal.org/met_data/,需要从下拉菜单中选择一些选项,然后单击页面上显示的按钮,该按钮将获取显示的表格和图形,我可以下载csv或excel格式的表格,但我需要大量的数据,我不能为每个州和每个数据类型手动下载,有没有办法在多个csv文件中获取所有信息(在给定的时间间隔内,一个csv文件对应一种数据类型)


Tags: 文件csv数据https作物网络信息网站
1条回答
网友
1楼 · 发布于 2024-05-16 22:09:14

每个<select>(州、区等)都包含值列表。一旦用户做出选择,csv的URL就会被合成

例如:

https://www.indiawaterportal.org/met_data/data/csv/18/8/1/1901/1903/annual_totals
  • 18:州法典
  • 8:地区代码
  • 1:数据类型
  • 1901年:从
  • 1903年:到
  • 年度总数:显示什么

您所要做的就是“刮取”<select>的数据,并基于<option>值组合所有可能的URL

请注意,district<select>是基于状态选择动态构建的。 例如:

https://www.indiawaterportal.org/met_data/index.php?/data/state/22

应返回“22”州的地区

相关问题 更多 >