为假人(或非假人)刮网

2024-05-13 04:54:46 发布

您现在位置:Python中文网/ 问答频道 /正文

目标

从网页中提取数据。。自动地

数据在此page上。。。小心,它是用法语写的

我的艰难之路,手动

  1. 我通过单击左侧的所需字段(“CHOISIR DES INDICATEURS”)来选择所需的数据
  2. 然后我选择('Tableau'=Table),以拥有数据表
  3. 然后我点击右边的('Action'),然后('Exporter'=Export)
  4. 我选择我想要的格式(即CSV)并点击('Executer'=Execute)下载文件

我所尝试的

我试图使这个过程自动化,但对我来说这是一项不可能完成的任务。我试着检查网页上的网络交换,看看是否有一个底层服务器可以轻松地发出json请求

我主要使用python和BS4或scrapy等框架

我几乎没有什么数据要提取,所以我可以很容易地手动提取。因此,这个问题,我只是纯粹为了我自己的知识,看看是否有可能刮掉这样一页

如果你能分享你的技能,我将不胜感激

谢谢,


Tags: 数据网页目标pagetableaction手动exporter