如何使用Selenium或Scrapy刮取AJAX页面参数中的信息?

2024-03-28 19:55:17 发布

您现在位置:Python中文网/ 问答频道 /正文

我正试图从这个网站上提取这个项目在地图上的坐标:https://www.iproperty.com.my/new-property/property/sentul/m-arisa/new-6029/

我意识到我需要的信息在XHR请求主体中:Screenshot

如何以编程方式提取请求参数中的坐标?我需要这样做,以便我可以通过这个网站上的列表迭代,并提取新项目的所有位置


Tags: 项目httpscom信息new网站mywww
1条回答
网友
1楼 · 发布于 2024-03-28 19:55:17

查看页面的代码源代码,并搜索:3.207 在那里,您将看到如下内容:

enter image description here

如果你站在队伍的最前面,你会看到

window.__INITIAL_STATE__ = {...

因此,我在这里看到了一些解决方案:

  • 制作一个正则表达式,从网页的源代码中获取这些坐标
  • 在网页上运行一些javascript以获取所需的数据:
    window.__INITIAL_STATE__.detail.address

收益率:

Object { formattedAddress: "Sentul, Kuala Lumpur", lat: 3.207275, lng: 101.689752, hasLatLng: true, hideMarker: false }

相关问题 更多 >