你是怎么从ifan获取信息的?(javascript和/或python)

2024-06-01 02:16:46 发布

您现在位置:Python中文网/ 问答频道 /正文

我现在真正知道的编程语言只有python。我对javascript很陌生。现在,我正在尝试做一个简单的程序,通过一个网站,并收集我的信息。在

在这个网站上,有一长串指向其他网页的链接。如果你将鼠标悬停在其中一个附近,另一个链接将出现在“Find Dupes”(重复的简称)旁边。我在页面来源中找到了这个:

<a href="javascript:void(0)" onclick="getDuplictes(1020347166, true)">Find Dupes</a>

因此,当您单击javascript链接时,将弹出一个iframe:

^{pr2}$

根据你点击的链接,每次的信息都会有所不同。在

我想做的是以某种方式获取在iframe中以一种有组织的、可读的形式显示的信息,而不需要实际打开和使用web浏览器。我希望能够查看一个iframe的内容,决定是否需要它,然后单击next查看下一个iframe。每一页大约有100个这样的“查找欺骗”iframes,可能还有50个页面。总之,我的主要问题是如何使用python或javascript或其他东西来获取特定iframe的内容(我对javascript一无所知…)

谢谢。在


Tags: 程序信息网页内容网站链接页面find
1条回答
网友
1楼 · 发布于 2024-06-01 02:16:46

使用python,您可以使用PyQuery来获取每个锚标记的onclick属性,使用正则表达式解析该属性以获得placeId,自己构建/places/duplicates.jsp?inPID=URL,使用requests在该URL加载内容,然后再次对内容进行PyQuery以获取所需的数据。在

相关问题 更多 >