我现在真正知道的编程语言只有python。我对javascript很陌生。现在,我正在尝试做一个简单的程序,通过一个网站,并收集我的信息。在
在这个网站上,有一长串指向其他网页的链接。如果你将鼠标悬停在其中一个附近,另一个链接将出现在“Find Dupes”(重复的简称)旁边。我在页面来源中找到了这个:
<a href="javascript:void(0)" onclick="getDuplictes(1020347166, true)">Find Dupes</a>
因此,当您单击javascript链接时,将弹出一个iframe:
^{pr2}$根据你点击的链接,每次的信息都会有所不同。在
我想做的是以某种方式获取在iframe中以一种有组织的、可读的形式显示的信息,而不需要实际打开和使用web浏览器。我希望能够查看一个iframe的内容,决定是否需要它,然后单击next查看下一个iframe。每一页大约有100个这样的“查找欺骗”iframes,可能还有50个页面。总之,我的主要问题是如何使用python或javascript或其他东西来获取特定iframe的内容(我对javascript一无所知…)
谢谢。在
使用python,您可以使用PyQuery来获取每个锚标记的
onclick
属性,使用正则表达式解析该属性以获得placeId
,自己构建/places/duplicates.jsp?inPID=
URL,使用requests在该URL加载内容,然后再次对内容进行PyQuery以获取所需的数据。在相关问题 更多 >
编程相关推荐