如何使用Selenium自动记录Ghostery插件的广告数据?
我想关注一下各种网站上运行的广告网络。Ghostery这个浏览器插件能很好地告诉我任何网站使用了哪些广告网络。比如在StackOverflow上,Ghostery显示我们被DoubleClick、Google Analytics、Quantcast和ScoreCard监控。
我想每周用Selenium自动浏览几百个网站,并保存与这些网站相关的Ghostery数据。我用Python写了一些简单的伪代码:
import selenium.webdriver as webdriver
urls = ['www.stackoverflow.com', 'www.amazon.com', ...]
driver = webdriver.Firefox()
for url in urls:
driver.get(url)
# now, how do I access Ghostery's analysis of this URL?
我想问的更大问题是:“用Selenium,怎么连接其他浏览器插件呢?”
为了好玩,我还贴了一张Ghostery界面的例子(我想通过编程访问这个界面):
3 个回答
0
看起来有一个有限的Ghostery API,详细信息可以在这个链接找到:https://purplebox.ghostery.com/post/1016023438#more-1016023438
1
一般来说,Selenium 是无法直接访问浏览器扩展的。如果你想做到这一点,就需要搭建一个桥梁。
针对 Ghostery 这个扩展,你想要的功能可以在这里找到,它是一个开源项目:https://github.com/ghostery/areweprivateyet
1
Selenium 是用来访问和与浏览器的 DOM 进行互动的工具。它不能用来控制浏览器的各种设置和功能;所以,它并不适合你想要完成的任务。