能在Windows上用Python解析Javascript的网络爬虫

4 投票
1 回答
4996 浏览
提问于 2025-04-16 11:50

我的最终目标是建立一个网络爬虫,能够下载网页上的所有图片。我从阅读的资料中了解到,我需要嵌入一个渲染/布局引擎,比如Gecko或Webkit。

不过,我现在用的是Windows系统,所以PyWebkit不适用,而且我也不想花时间去学C++来用Gecko,或者学Java来用Rhino,我现在有点不知道该怎么办。

有没有什么可靠的渲染引擎可以和Python一起用,并且能在Windows(64位,Windows 7)上运行?有没有简单的方法可以在Windows上通过Python脚本执行JavaScript?

1 个回答

3

你不需要Webkit来实现这个功能。你只需要一个能运行JavaScript代码的引擎,所以可以看看Google V8或者Mozilla SpiderMonkey

如果你更喜欢用Python来构建你的爬虫,可以考虑使用PyV8,因为它提供了所有必要的接口。

撰写回答