编写爬取论坛的程序
我需要写一个程序来抓取论坛上的内容。
我应该用Python和Scrapy框架来写这个程序,还是用Php的cURL呢?另外,Php有没有类似Scrapy的工具呢?
谢谢!
2 个回答
3
我不会用PHP来写我正在开发的新应用程序。因为我对这个语言有很多不喜欢的地方。
另外,PHP的强项在于作为一种服务器端脚本语言,用来在网上提供动态网页,而不是作为一种通用的编程语言。这也是一个缺点。所以我更倾向于使用Python。
至于用哪个框架,有很多选择,比如Harvestman、Scrapy等等。还有一个叫80legs的云爬虫,你也许可以用它。
更新:很多人给这个回答点了反对票,可能是因为我说我不喜欢PHP。这里有一些我不喜欢的原因。虽然不完全准确,但还是一个不错的总结 http://wiki.python.org/moin/PythonVsPhp