我应该使用PHP还是Python来制作网络爬虫?
我在学习网页爬虫,但不太确定是用PHP还是Python。我的目标是做一个网站,可以从另一个网站获取信息并自动更新。请问用Python能不能做出一个不错的网站?还是说我得把Python获取的信息粘贴到HTML或PHP里?
1 个回答
2
这要看具体情况。PHP是一种主要用来开发网站的语言(就是用来展示网站的),而Python不仅可以用来编写网站,还可以用来开发其他应用程序。所以,选择哪种语言取决于你抓取数据的方式有多像应用程序,或者说它在展示网站中占多大比重。
Python非常适合抓取数据,因为它有很多第三方库(比如Scrapy、BeautifulSoup、lxml、request等),而且还有内置的库可以用来请求网址。用PHP来请求其他网站就会比较麻烦,因为它主要是用来搭建自己的网站。
当然,这也取决于你对这两种语言的熟练程度。
我会把这个应用分成两个部分:
- 展示逻辑(你自己的网站)
- 抓取逻辑(抓取其他网站的数据)
这两部分会通过数据库连接起来。抓取逻辑负责收集信息并存储到数据库中,而展示逻辑则从数据库中获取信息,并以HTML的形式展示给用户。
在抓取数据的部分,建议你选择Python而不是PHP。而在展示部分,其实选择哪种语言都可以,主要看个人的喜好或熟悉程度。