我该从哪里开始制作网络机器人?
我想写一个自动化脚本,最好能在网络服务器上运行,简单来说就是让它“点击”网页上的某个东西。我对Python或者其他相关语言还不太熟悉,所以想来这里问问该从哪里开始!可能看起来我想让这个脚本去做一些不好的事情,比如欺骗广告或做违法的事,其实我只是想让它和另一个网站互动。
4 个回答
2
我推荐使用Python的mechanize库。这个库的设计目的是模拟一个浏览器。 我用它来通过脚本操作多个网页界面。
6
这不一定要用Python,我见过用PHP和Perl做的,可能还有很多其他语言也能做到。
大致的步骤是:
1) 你给你的应用一个网址,然后它会向这个网址发送一个HTTP请求。我记得见过用php/wget来实现这个,肯定还有很多其他的方法。
2) 扫描HTTP的响应内容,找出你想要“点击”的其他网址(其实就是向这些网址发送HTTP请求),然后再向这些网址发送请求。解析链接通常需要对正则表达式有点了解(如果你对正则表达式不熟悉,赶紧补补课——这很重要哦;))。