用Python到T进行网页搜索的困难

2024-04-26 17:27:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我在OSX 10.5上运行Python2.5.1和Tor0.2.2.34
我已经检查了SOCKS questionTrying to get Tor to work with Python question和{a3},并尝试了所有这些,以及上述组合,同时在后台运行Tor,但没有一个真正有效。如果我尝试使用“torwithpython”的方式(只使用urllib2),脚本可以工作,但是当通过Python以同样的方式在whatsmyip页面上读取和打印源代码时,我的IP不会发生变化。在

这是我试图通过Tor运行的脚本:

import socks
import socket

socks.setdefaultproxy(socks.PROXY_TYPE_SOCKS5, "127.0.0.1", 8118)
socket.socket = socks.socksocket

import urllib2
web_page = "http://www.cartage.org.lb/en/themes/arts/architec/architecturalstructure/LookingforLiminality/LookingforLiminality.htm"

req = urllib2.Request(web_page)
response = urllib2.urlopen(req)
the_page = response.read()
matches = re.findall('Gianni Vattimo', the_page)
if len(matches) == 0:
    print 'RESULTS!'
else:
    print 'There were NO results!'

(网页只是一个例子,而不是我真正的目标对象)
当我运行这个脚本时,它只是在终端中无限期地暂停。如前所述,我尝试过不同的格式副本,将端口更改为其他建议,等等,但没有任何效果。有什么建议或测试过的解决方案吗?在

谢谢。在


Tags: thetoimport脚本webresponse方式page