我试图写一个代码,这将能够验证域通过whois.domaintools.com网站. 在
但是在读取html时有一个小问题,它与whoisdools.com/registereddos.com/.com源代码。怎么了?它的问题是什么?我真的不知道怎么解决它。在
import urllib2
def getPage():
url="http://whois.domaintools.com/notregistereddomain.com"
req = urllib2.Request(url)
try:
response = urllib2.urlopen(req)
return response.read()
except urllib2.HTTPError, error:
print "error: ", error.read()
a = error.read()
f = open("URL.txt", "a")
f.write(a)
f.close()
if __name__ == "__main__":
namesPage = getPage()
print namesPage
如果您使用
print error
而不是print error.read()
,您将看到您从服务器得到了一个HTTP 403“禁止”的答案。在显然,这个服务器不喜欢没有用户代理头的请求(或者它不喜欢Python的头,因为它不想从脚本中查询)。以下是解决方法:
相关问题 更多 >
编程相关推荐