使用Python中的urllib2打开网页时出现403“拒绝访问”错误
我想通过谷歌和urllib2来获取单词的定义。我打开这个网址,https://www.google.com/search?q=define+<something>
,然后解析网页源代码来找到定义。不过,当我尝试访问这个页面时,出现了403错误,这通常是为了防止这种数据抓取。我觉得绕过这个限制不太明智,所以我在想有没有其他方法可以从谷歌的服务器获取数据,或者有没有什么数据包可以使用。
补充:这是我用来访问这个网址的代码;
url = "https://www.google.com/search?q=define+" + word
try:
source = ulib.urlopen(url)
except ulib.HTTPError, e:
print e.fp.read()