在Python urllib.urlretrieve中设置引用URL
我在用Python的urllib.urlretrieve
来下载网站。不过,有些网站好像不太想让我下载它们,除非我从它们自己的网站带上一个合适的来源信息。有没有人知道我可以用Python的哪个库,或者其他的工具,来设置这个来源信息呢?
3 个回答
3
另外,使用 urllib2
和 build_opener
你可以这样做:
import urllib2
opener = urllib2.build_opener()
opener.addheaders = [('Referer', 'http://www.python.org/')]
opener.open('http://www.example.com/')
12
import urllib2
req = urllib2.Request('http://www.example.com/')
req.add_header('Referer', 'http://www.python.org/')
r = urllib2.urlopen(req)
这段内容来自于 http://docs.python.org/library/urllib2.html 的文档。