伪装urllib2请求为人类请求的最佳方法是什么(超越用户代理)?
怎么才能让一个Python程序看起来不那么明显,特别是用urllib2这个库呢?我知道怎么设置用户代理(user-agent),这已经是个不错的开始了。但是还有其他的东西,比如说引用网址(referring URL),怎么设置呢?有没有其他的建议?
这是我用来添加用户代理的代码:
opener = urllib2.build_opener()
opener.addheaders = [('User-agent','Mozilla/5.0 (X11; Linux x86_64; rv:2.0.1) Gecko/20110506 Firefox/4.0.1')]
f = opener.open("http://www.domain.com")