请自己试试:)!
curl http://www.windowsphone.com/en-US/apps?list=free
结果是:
^{pr2}$或者
def download(source_url):
try:
socket.setdefaulttimeout(10)
agents = ['Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0)','Mozilla/4.0 (compatible; MSIE 7.0b; Windows NT 5.1)','Microsoft Internet Explorer/4.0b1 (Windows 95)','Opera/8.00 (Windows NT 5.1; U; en)']
ree = urllib2.Request(source_url)
ree.add_header('User-Agent',random.choice(agents))
resp = urllib2.urlopen(ree)
htmlSource = resp.read()
return htmlSource
except Exception, e:
print e
return ""
download('http://www.windowsphone.com/en-US/apps?list=free')
结果是:
<html><head><meta http-equiv="REFRESH" content="0; URL=http://www.windowsphone.com/en-US/apps?list=free"><script type="text/javascript">function OnBack(){}</script></head></html>
我想下载网页的实际来源。在
弗莱斯克在这个问题上确实有答案(+1)。在
另一种直接调试HTTP连接的方法是Netcat,它基本上是一个强大的telnet实用程序。在
假设您想调试HTTP请求中的内容:
这将把请求头发送到服务器(需要按两次enter键发送)。在
之后,服务器将响应:
^{pr2}$因此服务器返回302,这是重定向的HTTP状态代码,因此提示“浏览器”打开在位置标头中传递的URL。在
Netcat是一个调试和跟踪各种网络通信的好工具,当我想深入了解HTTP协议时,它给了我很大的帮助。在
失败的原因是http://www.windowsphone.com试图设置一个cookie,它在创建另一个cookie并重定向回的https://login.live.com上被选中windowsphone.com如果成功。在
你应该看看http://docs.python.org/library/cookielib.html
如果要使用curl,请允许它创建一个cookie文件,如下所示:
在shell中运行
^{pr2}$more myCookieJar
,您将看到如下内容:运行(注意'mycokiejar'之前的-b选项):
你会在文件里找到页面的内容windowsphone.html正如你在浏览器中看到的那样。在
相关问题 更多 >
编程相关推荐