如何使用googleappengine将我的ID和密码传递到Python语言的网站?

2024-04-26 21:32:00 发布

您现在位置:Python中文网/ 问答频道 /正文

下面是一段代码,我使用Google App Engine通过URL获取网页HTML源代码(代码):

from google.appengine.api import urlfetch
url = "http://www.google.com/"
result = urlfetch.fetch(url)
if result.status_code == 200:
   print "content-type: text/plain"
   print
   print result.content

这里一切都很好,但有时我需要从我注册的站点获取页面的HTML源代码,并且只有首先通过ID和密码才能访问该页面。(它可以是任何站点,实际上,像任何提供邮件帐户的站点,如Yahoo:https://login.yahoo.com/config/mail?.src=ym&.intl=us或任何其他用户首先在那里注册即可获得免费帐户的站点)。 我能用Python(通过“googleappengine”)实现吗?在


Tags: 代码comappurl源代码站点htmlgoogle
2条回答

正如Alex所说,你可以检查状态码,看看它想要什么类型的自动化,但是你不能概括它,因为有些网站不会给出任何提示,或者只允许通过非标准表单登录,在这种情况下,你可能需要使用表单自动完成登录过程,因为你可以使用类似twill(http://twill.idyll.org/)这样的库 或者为每个站点编写一个特定的表单。在

您可以检查HTTP状态代码401,“需要授权”,并提供站点要求的HTTP授权类型(基本的、摘要的,无论是什么),请参阅例如here了解更多详细信息(这里没有太多特定于GAE的内容,而是学习HTTP详细信息并遵守它们的问题!-). 在

相关问题 更多 >