使用python中的mechanize和cookielib登录网站

2024-03-29 14:25:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在进行一个收集项目,试图从这个网站上获取图书馆信息:http://www.americanlibrarydirectory.com。在

星期五(在经历了很多挫折之后)我写了下面的代码,最终成功了。在

def scrape_alpha():
    cj = cookielib.CookieJar()
    br = mechanize.Browser()
    br.set_cookiejar(cj)
    br.open("http://www.americanlibrarydirectory.com/Login.asp")
    br.select_form(name="FORM1")
    br.form['USERNAME'] = 'myemailaddress'
    br.form['PASSWORD'] = 'mypasscode'
    br.submit()
    print(br.response().read())
    alpha_url = "http://www.americanlibrarydirectory.com/browse.asp?Query=A"
    r = br.open(alpha_url).read()
    soup = BeautifulSoup(r)

现在我回到这个项目,尽管上周代码起作用了,但它今天不起作用,我根本不知道如何开始找出问题所在——它没有给我任何错误消息,它只是不登录,我仍然停留在登录页面上。在

如果我尝试手动登录(不是用代码),那么我不认为问题是我的电子邮件/密码不正确或我的帐户已过期。有人对我该怎么做有什么建议吗?在


Tags: 项目代码bralphaformcomhttpurl