使用mechanize输入用户名和密码
我该如何使用mechanize在这个网站上输入用户名和密码呢?
我删除并修改了我的帖子,因为之前的内容太多了
我在其他帖子中看到,可能这和javascript有关,但我怎么判断呢?我该如何利用这个信息呢?
import mechanize
import cookielib
url = 'https://www.pin1.harvard.edu/cas/login?service=https%3A%2F%2Fwww.pin1.harvard.edu%2Fpin%2Fauthenticate%3F__authen_application%3DFAS_AC_AUTHENTICATOR'
#req = requests.get(url)
#dom = web.Element(req.text)
#Handles all the browser details
br = mechanize.Browser()
br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')]
#self.browser = mechanize.Browser(factory=mechanize.RobustFactory())
#Cookie Jar
cj = cookielib.LWPCookieJar()
br.set_cookiejar(cj)
# Browser options
br.set_handle_equiv(True)
br.set_handle_gzip(True)
br.set_handle_redirect(True)
br.set_handle_referer(True)
br.set_handle_robots(False)
br.open(url)
#Select First Form
#br.select_form(nr=1)
#br['username'] = '40839852'
#print list(br.forms())[0]
for form in br.forms():
print "Form name:", form.name
print form
break
br.select_form(name= formname)
br[searchname] = term
res = br.submit()
content = res.read()
dom = web.Element(content)
错误追踪信息
ParseError: unexpected '/' char in declaration
---> 32 for form in br.forms():
33 print "Form name:", form.name
34 print form
更新 - 根据PACO的建议我添加了...但我仍然收到错误追踪信息。 Python无法使用urllib或mechanize获取表单
beg = re.search(t, res.read()).span()[1]
res.set_data(res.get_data()[beg:])
br.set_response(response)
br.select_form(nr=0)
<ipython-input-25-bd1b73406b45> in <module>()
28 br.set_response(response)
29
---> 30 br.select_form(nr=0)
31
32
ParseError: unexpected '-' char in declaration
1 个回答
1
这是我在代码中选择第一个表单的方法。
br.select_form(nr=0)
#Form fields to populate
br.form['username'] = username
br.form['password'] = password
#Submit the login form
br.submit()
你可以根据自己的需要进行修改。“nr=0”可能就是你想要的。
但是问题在于 DOCTYPE。我测试了以下内容,它会把 DOCTYPE 去掉。
html = br.response().get_data().replace('<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd >', '')
response = mechanize.make_response(
html, [("Content-Type", "text/html")],
url, 200, "OK")
br.set_response(response)
我直接从 Mechanize 常见问题解答 中拿来的这个。