Python-requests 如何在 POST 之前调用 js 函数计算值?
我在用 Requests(版本 2.2.1)登录一个网址 http://tx3.netease.com/logging.php?action=login
,但这个网址的登录逻辑和 Django 的 csrf token 机制不太一样,具体来说:
- 当你访问这个网址时,网页的 HTML 内容中会有两个重要的值
formhash
和sts
,这两个值会在一个叫do_encrypt
的 JavaScript 函数中使用(这个函数在http://tx3.netease.com/forumdata/cache/rsa/rsa_min.js
文件里)。这部分没问题,我可以通过正则表达式轻松提取到它们。
网页 HTML 内容的关键部分是:
<form method="post" name="login" id="loginform" class="s_clear" onsubmit="do_encrypt('ori_password','password');pwdclear = 1;" action="logging.php?action=login&loginsubmit=yes">
<input type="hidden" name="formhash" value="91e54489" />
<input type="hidden" name="referer" value="http://tx3.netease.com/" />
<input type="hidden" name="sts" id="sts" value="1409414053" />
<input type="hidden" name="password" id="password" />
...
<input type="password" id="ori_password" name="ori_password" onfocus="clearpwd()" onkeypress="detectCapsLock(event, this)" size="36" class="txt" tabindex="1" autocomplete="off" />
...
</form>
2. 当你输入邮箱和原始密码 ori_password
,点击提交按钮时,会调用 do_encrypt
函数,这个函数会使用 formhash
、sts
和 ori_password
来设置一个真实的密码 password
,这个密码会被放到发送的数据里。问题是——似乎没有办法直接获取到 password
字符串。(对比一下,在 Django 的情况下,你可以直接从 session_client.cookies['csrftoken']
中获取 csrfmiddlewaretoken
。)
这段代码是:
import requests
import json
import re
loginUrl = "http://tx3.netease.com/logging.php?action=login"
client = requests.session()
r = client.get(loginUrl)
r.encoding='gb18030'
stsPat = re.compile('<input type="hidden" name="sts" id="sts" value="(\d+?)" />')
formhashPat = re.compile('<input type="hidden" name="formhash" value="([\d\w]+?)" />')
sts = stsPat.search(r.text).groups()[0]
formhash = formhashPat.search(r.text).groups()[0]
loginData={
'username' : "smaller9@163.com",
'password' : ..., # Set by js function do_encrypt
'referer':'/',
'loginfield':'username',
'ori_password':'', # it's `111111`, but `do_encrypt` will set it to empty.
'loginsubmit':'true',
'sts':sts,
'formhash':formhash,
}
# r = client.post(url=loginUrl,data=loginData)
1 个回答
4
假设你有权限这么做,可以试着用 selenium
登录,因为我觉得这更符合你最终想要实现的目标。
from selenium import webdriver
USERNAME = "foo@bar.com"
PASSWORD = "superelite"
# create a driver
driver = webdriver.Firefox()
# get the homepage
driver.get("http://tx3.netease.com/logging.php?action=login")
un_elm = driver.find_element_by_id("username")
pw_elm = driver.find_element_by_id("ori_password")
submit = driver.find_element_by_css_selector("[name=loginsubmit]")
un_elm.send_keys(USERNAME)
pw_elm.send_keys(PASSWORD)
# click submit
submit.click()
# get the PHPSESSID cookie as that has your login data, if you want to use
# it elsewhere
# print driver.get_cookies():
# do something else ...