Python-requests 如何在 POST 之前调用 js 函数计算值?

3 投票
1 回答
5442 浏览
提问于 2025-04-19 00:03

我在用 Requests(版本 2.2.1)登录一个网址 http://tx3.netease.com/logging.php?action=login,但这个网址的登录逻辑和 Django 的 csrf token 机制不太一样,具体来说:

  1. 当你访问这个网址时,网页的 HTML 内容中会有两个重要的值 formhashsts,这两个值会在一个叫 do_encrypt 的 JavaScript 函数中使用(这个函数在 http://tx3.netease.com/forumdata/cache/rsa/rsa_min.js 文件里)。这部分没问题,我可以通过正则表达式轻松提取到它们。

网页 HTML 内容的关键部分是:

<form method="post" name="login" id="loginform" class="s_clear" onsubmit="do_encrypt('ori_password','password');pwdclear = 1;" action="logging.php?action=login&amp;loginsubmit=yes">
<input type="hidden" name="formhash" value="91e54489" />
<input type="hidden" name="referer" value="http://tx3.netease.com/" />
<input type="hidden" name="sts" id="sts" value="1409414053" />
<input type="hidden" name="password" id="password" />
...
<input type="password" id="ori_password" name="ori_password" onfocus="clearpwd()" onkeypress="detectCapsLock(event, this)" size="36" class="txt" tabindex="1" autocomplete="off" />
...
</form>

2. 当你输入邮箱和原始密码 ori_password,点击提交按钮时,会调用 do_encrypt 函数,这个函数会使用 formhashstsori_password 来设置一个真实的密码 password,这个密码会被放到发送的数据里。问题是——似乎没有办法直接获取到 password 字符串。(对比一下,在 Django 的情况下,你可以直接从 session_client.cookies['csrftoken'] 中获取 csrfmiddlewaretoken。)

这段代码是:

import requests
import json
import re

loginUrl = "http://tx3.netease.com/logging.php?action=login"

client = requests.session()

r = client.get(loginUrl)
r.encoding='gb18030'

stsPat = re.compile('<input type="hidden" name="sts" id="sts" value="(\d+?)" />')
formhashPat = re.compile('<input type="hidden" name="formhash" value="([\d\w]+?)" />')

sts = stsPat.search(r.text).groups()[0]
formhash = formhashPat.search(r.text).groups()[0]


loginData={
    'username'  : "smaller9@163.com",
    'password'  : ..., # Set by js function do_encrypt
    'referer':'/',
    'loginfield':'username',
    'ori_password':'', # it's `111111`, but `do_encrypt` will set it to empty.
    'loginsubmit':'true',
    'sts':sts,
    'formhash':formhash,
    }
# r = client.post(url=loginUrl,data=loginData)

1 个回答

4

假设你有权限这么做,可以试着用 selenium 登录,因为我觉得这更符合你最终想要实现的目标。

from selenium import webdriver

USERNAME = "foo@bar.com"
PASSWORD = "superelite"

# create a driver
driver = webdriver.Firefox()

# get the homepage
driver.get("http://tx3.netease.com/logging.php?action=login")

un_elm = driver.find_element_by_id("username")
pw_elm = driver.find_element_by_id("ori_password")
submit = driver.find_element_by_css_selector("[name=loginsubmit]")

un_elm.send_keys(USERNAME)
pw_elm.send_keys(PASSWORD)

# click submit
submit.click()

# get the PHPSESSID cookie as that has your login data, if you want to use
# it elsewhere
# print driver.get_cookies():

# do something else ...

撰写回答