使用Python登录复杂的websi

import requests from bs4 import BeautifulSoup import re username = 'username' password = 'password' scrape_url = 'https://portal.mvfglobal.com/index.php/dashboard' login_url = 'https://portal.mvfglobal.com/index.php/login/login' login_info = {'login_name': username, 'login_pass': password} #Start session. session = requests.session() #Login using your authentication information. session.post(url=login_url, data=login_info) #Request page you want to scrape. url = session.get(url=scrape_url) soup = BeautifulSoup(url.content, 'html.parser') print(soup)

import requests from bs4 import BeautifulSoup username = 'username' password = 'password' login_url = 'https://inspire.flg360.co.uk/SignIn.php' login_info = {'strEmail': username, 'strPassword': password} scrape_url = 'https://inspire.flg360.co.uk/AuthUser.php' #Start session. session = requests.session() #Login using your authentication information. session.post(url=login_url, data=login_info) #Request page you want to scrape. url = session.get(url=scrape_url) soup = BeautifulSoup(url.content, 'html.parser') print(soup)

import requests from bs4 import BeautifulSoup import hashlib username = 'username' password = 'password' login_url = 'https://inspire.flg360.co.uk/AuthUser.php' login_info = {"strForwardURL": "", "strEmail": username, "intRememberMe": 1, "strResponse": ""} scrape_url = 'https://inspire.flg360.co.uk/ma/index.php' # Start session. session = requests.session() # Get strResponse strc = session.get(url=login_url) strc = BeautifulSoup(strc.content, 'html.parser').findAll(attrs={"name": "strChallenge"})[0]['value'] strc_joined = strc + hashlib.md5(password.encode("utf-8")).hexdigest() strresponse = hashlib.md5(strc_joined.encode("utf-8")).hexdigest() login_info['strResponse'] = strresponse #Login using your authentication information. session.post(url=login_url, data=login_info) # Request page you want to scrape. url = session.get(url=scrape_url) soup = BeautifulSoup(url.content, 'html.parser') print(soup)

1条回答

网友
1楼 · 发布于 2024-05-14 20:19:55

看起来页面在https://inspire.flg360.co.uk/SignIn.php发送的实际POST请求还需要一些元素。也就是说，POST数据实际上看起来像：
strForwardURL=&strEmail=abc%40123.com&intRememberMe=1&strResponse=fdb4c46c5d0eeab6133be193afc7897e
字段是strForwardURL、strEmail、intRememberMe和strResponse。查看页面上的其余代码，当您单击submit按钮时，它会触发页面上的javascript：
function fncSignIn() { var loginForm = document.getElementById("signinForm"); if (loginForm.strEmail.value == "") { alert("Please enter your email address."); return false; } if (loginForm.strPassword.value == "") { alert("Please enter your password."); return false; } var submitForm = document.getElementById("submitForm"); submitForm.strEmail.value = loginForm.strEmail.value; if (loginForm.intRememberMe.checked) submitForm.intRememberMe.value = 1; submitForm.strResponse.value = hex_md5(loginForm.strChallenge.value+hex_md5(loginForm.strPassword.value)); submitForm.submit(); }
在页面的其他地方，您可以在这里找到strChallenge字符串：
<input type="hidden" name="strChallenge" value="1d989603e448a1a0559f08bdc83a15522fbc6c0404ca66acc4cdd7aafe4039359e2fb23b706d60a3">
（顺便说一下，这个值在重新加载时会改变）
本质上，它不是字符串形式的密码，而是请求strChallenge字符串的md5hex摘要与密码的md5hex摘要连接。你知道吗
在python中，应该是这样的：
import hashlib password = "abcdefg12345" strc = "1d989603e448a1a0559f08bdc83a15522fbc6c0404ca66acc4cdd7aafe4039359e2fb23b706d60a3" strc_joined = strc + hashlib.md5(password.encode("utf-8")).hexdigest() strresponse = hashlib.md5(strc_joined.encode("utf-8")).hexdigest() print(strresponse)
本例中的输出是0d289f39067a25430d4818fe38046372
将原始请求中的postdata设置为：
{"strForwardURL":"", "strEmail":"abc@123.com", "intRememberMe": 1, "strResponse": "0d289f39067a25430d4818fe38046372"}您应该可以登录。每次你想要抓取一个需要这个特殊登录的页面时，你应该能够简单地用BeautifulSoup4抓取strChallenge，计算出合适的strResponse，然后登录。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章