Python请求无法登录

2024-04-26 13:21:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我很感激你在这里所做的一切。通常我能在Stackoverflow的帮助下解决我的问题,但这次我被卡住了。希望你能帮我!你知道吗

问题相当简单:如何使用Python的请求登录this webpage?你知道吗

我的步骤:

  1. 获取登录url
  2. 提供登录详细信息。根据HTML,我需要提供一个'电子邮件'和'密码'。你知道吗
  3. 创建会话并使用post登录
  4. 如果登录成功,请检查HTML

不幸的是,这种简单的方法在这种情况下似乎不起作用。例如,details的输出是:

<script>
    dataLayer = [{
        'environment': 'production',
        'loggedIn': '0',
        'userCode': '',
        'rank': '',
        'totalBalance': '0',
        'overAgeCasino': '0'
    }];
</script>

显然,如果登录成功,'loggedIn''0'应该更改为'1'。你知道吗

在一个示例中,我发现您可能需要添加一个“csrftoken”,并且它可以在HTML中作为一个“隐藏”类型找到。但是,type='hidden'部分中的名称似乎与此无关,也没有值(link to screenshot of HTML)。 在其他地方我读到一个CSFR令牌也存储在CookieJar中,但它不在那里:

<RequestsCookieJar[<Cookie PHPSESSID=5dib6cf6kpvf29dsn725ljcec7 for .napoleongames.be/>, <Cookie locale=en_GB for .napoleongames.be/>, <Cookie user=false for .napoleongames.be/>]>

我发现很难相信登录是不可能的,但我已经没有主意了。如果有人知道如何使用urllib(2),它也很有用。我宁愿不使用硒,因为我不能顺利运行它。你知道吗

代码:

 import requests
    from bs4 import BeautifulSoup
    from datetime import date

date_str = str(date.today())
login_url = 'https://en-gb.sports.napoleongames.be/user/login'
protected_url = 'proctected_url'

payload = {'email': 'address@example.com',
           'password': '*********'}

with requests.Session() as session:
    session.get(login_url)
    login_page = session.post(login_url,
                          data=payload)

    html_body = BeautifulSoup(login_page.content, 'html.parser').find(
        name='body', attrs={'id': 'user_login'})
    details = html_body.findAll('script')[0]
    page = session.get(protected_url)

标题:

{'Date': 'Wed, 06 Sep 2017 23:45:52 GMT', 'Server': 'Apache', 'Expires': 'Thu, 19 Nov 1981 08:52:00 GMT', 'Cache-Control': 'no-store, no-cache, must-revalidate, post-check=0, pre-check=0', 'Pragma': 'no-cache', 'X-Frame-Options': 'SAMEORIGIN', 'X-Cache-Page': 'MISS', 'Set-Cookie': 'locale=en_GB; Expires=Mon, 05-Mar-2018 23:45:52 GMT; Domain=.napoleongames.be; Path=/, user=false; expires=Mon, 05-Mar-2018 23:45:52 GMT; Max-Age=15552000; path=/; domain=.napoleongames.be, loyalty=deleted; expires=Thu, 01-Jan-1970 00:00:01 GMT; Max-Age=0; path=/; domain=.napoleongames.be', 'Strict-Transport-Security': 'max-age=15768000', 'Vary': 'Accept-Encoding', 'Content-Encoding': 'gzip', 'Content-Length': '10840', 'Connection': 'close', 'Content-Type': 'text/html'}

Tags: importurlforcookiesessionhtmlscriptlogin
1条回答
网友
1楼 · 发布于 2024-04-26 13:21:00

提交表单时,应该考虑表单标签中的其他字段,而不仅仅是需要填写的字段。在本例中,当您查看页面源代码时,在登录时还有一个字段正在填充。你知道吗

您可以尝试将其添加到有效负载中:

payload = {'email': 'address@example.com',
           'password': '*********'
           'buttons_app_service_user_login[buttonClicked]': 'buttons_app_service_user_login-save'}

让我知道这是否有效或如果你遇到其他问题。你知道吗

相关问题 更多 >