使用登录进行Python web抓取

2024-05-23 13:56:44 发布

您现在位置：Python中文网/ 问答频道 /正文

3389

网友

男 | 程序猿一只，喜欢编程写python代码。

我试图通过密码保护的网站登录，以便访问受保护的页面，我有电子邮件和密码名称以及csrf-token。但当我尝试访问受保护的页面时，它不允许我，并将我重定向回登录。任何帮助都将非常棒！我试图访问的站点是

https://www.usertesting.com/users/sign_in

import requests
from lxml import html

session_requests = requests.session()

login_url = "https://www.usertesting.com/users/sign_in"
result = session_requests.get(login_url)

tree = html.fromstring(result.text)
authenticity_token = list(set(tree.xpath("//meta[@name='csrf-token']/@content")))[0]

userInfo = {
    "user[email]": "email", 
    "user[password]": "password", 
    "csrf-token": authenticity_token
}

result = session_requests.post(
    login_url, 
    data = userInfo, 
    headers = dict(referer=login_url)
)

url = 'https://www.usertesting.com/my_dashboard'

result = session_requests.get(
    url, 
    headers = dict(referer = url)
)

print result.content

Tags： in https com token url session www login

1条回答

网友

1楼 · 发布于 2024-05-23 13:56:44

试着看看这个https://kazuar.github.io/scraping-tutorial/来寻找你想要的答案。总之，你需要检查网页，在你开始你的完整的抓取程序之前，你应该编写另一个函数，输入用户名、密码，然后进入网站。完成后，开始完整的脚本编写

使用登录进行Python web抓取

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用登录进行Python web抓取

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >