无法从python web scraper获取数据，因为应用程序正在新窗口中打开页面

``import requests from bs4 import BeautifulSoup headers = { 'user-agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36' } login_data = { 'name': '<username>', 'pass': '<password>', 'form_id': 'new_login_form', 'op': 'Login' } with requests.Session() as s: url = 'https://agency-pia.crane.aero/' r = s.post(url, data=login_data, headers=headers) print(r.text) url = 'https://agency-pia.crane.aero/JSF/RezvEntry.xhtml?faces-redirect=true' r = s.get(url, headers=headers)``

1条回答

网友

1楼 · 发布于 2024-05-19 00:21:45

您不能在login_data={}中指定像name和pass这样的随机名称。它应该是站点HTML中的确切值。而且你不能只发送一个POST请求到站点并期望它让你登录，它应该包含<form>标签action值（在你的例子中是action="MemberRezvEntry.jsp"），并且每个隐藏的输入都应该包含在有效负载中，以防止任何可能的错误

import requests
s = requests.Session()
payload = {'ORACLE_DEBUG_MODE':'','paxInfo':'','USERNAME': 'name', 'PASSWORD': 'pswd123'}
r = s.post('https://agency-pia.crane.aero/MemberRezvEntry.jsp', data=payload)
result = s.get(' https://agency-pia.crane.aero/JSF/RezvEntry.xhtml?faces-redirect=true').text
print(result)

或者，您可以在登录站点后使用自定义cookie，并在bot中使用它

url = 'https://agency-pia.crane.aero/JSF/RezvEntry.xhtml?faces-redirect=true'
headers = {'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2227.0 Safari/537.36'}
cookies = {#custom cookies from browser}

s = requests.Session()
r = s.post(url, headers=headers, cookies=cookies)

相关问题更多 >

编程相关推荐

热门问题

热门文章