使用Scrapy登录EventBrite

def login(self, response): yield FormRequest.from_response( response, formxpath="//form[(@novalidate)]", url='https://www.eventbrite.ca/ajax/login/', formdata={ 'email': 'email@email.com', 'password': 'password', 'forward':'', 'referrer': '/', 'pckg': '', 'stld': '' }, callback=self.begin_event_parse )

1条回答

网友

1楼 · 发布于 2024-04-16 08:13:16

看起来您的头中缺少了X-CSRFToken。此令牌用于保护资源不受跨站点请求伪造的影响。你知道吗

在这种情况下，它是在cookies中提供的，您需要存储并传递它。你知道吗

一个对我有用的简单实现：

import re
import scrapy

class DarazspidySpider(scrapy.Spider):
    name = 'darazspidy'

    def start_requests(self):
        yield scrapy.Request('https://www.eventbrite.ca/signin/?referrer=%2F%3Finternal_ref%3Dlogin%26internal_ref%3Dlogin%26internal_ref%3Dlogin', callback=self.lookup)

    def lookup(self, response):
        yield scrapy.FormRequest(
            'https://www.eventbrite.ca/api/v3/users/lookup/',
            formdata={"email":"email@mail-v.net"},
            headers={'X-CSRFToken': self._get_xcsrf_token(response),},
            callback=self.login,
        )

    def _get_xcsrf_token(self, response):
        cookies = response.headers.getlist('Set-Cookie')
        cookie, = [c for c in cookies if 'csrftoken' in str(c)]
        self.token = re.search(r'csrftoken=(\w+)', str(cookie)).groups()[0]
        return self.token

    def login(self, response):
        yield scrapy.FormRequest(
            url='https://www.eventbrite.ca/ajax/login/',
            formdata={
                'email': 'email@mail-v.net',
                'password': 'pwd',
                'forward':'',
                'referrer': '/?internal_ref=login&internal_ref=login',
                'pckg': '',
                'stld': ''
            },             
            callback=self.parse,
            headers={'X-CSRFToken': self.token}
        )

    def parse(self, response):
        self.logger.info('Logged in!')

理想情况下，您可能希望创建一个中间件来为您做到这一点。你知道吗

一般来说，当您面对这种行为时，您希望尽可能地模仿浏览器发送的内容，因此请仔细查看标题并尝试复制它们。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章