如何在Scrapy中发出需要请求负载的POST请求

url = "https://busfor.pl/api/v1/searches" formdata = {"from_id" : d_id ,"to_id" : a_id ,"on" : '2019-10-10' ,"passengers" : 1 ,"details" : [] } yield scrapy.FormRequest(url, callback=self.parse, formdata=formdata)

url = "https://busfor.pl/api/v1/searches" payload = [{"from_id" : d_id ,"to_id" : a_id ,"on" : '2019-10-10' ,"passengers" : 1 ,"details" : [] }] yield scrapy.Request(url, self.parse, method = "POST", body = json.dumps(payload))

1条回答

网友

1楼 · 发布于 2024-04-26 22:40:03

用json数据发送POST请求的方法是后者，但是您将错误的json传递到站点，它需要的是一个字典，而不是一个字典列表。所以不是：

payload = [{"from_id" : d_id
                ,"to_id" : a_id
                ,"on" : '2019-10-10'
                ,"passengers" : 1
                ,"details" : []
}]

您应该使用：

payload = {"from_id" : d_id
                ,"to_id" : a_id
                ,"on" : '2019-10-10'
                ,"passengers" : 1
                ,"details" : []
}

另一件您没有注意到的事情是传递给POST请求的headers，有时站点使用id和哈希来控制对其API的访问，在本例中，我发现了两个似乎需要的值，X-CSRF-Token和X-NewRelic-ID。幸运的是，这两个值可以在搜索页面上找到。你知道吗

这是一个工作的spider，搜索结果在方法self.parse_search中可用。你知道吗

import json
import scrapy

class BusForSpider(scrapy.Spider):
    name = 'busfor'
    start_urls = ['https://busfor.pl/autobusy/Sopot/Gda%C5%84sk?from_id=62113&on=2019-10-09&passengers=1&search=true&to_id=3559']
    search_url = 'https://busfor.pl/api/v1/searches'

    def parse(self, response):
        payload = {"from_id" : '62113',
                   "to_id" : '3559',
                   "on" : '2019-10-10',
                   "passengers" : 1,
                   "details" : []}
        csrf_token = response.xpath('//meta[@name="csrf-token"]/@content').get()
        newrelic_id = response.xpath('//script/text()').re_first(r'xpid:"(.*?)"')
        headers = {
            'X-CSRF-Token': csrf_token,
            'X-NewRelic-ID': newrelic_id,
            'Content-Type': 'application/json; charset=UTF-8',
        }
        yield scrapy.Request(self.search_url, callback=self.parse_search, method="POST", body=json.dumps(payload), headers=headers)

    def parse_search(self, response):
        data = json.loads(response.text)

相关问题更多 >

编程相关推荐

热门问题

热门文章