如何使用scrapy抓取返回403错误的链接?

2024-05-15 17:53:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图从udemy中刮取课程详细信息,但它返回错误403。我试过使用用户代理,但仍然不起作用

import scrapy


class UdemySpider(scrapy.Spider):
    name = 'udemy'
    start_urls = [
        'https://www.udemy.com/api-2.0/search-courses/recommendation/?course_badge=beginners_choice&page_size=5&skip_price=true&q=python'
    ]

def parse(self, response):
    data = response.json()
    yield data

我已经使用了scrapy-user-agent,但仍然无法获取数据


Tags: 用户nameimport代理dataresponse错误详细信息