抓取网站上的所有评论与刮痧

import scrapy from scrapy.spiders import CrawlSpider, Rule from scrapy.linkextractors import LinkExtractor class deneme(CrawlSpider): name = 'deneme' allowed_domains = ['hepsiburada.com'] start_urls = ['https://www.hepsiburada.com/'] rules = ( Rule(LinkExtractor(), callback='parse_item', follow=True), ) def parse_item(self, response): filename = response.url.split("/")[-2] + '.html' with open(filename, 'wb') as f: f.write(response.body)

1条回答

网友

1楼 · 发布于 2024-06-11 06:00:53

代码如下：

import scrapy
from scrapy.spiders import CrawlSpider, Rule
from scrapy.linkextractors import LinkExtractor

class deneme(CrawlSpider):
    name = 'yorum'
    allowed_domains = ['hepsiburada.com']
    start_urls = ['https://www.hepsiburada.com/']
    rules = (
        Rule(LinkExtractor(), callback='parse_item', follow=True),
    )


    def parse_item(self, response):




        print(response.xpath('//p[@class="review-text"]/text()').extract())

刮痧；输出.txt在

相关问题更多 >

编程相关推荐

热门问题

热门文章

抓取网站上的所有评论与刮痧

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >