Scrapy无法获得所有价格

class QuotesSpider(scrapy.Spider): name = "tesco" start_urls = [ 'https://www.tesco.com/direct/tv-offer.event?icid=offers_trade_slot1', ] def parse(self, response): for quote in response.xpath('//li[contains(@class,"product-tile")]'): learningscrapyItem = crawlerItem() learningscrapyItem['title'] = quote.xpath('.//h3/a/text()').extract_first() price = quote.xpath('.//div[@class="buy-box-container"]/p[2]/text()').extract_first() learningscrapyItem['price'] = price.strip() yield (learningscrapyItem)

2条回答

网友

1楼 · 编辑于 2024-05-29 08:18:47

问题是/text()只会匹配直接文本子节点，而且，您正确地理解了，第二个示例破坏了选择器。你知道吗

我只需要从“price”元素中获取所有的“text”节点，然后用.re_first()获取数量：

price = quote.xpath('.//div[@class="buy-box-container"]/p[2]//text()').re_first(r"\d+\.\d+")

或者，使用CSS选择器而不是XPath更简单：

price = quote.css('.buy-box-container .price').re_first(r"\d+\.\d+")

网友

2楼 · 编辑于 2024-05-29 08:18:47

试试下面的方法来获得你想要的价格。你知道吗

而不是用这个：

quote.xpath('.//div[@class="buy-box-container"]/p[2]/text()').extract_first()

尝试使用以下选项：

quote.xpath('.//div[@class="buy-box-container"]//p[@class="price"]/text()').extract()[-1]

相关问题更多 >

编程相关推荐

热门问题

热门文章