为什么我不能使用scrapy在Amazon页面中选择一些元素？

2024-05-14 01:00:56 发布

您现在位置：Python中文网/ 问答频道 /正文

2386

网友

男 | 程序猿一只，喜欢编程写python代码。

我试图从下一页解析Amazon标准标识号（ASIN）。你知道吗

https://www.amazon.com/dp/B075GYWPCJ

但是，我无法从scrapy响应中选择包含ASIN的表。如何选择表以便分析表中的数据？你知道吗

import scrapy
from scrapy.crawler import CrawlerProcess

class AmazonSpider(scrapy.Spider):
    name = 'amazon.com'
    def start_requests(self):
        yield scrapy.Request('https://www.amazon.com/dp/B075GYWPCJ', self.parse)
    def parse(self, response):
        # This works.. :)
        print(response.xpath('//table[@id="HLCXComparisonTable"]'))
        # This doesn't work.. :(
        print(response.xpath('//table[@id="productDetails_detailBullets_sections1"]'))

process = CrawlerProcess()
process.crawl(AmazonSpider)
process.start()

Tags： https import self com amazon response def www

1条回答

网友

1楼 · 发布于 2024-05-14 01:00:56

在Amazon上，很多东西都是动态加载的。打开页面时，您试图获取的表不会加载到DOM中。您需要以某种方式触发页面来加载该内容，以便获取它。你知道吗

为什么我不能使用scrapy在Amazon页面中选择一些元素？

相关问题更多 >

编程相关推荐

热门问题

热门文章

为什么我不能使用scrapy在Amazon页面中选择一些元素？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >