用Scrapy模拟JavaScript按钮点击

1条回答

网友

1楼 · 发布于 2024-05-23 17:44:36

如果你读对了，你最好的选择是使用Firefox浏览器的scrapy+selenium，或者像PhantomJS这样的无头浏览器，以加快抓取速度。

示例改编自https://stackoverflow.com/a/17979285/2781701

import scrapy
from selenium import webdriver

class ProductSpider(scrapy.Spider):
    name = "product_spider"
    allowed_domains = ['visit.rio']
    start_urls = ['http://visit.rio/en/o-que-fazer/outdoors']

    def __init__(self):
        self.driver = webdriver.Firefox()
    def parse(self, response):
        self.driver.get(response.url)

        while True:
            next = self.driver.find_element_by_xpath('//div[@id="show_more"]/a')

            try:
                next.click()

                # get the data and write it to scrapy items
            except:
                break

        self.driver.close()

编程相关推荐

java Cassandra复制因子大于节点数
java J2EE JTA事务回滚不适用于OSE Glassfish 4.0（Build 89）
java spring安全预认证用户登录
org的java类文件。反应流。从RxJava编译示例时未找到Publisher？
java在使用dataFormat作为POJO通过Camel调用Web服务时无法设置SOAP标头
Javafx类的java静态实例
java如何防止一个部件在关闭时覆盖另一个部件的位置
sql server无法从我的java代码连接到数据库
java在JList（Swing）中显示带有的ArrayList
从Java中的CXF服务获取WSAddressing数据

相关问题更多 >

编程相关推荐

热门问题

热门文章

用Scrapy模拟JavaScript按钮点击

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >