单击li按钮的最佳方式是什么？

import scrapy from ..items import BookItem class BookSpiderSpider(scrapy.Spider): name = "book_spider" start_urls = ( 'https://www.booking.com/smallcity/offset=10', ) def parse(self, response) : items = BookItem() title_name = response.css('span.sr-hotel__name::text').extract() items['title_name'] = title_name yield items

2条回答

网友

1楼 · 编辑于 2024-05-15 03:31:01

User.urljoin，为了避免任何URL架构问题：

next_page_url = response.urljoin( next_href )

网友

2楼 · 编辑于 2024-05-15 03:31:01

嗨，请将此代码段用于您的应用程序

next_page = response.xpath('//a[contains(@class,"ficon-caret-right")]/@href').extract()

        if len(next_page) !=0:
            next_href = next_page[0]
            next_page_url = next_href
            print "==============> next cat pagination url :", next_page_url
            yield scrapy.Request(next_page_url, callback=self.parse)

编程相关推荐

java Admob不使用webview
Java Wicket表单：序列化对象类“myClassName”时出错
java googledriveapi更新文件与我的帐户管理员
java简单框架未知xml标记解析
java如何使用主类和用户获取Spark应用程序ID
java如何更改自定义属性的值？
java有没有办法在jMock中找到未使用的期望值？
gradle运行任务的java文档？
java通过使用数组来存储文本文件的行，通过覆盖来删除文本文件中的行
用于表达式语言注入的java利用负载

相关问题更多 >

编程相关推荐

热门问题

热门文章

单击li按钮的最佳方式是什么？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >