我有现有的scrapy
代码,但在制定NEXT_PAGE_SELECTOR
时遇到困难,该代码将通过scrapy
中的css select选择元素:
def parse(self, response):
'''
get the first page of results.
'''
SET_SELECTOR = 'b_algo'
for bresult in response.css(SET_SELECTOR):
NAME_SELECTOR = 'h2 a ::text'
yield {
'name': bresult.css(NAME_SELECTOR).extract_first(),
}
'''
get the further pages of results.
'''
#<<NEXT_PAGE_SELECTOR here>>
html Im试图匹配的是:
^{pr2}$为了配合这一点,我制定了以下公式:
NEXT_PAGE_SELECTOR = '.sb_pagF li a ::attr(href)'
这看起来对抓取href
?在
谢谢!在
是的,这是正确的:
您可以始终在指向本地html的Scrapy Shell中测试选择器:
相关问题 更多 >
编程相关推荐