我正努力做到以下几点:
事实上,zendesk遗漏了一些api(create/alter宏),我现在需要模拟模拟浏览器会话。在
所以我不是在写蜘蛛,而是在我的脚本进行的时候尝试与网站进行交互。post请求从一开始就不知道,但只在脚本中知道。在
在Scrapy文档中,有以下示例来说明如何在scray中使用经过身份验证的会话:
class LoginSpider(BaseSpider):
name = 'example.com'
start_urls = ['http://www.example.com/users/login.php']
def parse(self, response):
return [FormRequest.from_response(response,
formdata={'username': 'john', 'password': 'secret'},
callback=self.after_login)]
def after_login(self, response):
# check login succeed before going on
if "authentication failed" in response.body:
self.log("Login failed", level=log.ERROR)
return
# continue scraping with authenticated session...
但看起来这只适用于抓取,但在我的例子中,我只想“保持”会话并进一步处理该会话。 有没有一种方法可以用scrapy来实现这一点,或者是否有更适合这项任务的工具?在
非常感谢@wawaruk。根据你链接的stackoverflow帖子,我想出了一个解决方案:
从那里可以打开所有的页面,例如
^{pr2}$相关问题 更多 >
编程相关推荐