使用Scrapy下载PDF文件

0 投票

1 回答

1749 浏览

数据工程师

提问于 2025-04-17 06:11

我正在使用Scrapy这个Python的网页抓取框架，从一个网站上抓取pdf文件。

这个网站要求你保持同一个会话，才能下载pdf。

使用Scrapy的时候一切都很顺利，因为它是全自动的，但当我运行脚本几秒钟后，它开始给我一些假的pdf文件，就像我直接访问pdf时，没有保持会话一样。

这是为什么呢？有没有什么办法解决这个问题！？

自动化脚本网页抓取会话管理数据抓取 scrapy pdf下载

1 个回答

0

我觉得这个网站会记录你的会话。如果这个网站是用PHP做的，你需要在请求中传递PHPSESSID这个cookie，这样才能下载PDF文件。

回答于 2025-04-17 由 Python大师

分享举报

撰写回答