查找302重定向的Python脚本？

2024-06-16 16:29:49 发布

男 | 程序猿一只，喜欢编程写python代码。

所以我使用https://github.com/bartdag/pylinkvalidator，似乎是在页面上查找404的一个很好的工具。但是我正在爬行的网站将404重定向到了一个非常sorry for 404的页面。所以爬虫脚本没有检测到原始链接404

我写了一个小脚本，打印记录原始链接302和目的地链接，但这需要单独获取链接，我需要像pylinkvalidator一样对整个网站进行爬网。你知道吗

此脚本单独执行链接，但需要爬网整个网站

import requests
link = 'https://example.com/1234sdsd'
r = requests.get(link, allow_redirects=False)
print(link,r.status_code, r.headers['Location'])

甚至其他工具也很好，比如selenium，但我认为它也会有同样的问题。你知道吗

Tags：工具 https github 脚本 com for 网站链接

0条回答

目前没有回答