如何从网站下载多个PDF文件?

2023-02-06 14:13:02 发布

您现在位置:Python中文网/ 问答频道 /正文

我必须访问这个网址:http://tinyurl.com/3ypvx24并下载从2003年到2013年的所有pdf文件。正如你所看到的,当你点击一个数字时,链接会把你带到数字问题,然后你必须点击每一篇文章,转到另一个网址,最终下载pdf。挺烦人的。你知道吗

我能用一种更简单的方法吗?你知道吗

我发现只要通过这个url:/REIS/jsp/REIS.jsp?opcion=articulo&ktitulo=1967&;autor=I只需更改数字(本例中为1967),即可访问包含pdf的最后一个url。你知道吗

谢谢!!你知道吗


Tags: 文件方法comhttpurlpdf链接文章数字网址tinyurljsparticuloopcionreis
1条回答
网友
1楼 · 发布于 2023-02-06 14:13:02

您可以使用库urllib2、pycurl或mechanize来自动化此过程。这是一个漫长的过程,你必须自己写这篇文章:-)

在Google上搜索这些库,并从Python代码中检查它们是如何被使用的。你知道吗

相关问题 更多 >