不支持文件类型html文档(文本/html)

2024-06-17 15:07:19 发布

您现在位置:Python中文网/ 问答频道 /正文

我必须下载多个pdf文件,我没有他们的直接下载链接。我拥有的是html页面的链接,在该页面上有下载链接。例如,此链接:

https://www.astrazeneca.com/sustainability.html

如果您访问此链接,则有两个可用的pdf下载链接(https://www.astrazeneca.com/content/dam/az/Sustainability/2020/pdf/Sustainability_Report_2019.pdfhttps://www.astrazeneca.com/content/dam/az/Sustainability/2020/pdf/Sustainability_Data_Summary_2019.pdf)。我必须实际下载这些,但我手中没有这些链接

如何提取这些下载链接

我还有一个示例链接: http://www.mtr.com.hk/sustainability/2017rpt/en/corporate/sustainability/2017rpt/home.php


Tags: 文件httpsreportcompdf链接htmlwww