使用Python中的urljoin连接URL

2024-06-12 03:18:15 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图做一些网页抓取,但我有一些问题,在加入相对和根网址

例如,根url是:http://www.jmlr.org/proceedings/papers/v2

相对url是:../v2/meila07a/meila07a.pdf

当我在urlparse中使用urljoin时:结果是奇怪的:

http://www.jmlr.org/proceedings/v2/meila07a/meila07a.pdf

这不是一个有效的链接。有人能帮我吗?在


Tags: orghttpurl网页pdf链接wwwv2
1条回答
网友
1楼 · 发布于 2024-06-12 03:18:15

两点(..)表示在层次结构中返回一次,将第二个链接改为./v2/meila07a/meila07a.pdf,它应该可以正常工作。在

或者您也可以将根目录更改为http://www.jmlr.org/proceedings/papers/v2/,由于此更改,它将不再在结尾处处理v2,因为根目录没有设置为正确的目录。在

相关问题 更多 >