2024-06-12 03:18:15 发布
网友
我试图做一些网页抓取,但我有一些问题,在加入相对和根网址
例如,根url是:http://www.jmlr.org/proceedings/papers/v2
http://www.jmlr.org/proceedings/papers/v2
相对url是:../v2/meila07a/meila07a.pdf
../v2/meila07a/meila07a.pdf
当我在urlparse中使用urljoin时:结果是奇怪的:
http://www.jmlr.org/proceedings/v2/meila07a/meila07a.pdf
这不是一个有效的链接。有人能帮我吗?在
两点(..)表示在层次结构中返回一次,将第二个链接改为./v2/meila07a/meila07a.pdf,它应该可以正常工作。在
..
./v2/meila07a/meila07a.pdf
或者您也可以将根目录更改为http://www.jmlr.org/proceedings/papers/v2/,由于此更改,它将不再在结尾处处理v2,因为根目录没有设置为正确的目录。在
http://www.jmlr.org/proceedings/papers/v2/
v2
两点(
..
)表示在层次结构中返回一次,将第二个链接改为./v2/meila07a/meila07a.pdf
,它应该可以正常工作。在或者您也可以将根目录更改为
http://www.jmlr.org/proceedings/papers/v2/
,由于此更改,它将不再在结尾处处理v2
,因为根目录没有设置为正确的目录。在相关问题 更多 >
编程相关推荐