从页面中提取特定的URL并将它们转换为绝对URL

网友

1楼 · 编辑于 2024-06-16 11:38:25

您可以使用^{}创建完整的URL：

>>> import urlparse
>>> base_url = 'http://evenementen.uitslagen.nl/2013/marathonrotterdam/'
>>> urlparse.urljoin(base_url, 'details.php?whatever')
'http://evenementen.uitslagen.nl/2013/marathonrotterdam/details.php?whatever'

您可以使用列表理解对所有URL执行此操作：

^{pr2}$

网友

2楼 · 编辑于 2024-06-16 11:38:25

啊！我最喜欢的…列表理解！在

base_url = 'http://evenementen.uitslagen.nl/2013/marathonrotterdam/{0}'
urls = [base.format(x) for x in list_of_things_you_scraped]

我不是regex天才，所以您可能需要摆弄base_url直到您完全正确地处理它。在

网友

3楼 · 编辑于 2024-06-16 11:38:25

如果您需要一个接一个地使用最终的url，那么应该使用generator而不是迭代器。在

abs_url = "url data"
urls = (abs_url+url for url in endofurl)

如果您担心对可以使用的url进行编码urllib.urlencode（url）

相关问题更多 >

编程相关推荐

热门问题

热门文章

从页面中提取特定的URL并将它们转换为绝对URL

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >