如何在Python中将编码链接"http%3A%2F%2Fexample.com%2Fwhatever"转为"http://example.com/whatever"?
我发现HTML源代码中的链接总是以这种格式存储,问题是我该如何把这些链接改回正常的样子呢?
非常感谢!
2 个回答
0
单独使用 urllib.unquote() 可能会出现问题,导致抛出一个错误:
UnicodeDecodeError: 'ascii' 编码无法解码位置 n 的字节 0xc3:序号不在范围内(128)
在这种情况下,可以尝试这样做:
print urllib.unquote("Ober%C3%B6sterreich.txt").decode("utf8")
4
使用 urllib.unquote 这个工具。