python url解码%E3 - 问答 - Python中文网

python url解码%E3

2024-06-16 14:55:12 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我从freebase dump上得到了一些维基百科网址：

url 1:http://pt.wikipedia.org/wiki/Pedro_Miguel_de_Castro_Brand%25C3%25A3o_Costa

url 2:http://pt.wikipedia.org/wiki/Pedro_Miguel_de_Castro_Brand%E3o_Costa

他们都提到了维基百科上的同一页：

网址3:http://pt.wikipedia.org/wiki/Pedro_Miguel_deu Castro_Brandãu Costa

urllib.unquote在url 1上工作

url = 'Pedro_Miguel_de_Castro_Brand%25C3%25A3o_Costa'
url = urllib.unquote(url)
url = urllib.unquote(url)
print url

结果是

^{pr2}$

但不适用于url 2。在

url = 'Pedro_Miguel_de_Castro_Brand%E3o_Costa'
url = urllib.unquote(url)
print url

结果是

Pedro_Miguel_de_Castro_Brand�o_Costa

有什么不对劲吗？在

Tags： org pt http url wiki de urllib wikipedia

1条回答

网友

1楼 · 发布于 2024-06-16 14:55:12

前者是双引号UTF-8，因为您的终端使用UTF-8，所以通常打印出来。后者引用拉丁语-1，需要先解码。在

>>> print 'Pedro_Miguel_de_Castro_Brand\xe3o_Costa'
Pedro_Miguel_de_Castro_Brand�o_Costa
>>> print 'Pedro_Miguel_de_Castro_Brand\xe3o_Costa'.decode('latin-1')
Pedro_Miguel_de_Castro_Brandão_Costa

相关问题更多 >

编程相关推荐

热门问题

热门文章