Python 3,如何将字符串转换为“iso-8859-1”以用于html
当我在一个瑞典网页上输入文本“gå”时,生成的HTML字段是g%E5。也就是说,字母a-ring(å)被编码成了%E5。我猜他们使用的是ISO-8859-1编码。
如果我用Python 3.0脚本生成相同的HTML地址,字符串“gå”会被编码成g%C3%A5。现在字母a-ring(å)被编码成了%C3%A5。我猜Python 3.0(字符串)是用UTF-8这种方式来编码a-ring的。
我该如何使用Python 3生成带有g%E5的HTML地址呢?
1 个回答
2
我创建了这个Python源文件:
#coding: utf-8
print repr(u"gå".encode("ISO-8859-1"))
然后得到了这个输出:
'g\xe5'
我使用的是Python 2,不过在Python 3中应该也是一样的,只是unicode字符串前面没有u
,可能也不需要编码那一行,而且要用ascii
代替repr
。
所以其实只需要简单地指定"ISO-8859-1"
作为编码就可以了。
由于我没有看到你具体的代码,无法告诉你具体该在哪里做这个设置。你可以查看你使用的工具的文档,了解如何设置编码。