Python中字符编码的困难

tabla = {'\xE1':'á', '\xE9':'é', '\xED': 'í', '\xF3':'ó', '\xFA':'ú'} logger.info ("Valor del argumento antes del bucle de urldecode: %s" % valor) for k, v in tabla.iteritems(): if k in valor: valor.replace(k, v)

2条回答

网友

1楼 · 编辑于 2024-05-16 22:10:14

u'\xd1\xe9rez'似乎不是字符串Núñez.，而是Ñérez。你确定你的数据是什么吗？你知道吗

除此之外，您的数据是unicode。unicode没有编码，因为它已经是字符了；任何你认为必要的修正都应该发生在上游。您的web框架是否提供了这些值？你知道吗

网友

2楼 · 编辑于 2024-05-16 22:10:14

正确接收值（顺便说一句，该特定值是“ninerez”，而不是“Núñez”）。你知道吗

当Python将list或dict的内容转储到控制台时，每个字符串项都显示为表示（结果或repr()函数），而不是原始字符串。例如：

>>> print [0, u"é", 0]
[0, u'\xe9', 0]

我相信这一点的主要目的是通过将值复制粘贴回代码中，使它们可以直接重用。因为字符串可以包含各种引号和反斜杠，而且终端/网页/etc可能无法显示非ascii，所以打印未更改的字符串内容将不起作用。你知道吗

这些字符串中的真实文本是正确的：

>>> print u'\xd1\xe9rez'
Ñérez
>>>

相关问题更多 >

编程相关推荐

热门问题

热门文章