2024-04-24 18:54:34 发布
网友
我正在创建一个字典,它要求字符串的每个字母用空格隔开。我正在使用join。问题是当字符串包含非ascii字符时。Join将它们分成两个字符,结果是垃圾。在
示例:
>>> word = 'məsjø' >>> ' '.join(word)
给我:
我想要的是:
'm ə s j ø'
甚至:
'm \xc9\x99 s j \xc3\xb8'
您应该使用unicode字符串,即
word = u'məsjø'
别忘了在开始时设置Python源文件的编码
(别想用UTF-8以外的东西。;))
更新:这只适用于Python<;3。如果您使用Python>;=3,那么您可能一开始就不会遇到这些问题。因此,如果升级到3.x是一种选择,那么它是一种方式,在某些情况下,由于库依赖性等原因,可能不是这样。在
正如评论中提到的,编码问题也可能是由配置不同的终端引起的,尽管这显然不是这里的问题。在
您应该使用unicode字符串,即
别忘了在开始时设置Python源文件的编码
^{pr2}$(别想用UTF-8以外的东西。;))
更新:这只适用于Python<;3。如果您使用Python>;=3,那么您可能一开始就不会遇到这些问题。因此,如果升级到3.x是一种选择,那么它是一种方式,在某些情况下,由于库依赖性等原因,可能不是这样。在
正如评论中提到的,编码问题也可能是由配置不同的终端引起的,尽管这显然不是这里的问题。在
相关问题 更多 >
编程相关推荐