2024-05-14 00:06:39 发布
网友
下面是子字符串Ritē
Ritē
我有两个字符串,一个来自zipfile提取的文件名。我使用filename.encode('cp437').decode('utf-8')正确提取了所有路径。另一个是使用plistlib.readPlist()从.plist读取的。两者都使用print()正确打印。然而,相比之下,它们并不相同。我试图在utf-8中对它们进行编码,下面是它们的样子:
zipfile
filename.encode('cp437').decode('utf-8')
plistlib.readPlist()
.plist
print()
utf-8
Rite\xcc\x84
Rit\xc4\x93
根据评论,听起来这就是你想要的:
import unicodedata foo = 'Rit\u0113' bar = 'Rite\u0304' print(foo, bar) print(unicodedata.normalize('NFD', foo)) print(unicodedata.normalize('NFD', bar)) assert unicodedata.normalize('NFD', foo) == unicodedata.normalize('NFD', bar)
我选择NFD作为表单,但您可能更喜欢NFC
根据评论,听起来这就是你想要的:
我选择NFD作为表单,但您可能更喜欢NFC
相关问题 更多 >
编程相关推荐