2024-06-16 11:55:59 发布
网友
假设我有一个unicode变量:
uni_var = u'Na teatr w pi\xc4\x85tek'
我想要一个字符串,它将与uni_var相同,只是没有“u”,所以:
uni_var
我该怎么做?我想找一些类似的东西:
str_var = uni_var.text()
您似乎对Unicode进行了错误的解码;这些是UTF-8字节屏蔽为拉丁语-1码位。在
您可以通过编码到一个将Unicode码位一对一映射到字节的编解码器(如拉丁语1:
>>> uni_var = u'Na teatr w pi\xc4\x85tek' >>> uni_var.encode('latin1') 'Na teatr w pi\xc4\x85tek'
但是要小心,这里也可能是CP1252编码被用来解码为Unicode的。这完全取决于这个Mojibake是在哪里生产的。在
您还可以使用^{} library来检测如何最好地修复此问题;它会生成Unicode输出:
图书馆将自动处理CP1252 Mojibake的。在
您需要将字符串编码为Latin-1
Latin-1
>>> uni_var = u'Na teatr w pi\xc4\x85tek' >>> uni_var.encode('Latin-1') 'Na teatr w pi\xc4\x85tek'
您似乎对Unicode进行了错误的解码;这些是UTF-8字节屏蔽为拉丁语-1码位。在
您可以通过编码到一个将Unicode码位一对一映射到字节的编解码器(如拉丁语1:
但是要小心,这里也可能是CP1252编码被用来解码为Unicode的。这完全取决于这个Mojibake是在哪里生产的。在
您还可以使用^{} library 来检测如何最好地修复此问题;它会生成Unicode输出:
^{pr2}$图书馆将自动处理CP1252 Mojibake的。在
您需要将字符串编码为
Latin-1
相关问题 更多 >
编程相关推荐