python unicode获取值/获取tex

2024-06-16 11:55:59 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我有一个unicode变量:

uni_var = u'Na teatr w pi\xc4\x85tek'

我想要一个字符串,它将与uni_var相同,只是没有“u”,所以:

^{pr2}$

我该怎么做?我想找一些类似的东西:

str_var = uni_var.text()

Tags: 字符串textvarunicodepiuninastr
2条回答

您似乎对Unicode进行了错误的解码;这些是UTF-8字节屏蔽为拉丁语-1码位。在

您可以通过编码到一个将Unicode码位一对一映射到字节的编解码器(如拉丁语1:

>>> uni_var = u'Na teatr w pi\xc4\x85tek'
>>> uni_var.encode('latin1')
'Na teatr w pi\xc4\x85tek'

但是要小心,这里也可能是CP1252编码被用来解码为Unicode的。这完全取决于这个Mojibake是在哪里生产的。在

您还可以使用^{} library来检测如何最好地修复此问题;它会生成Unicode输出:

^{pr2}$

图书馆将自动处理CP1252 Mojibake的。在

您需要将字符串编码为Latin-1

>>> uni_var = u'Na teatr w pi\xc4\x85tek'
>>> uni_var.encode('Latin-1')
'Na teatr w pi\xc4\x85tek'

相关问题 更多 >