python unicode获取值/获取tex

2条回答

网友

1楼 · 编辑于 2024-06-16 11:55:59

您似乎对Unicode进行了错误的解码；这些是UTF-8字节屏蔽为拉丁语-1码位。在

您可以通过编码到一个将Unicode码位一对一映射到字节的编解码器（如拉丁语1:

>>> uni_var = u'Na teatr w pi\xc4\x85tek'
>>> uni_var.encode('latin1')
'Na teatr w pi\xc4\x85tek'

但是要小心，这里也可能是CP1252编码被用来解码为Unicode的。这完全取决于这个Mojibake是在哪里生产的。在

您还可以使用^{} library来检测如何最好地修复此问题；它会生成Unicode输出：

^{pr2}$

图书馆将自动处理CP1252 Mojibake的。在

网友

2楼 · 编辑于 2024-06-16 11:55:59

您需要将字符串编码为Latin-1

>>> uni_var = u'Na teatr w pi\xc4\x85tek'
>>> uni_var.encode('Latin-1')
'Na teatr w pi\xc4\x85tek'