如何在python中转换特殊字符的编码?

2024-05-29 04:45:31 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个文件包括一些句子。但其中一些包含一些有线字符(√•, √§, √Ñ), 如下所示。它们是什么?有没有办法将它们转换回python中的普通字符

谢谢你

举例说明

Is there an outdoor grill/bbq place? Pär

Hej Hur långt aaär de till Stallarna? MVH LAILA

Är där sandstrand och hur långt


Tags: 文件anisplacengt字符句子there
1条回答
网友
1楼 · 发布于 2024-05-29 04:45:31

它似乎使用了错误的编码-MacRoman而不是UTF-8。可能是MacOS系统

如果我用MacRoman编码它(到字节),然后用utf-8把它解码回字符串,那么我就得到了正确的文本

text = '''Is there an outdoor grill/bbq place? Pär

Hej Hur långt aaär de till Stallarna? MVH LAILA

Är där sandstrand och hur långt'''

text = text.encode('MacRoman').decode('utf-8') 
print(text)

结果:

Is there an outdoor grill/bbq place? Pär

Hej Hur långt aaär de till Stallarna? MVH LAILA

Är där sandstrand och hur långt

在Linux Mint 19.2和Python 3.7上测试

来自问题How to decode these characters? √° √© √≠MacRoman信息

相关问题 更多 >

    热门问题