将文件从cp1251转换为utf8

2024-05-14 05:37:05 发布

您现在位置:Python中文网/ 问答频道 /正文

我看到了类似的问题,但答案没有帮助。 此代码:

with codecs.open( sourceFileName, "r",  sourceEncoding, ) as sourceFile:
    contents = sourceFile.read()

with codecs.open( sourceFileName, "w", "utf-8") as targetFile:
    if contents:
        targetFile.write(contents)

返回错误“UnicodeDecodeError:'charmap'codec无法解码位置1中的字节0x98:字符映射到未定义”

此代码:

^{pr2}$

产生同样的错误。麻烦的符号是西里尔字母“И”(据我所知,它是用“0xc8”而不是“0x98”)来表示的。我在windows上使用python2.7。在

UPD:原来,原始文件编码可能不是cp1251,这些错误可能是文本编辑器中的错误造成的。但是,我所有的文本编辑器都能正确地读取这个文件。 然后我在寻找一些解决办法,因为没有这个字母的文件被正确地转换。在


Tags: 文件答案代码as错误with字母contents
1条回答
网友
1楼 · 发布于 2024-05-14 05:37:05

我发现由于某种错误(或者只是我的愚蠢),我试图转换已经转换过的文件。在

很抱歉浪费你的时间

相关问题 更多 >