如何将WE8MSWIN1252编码的数据转换为UTF-8以用于Python脚本?
这些数据来自一个Oracle数据库,并且以'WE8MSWIN1252'编码的格式提取到平面文件中。
我想对这些数据进行解析和分析。我想查看文本字段,但不需要把结果发布到其他系统,所以如果有些字符没有完美转换,我也没问题。
我只是不想因为解码错误而导致解析失败,这种情况发生在我使用以下代码时:
inputFile = codecs.open( dataFileName, "r", "utf-8'")
1 个回答
2
根据最后几个字符,我猜这个编码是其他地方所称的windows-1252。所以你可以试试:
inputFile = codecs.open(dataFileName, "r", "windows-1252")