UnicodeDecodeError:“charmap”编解码器无法解码位置55中的字节0x81:字符映射到<undefined>问题的回答

UnicodeDecodeError:“charmap”编解码器无法解码位置55中的字节0x81:字符映射到<undefined>

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我是Python新手，希望有人能向我解释错误消息的含义。 具体来说，我有一些将Python和SPSS组合在一起的代码保存在Atom中，Atom是由以前的同事创建的。既然以前的同事不在了，我现在就要运行代码了。我做的是从SPSS22中运行下面的代码。 <pre><code> begin program. import spss,spssaux,imp abcvalid = imp.load_source('abcvalid', "I:/VALIDITY CHECK/Python Library/2016/abcvalid2016.py") import abcvalid abcvalid.fullprocess("9_26_2016","M:/Users/Yli\2016 SURVEY/DOWNLOADS/9_26_2016/","M:/Users/Yli/2016 SURVEY/Legacy15.sav") end program. </code></pre> 然后我从输出中得到以下信息。 <pre><code> Traceback (most recent call last): File "<string>", line 5, in <module> File "I:/VALIDITY CHECK/Python Library/2016/abcnvalid2016.py", line 2067, in fullprocess dataprep(date,filepath,legacypath) File "I:/VALIDITY CHECK/Python Library/2016/abcvalid2016.py", line 2006, in dataprep emailslower(date,filepath) File "I:/VALIDITY CHECK/Python Library/2016/abcvalid2016.py", line 1635, in emailslower <a href="https://www.cnpython.com/pypi/dataset" class="inner-link">dataset</a> ACTIVATE comment_data.""".format(date,filepath)) File "C:\PROGRA~1\IBM\SPSS\STATIS~1\22\Python\Lib\site-packages\spss\spss.py", line 1494, in Submit cmdList = spssutil.CheckStr(cmdList) File "C:\PROGRA~1\IBM\SPSS\STATIS~1\22\Python\Lib\site-packages\spss\spssutil.py", line 166, in CheckStr s1 = unicode(mystr,locale.getlocale(locale.LC_CTYPE)[1]) File "C:\Program Files\IBM\SPSS\Statistics\22\Python\lib\encodings\cp1252.py", line 15, in decode return codecs.charmap_decode(input,errors,decoding_table) UnicodeDecodeError: 'charmap' codec can't decode byte 0x81 in position 55: character maps to <undefined> </code></pre> 我知道这个网站上也有类似的问题，但是这些问题和答案太难让我理解了。如果有人能帮我，我会非常感激的！ 提前谢谢你！

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

首先，下面是一个在Windows上重现错误的最小示例： <pre><code>import subprocess with subprocess.Popen("cmd /c echo ü", stdout=subprocess.PIPE, text=True) as Process: for Line in Process.stdout: print(Line) </code></pre> 据我所知，问题是这样的（我整理了一些我发现的信息和例子，但并不确定每件事都是正确的。我欢迎更正。） <ul> <li><code>ü</code>字符是Unicode中的代码点252=0xfc，<a href="https://unicode-table.com/en/00FC/" rel="nofollow noreferrer">https://unicode-table.com/en/00FC/</a>）。</li> <li>Python correct将<code>ü</code>字符传递到控制台，您可以使用此示例进行测试（请确保将文件保存为UTF-8）：</li> </ul> <pre><code>import subprocess print(ord('ü')) subprocess.call("cmd /c echo ü") </code></pre> 我不知道为什么一开始就这样。（这个答案可能是原因：<a href="https://stackoverflow.com/a/32176732/880783">https://stackoverflow.com/a/32176732/880783</a>） <ul> <li>控制台在内部使用的不是Unicode。例如，在<a href="http://www.asciitable.com/" rel="nofollow noreferrer">ASCII table</a>中，<code>ü</code>字符位于位置129=0x81（听起来很熟悉？）。</li> <li>所以当控制台返回那个字符时，Python认为它是Unicode代码点，但是<a href="https://unicodelookup.com/#0x81" rel="nofollow noreferrer">0x81 is not defined</a>。因此产生了错误。</li> </ul> 关键是让Python了解如何对它从流程中获得的内容进行编码。在我的示例（Windows控制台）中，我尝试了以下几种编码（请参见<a href="https://docs.python.org/3/library/codecs.html" rel="nofollow noreferrer">list here</a>）： <pre><code>import subprocess Encoding = 'cp850' with subprocess.Popen("cmd /c echo ü", stdout=subprocess.PIPE, text=True, encoding=Encoding) as Process: for Line in Process.stdout: print(Line) </code></pre> <ul> <li><code>'ascii'</code>失败，出现<code>ordinal not in range(128)</code>错误（可能不包括扩展的ASCII）。</li> <li><code>'cp1252'</code>失败，出现<code>character maps to <undefined></code></li> <li><code>'latin_1'</code>可以工作，但在VS代码中的调试控制台上输出一个方框字符（``）。</li> <li><code>'cp850'</code>似乎可以工作，输出一个<code>ü</code>字符。</li> </ul> 所以我现在就坚持<code>'cp850'</code>，看看进展如何。

UnicodeDecodeError:“charmap”编解码器无法解码位置55中的字节0x81:字符映射到<undefined>

1 个回答

相关Python问题