<p>我正在处理用拉丁文编码的外部数据。所以我添加了<code>sitecustomize.py</code>,并在其中添加了</p>
<pre><code>sys.setdefaultencoding('latin_1')
</code></pre>
<p>当然,现在使用拉丁1字符串可以很好地工作。在</p>
<p>但是,万一我遇到一些不是拉丁语编码的东西:</p>
^{pr2}$
<p>我得到<code>UnicodeEncodeError: 'latin-1' codec can't encode character u'\u2013' in position 3: ordinal not in range(256)</code></p>
<p>我想要的是,不可编码的字符将被忽略,也就是说,我将在上面的示例<code>s=='abc?'</code>中得到它,并且每次都不显式地调用<code>decode()</code>或{<cd5>},即在每次调用时不显式地调用s.decode(…,'replace')。在</p>
<p>我试着用<code>codecs.register_error</code>做不同的事情,但是没有用。在</p>
<p>请帮忙?在</p>