擅长:python、mysql、java
<p>记住一切都是字节是很重要的。要将字节拉入对您有用的内容,您需要知道在拉入数据时使用了什么编码。有太多模棱两可的情况,无法通过分析数据来确定编码。当你把所有的数据都发送出去的时候。根据您使用的是python2.x还是3.x,您将对Unicode和Python有着截然不同的体验。在</p>
<p>但是,您可以尝试编码并对错误执行“替换”。例如,<code>the_string.encode("utf-8","replace")</code>将尝试编码为utf-8,并将问题替换为<code>?</code>。您也可以预先预测问题字符并提前替换它们,但这很快就会变得不可管理。查看<a href="https://docs.python.org/2/library/codecs.html#codec-base-classes" rel="nofollow">^{<cd3>}</a>类以获得更多替换选项。在</p>