Python无法将错误的unicode编码为ascii

2条回答

网友

1楼 · 编辑于 2024-05-17 13:09:00

你混淆了“unicode”和“utf-8”。您的字符串s不是unicode；它是特定编码中的bytestring（但不是UTF-8，更可能是iso-8859-1或类似的）从bytestring到unicode是通过解码数据完成的，而不是编码。从unicode到bytestring是编码。也许你想让s成为一个unicode字符串：

>>> s = u'ad\xc2-ven\xc2-ture'
>>> s.encode('utf8', 'ignore')
'ad\xc3\x82-ven\xc3\x82-ture'

或者，您可能希望将bytestring视为UTF-8，但忽略无效序列，在这种情况下，您将使用“ignore”作为错误处理程序对bytestring进行解码：

^{pr2}$

网友

2楼 · 编辑于 2024-05-17 13:09:00

在Python 2.x中，将字符串转换为unicode实例是str.decode()：

 >>> s.decode("ascii", "ignore")
 u'ad-ven-ture'

编程相关推荐

java通过Spring依赖注入部署CXF服务端点
java字节或字节，请解释
java Swing组件命名约定？
java可以在JOptionPane中放置多个输入。显示输入对话框？
Dropwizard for Hibernate中的java SQLight方言
Windows8中的java CPU负载
将Java版本号映射到主要Java版本
使用数据库Java重新启动pi
java如何在RecyclerView中显示ArrayList？
使用枚举作为映射键的java会在数据库中生成RAW

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python无法将错误的unicode编码为ascii

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >