2024-03-28 09:08:56 发布
网友
我在用Python写蜘蛛。我得到了一个包含一个元素[u'\xb9\xd8\xd3\xda\xbf\xaa\xd5\xb9]的列表,它是GBK代码“关开展”。我试过一些方法,但都不管用。在
[u'\xb9\xd8\xd3\xda\xbf\xaa\xd5\xb9]
通常,编码的字符串是str,解码的字符串是unicode。您得到的编码unicode是由错误解码引起的。您可以通过encode('latin1')将其转换回str,然后由GBK解码:
str
unicode
encode('latin1')
>>> text = u'\xb9\xd8\xd3\xda\xbf\xaa\xd5\xb9' >>> text = text.encode('latin1') >>> text '\xb9\xd8\xd3\xda\xbf\xaa\xd5\xb9' >>> text = text.decode('gbk') >>> text u'\u5173\u4e8e\u5f00\u5c55'
然后你可以打印出来。在
通常,编码的字符串是
str
,解码的字符串是unicode
。您得到的编码unicode
是由错误解码引起的。您可以通过encode('latin1')
将其转换回str
,然后由GBK解码:然后你可以打印出来。在
相关问题 更多 >
编程相关推荐