2024-06-09 19:36:26 发布
网友
这是我的代码:
import re import mechanize br = mechanize.Browser() br.open("http://www.douban.com/") print br.title()
我访问的是一个中文网站,但是返回的标题是奇怪的字符
我怎样才能解决这个问题?在
如果您只执行br.title(),它将为您提供特殊字符的unicode字符串。在
br.title()
print试图通过编码Unicode字符串来显示非ASCII字符。在
print
因为字符集的问题。例如,在Python 3.X中:
>>> print("豆瓣".encode("utf8").decode('gbk')) 璞嗙摚
换言之,序列中的内容“tomething”以字符集“utf8”编码。但你的客户试图将其显示为字符集“gbk”。要解决这个问题,您需要在这两个不同的字符集之间传输内容,例如品牌名称().encode('gbk')。解码(“utf8”)
如果您只执行
br.title()
,它将为您提供特殊字符的unicode字符串。在print
试图通过编码Unicode字符串来显示非ASCII字符。在因为字符集的问题。例如,在Python 3.X中:
换言之,序列中的内容“tomething”以字符集“utf8”编码。但你的客户试图将其显示为字符集“gbk”。要解决这个问题,您需要在这两个不同的字符集之间传输内容,例如品牌名称().encode('gbk')。解码(“utf8”)
相关问题 更多 >
编程相关推荐