Python mechanize:编码导致奇怪的ch

2024-06-09 19:36:26 发布

您现在位置:Python中文网/ 问答频道 /正文

这是我的代码:

import re
import mechanize

br = mechanize.Browser()
br.open("http://www.douban.com/")
print br.title()

我访问的是一个中文网站,但是返回的标题是奇怪的字符

我怎样才能解决这个问题?在


Tags: 代码brimportbrowserrecomhttp标题
2条回答

如果您只执行br.title(),它将为您提供特殊字符的unicode字符串。在

print试图通过编码Unicode字符串来显示非ASCII字符。在

因为字符集的问题。例如,在Python 3.X中:

>>> print("豆瓣".encode("utf8").decode('gbk'))
璞嗙摚

换言之,序列中的内容“tomething”以字符集“utf8”编码。但你的客户试图将其显示为字符集“gbk”。要解决这个问题,您需要在这两个不同的字符集之间传输内容,例如品牌名称().encode('gbk')。解码(“utf8”)

相关问题 更多 >