ascii' 编码无法编码字符 u'\u2013
我正在使用Wikipedia.py这个库来从维基百科的各个部分获取信息。
在这个过程中,我在下面的Python代码中遇到了编码的问题:
for section in data.sections:
info = data.section(section).encode('utf-8')
info = info.encode('string_escape')
print info
这里的data变量是整个维基百科页面的内容。
每次我运行这个脚本时,都会收到以下错误信息:
'ascii'编码无法编码字符u'\u2013'
1 个回答
0
你必须先按照维基百科章节的编码来解码 data.section(section)
。
假设维基百科章节的编码是 gbk
,那么代码示例大致是这样的:
for section in data.sections:
# Please check encoding in decode() first.
info = data.section(section).decode('gbk').encode('utf-8')
info = info.encode('string_escape')
print info