ascii' 编码无法编码字符 u'\u2013

0 投票
1 回答
2428 浏览
提问于 2025-04-18 07:04

我正在使用Wikipedia.py这个库来从维基百科的各个部分获取信息。
在这个过程中,我在下面的Python代码中遇到了编码的问题:

for section in data.sections:
        info = data.section(section).encode('utf-8')
        info = info.encode('string_escape')
        print info

这里的data变量是整个维基百科页面的内容。
每次我运行这个脚本时,都会收到以下错误信息:

'ascii'编码无法编码字符u'\u2013'

1 个回答

0

你必须先按照维基百科章节的编码来解码 data.section(section)

假设维基百科章节的编码是 gbk,那么代码示例大致是这样的:

for section in data.sections:
    # Please check encoding in decode() first.
    info = data.section(section).decode('gbk').encode('utf-8')
    info = info.encode('string_escape')
    print info

撰写回答