解析\xd0\xb2\xd0\xbe等问题

Question

我正在从数据库中读取一些数据，这些数据有多种语言，其中一种是俄语。当我尝试读取文本时，字符串显示如下：

('\xd0\xb2\xd0\xbe\xd1\x82 \xd0\xb2\xd1\x8b \xd0\xb5\xd0\xb3\xd0\xbe \xd1\x81\xd0\xb5\xd0\xb9\xd1\x87\xd0\xb0\xd1\x81 \xd0\xb8 \xd0\xbe\xd0\xbf\xd1\x80\xd0\xb0\xd0\xb2\xd0\xb4\xd1\x8b\xd0\xb2\xd0\xb0\xd0\xb5\xd1\x82\xd0\xb5! \xd0\xa0\xd0\xb0\xd1\x88\xd0\xb8\xd1\x81\xd1\x82\xd1\x8b \xd0\xb5\xd1\x89\xd1\x91 \xd1\x81\xd0\xb5\xd0\xb1\xd1\x8f \xd0\xbf\xd1\x80\xd0\xbe\xd1\x8f\xd0\xb2\xd1\x8f\xd1\x82. \xd1\x8d\xd1\x82\xd0\xbe \xd0\xb5\xd1\x89\xd1\x91 \xd0\xb4\xd0\xb0\xd0\xb6\xd0\xb5 \xd0\xbd\xd0\xb5 \xd0\xbd\xd0\xb0\xd1\x87\xd0\xb0\xd0\xbb\xd0\xbe!',)

所以如果我现在把我的代码写成：

import pprint

class MyPrettyPrinter(pprint.PrettyPrinter):
    def format(self, object, context, maxlevels, level):
        if isinstance(object, unicode):
            return (object.encode('utf8'), True, False)
        return pprint.PrettyPrinter.format(self, object, context, maxlevels, level)

a = ('\xd0\xb2\xd0\xbe\xd1\x82 \xd0\xb2\xd1\x8b \xd0\xb5\xd0\xb3\xd0\xbe \xd1\x81\xd0\xb5\xd0\xb9\xd1\x87\xd0\xb0\xd1\x81 \xd0\xb8 \xd0\xbe\xd0\xbf\xd1\x80\xd0\xb0\xd0\xb2\xd0\xb4\xd1\x8b\xd0\xb2\xd0\xb0\xd0\xb5\xd1\x82\xd0\xb5! \xd0\xa0\xd0\xb0\xd1\x88\xd0\xb8\xd1\x81\xd1\x82\xd1\x8b \xd0\xb5\xd1\x89\xd1\x91 \xd1\x81\xd0\xb5\xd0\xb1\xd1\x8f \xd0\xbf\xd1\x80\xd0\xbe\xd1\x8f\xd0\xb2\xd1\x8f\xd1\x82. \xd1\x8d\xd1\x82\xd0\xbe \xd0\xb5\xd1\x89\xd1\x91 \xd0\xb4\xd0\xb0\xd0\xb6\xd0\xb5 \xd0\xbd\xd0\xb5 \xd0\xbd\xd0\xb0\xd1\x87\xd0\xb0\xd0\xbb\xd0\xbe!',)

MyPrettyPrinter().pprint(a)

输出结果是：

('\xd0\xb2\xd0\xbe\xd1\x82 \xd0\xb2\xd1\x8b \xd0\xb5\xd0\xb3\xd0\xbe \xd1\x81\xd0\xb5\xd0\xb9\xd1\x87\xd0\xb0\xd1\x81 \xd0\xb8 \xd0\xbe\xd0\xbf\xd1\x80\xd0\xb0\xd0\xb2\xd0\xb4\xd1\x8b\xd0\xb2\xd0\xb0\xd0\xb5\xd1\x82\xd0\xb5! \xd0\xa0\xd0\xb0\xd1\x88\xd0\xb8\xd1\x81\xd1\x82\xd1\x8b \xd0\xb5\xd1\x89\xd1\x91 \xd1\x81\xd0\xb5\xd0\xb1\xd1\x8f \xd0\xbf\xd1\x80\xd0\xbe\xd1\x8f\xd0\xb2\xd1\x8f\xd1\x82. \xd1\x8d\xd1\x82\xd0\xbe \xd0\xb5\xd1\x89\xd1\x91 \xd0\xb4\xd0\xb0\xd0\xb6\xd0\xb5 \xd0\xbd\xd0\xb5 \xd0\xbd\xd0\xb0\xd1\x87\xd0\xb0\xd0\xbb\xd0\xbe!',)

我想把这个文本转换回ASCII格式。我试过了PrettyPrinter方法，具体说明可以在这里找到，但这个方法只是打印了字符串。我想把这个“修复过的”字符串以ASCII/utf-8格式（也就是实际的俄文文本，而不是带有斜杠的文本）捕获并存储到一个列表中，但我不知道该怎么做。希望能得到一些帮助。

编辑：

enter image description here

这是我拥有的字符串，我尝试将其转换为unicode，但完全没有效果。

数据解析编码问题字符串编码 ascii格式文本存储 unicode转换数据库读取俄语文本

解析\xd0\xb2\xd0\xbe等问题

1 个回答

撰写回答