cx_Oracle - 将查询结果编码为Raw

2 投票

1 回答

6269 浏览

数据工程师

提问于 2025-04-17 04:45

编辑：

下面的打印结果显示了我想要的值。

(sys.stdout.encoding 和 sys.stdin.encoding 都是 'UTF-8')。

为什么变量的值和打印出来的值不一样？我需要把原始值放到一个变量里。

>>username = 'Jo\xc3\xa3o'
>>username.decode('utf-8').encode('latin-1')
'Jo\xe3o'
>>print username.decode('utf-8').encode('latin-1')
João

原始问题：

我在查询一个数据库时遇到了问题，想把值解码成Python能用的格式。

我确认了我的数据库的 NLS_LANG 设置，使用了

select property_value from database_properties where property_name='NLS_CHARACTERSET';

'''AL32UTF8 stores characters beyond U+FFFF as four bytes (exactly as Unicode defines 
UTF-8). Oracle’s “UTF8” stores these characters as a sequence of two UTF-16 surrogate
characters encoded using UTF-8 (or six bytes per character)'''

os.environ["NLS_LANG"] = ".AL32UTF8"

....
conn_data = str('%s/%s@%s') % (db_usr, db_pwd, db_sid)

sql = "select user_name apex.users where user_id = '%s'" % userid

...

cursor.execute(sql)
ldap_username = cursor.fetchone()
...

其中

print ldap_username
>>'Jo\xc3\xa3o'

我都试过了（返回的结果是一样的）

ldap_username.decode('utf-8')
>>u'Jo\xe3o'
unicode(ldap_username, 'utf-8')
>>u'Jo\xe3o'

其中

u'João'.encode('utf-8')
>>'Jo\xc3\xa3o'

怎么才能把查询的结果正确地返回为 'João' 呢？

数据库连接数据库查询 utf-8 编码问题 cx_oracle 解码 nls_lang 原始值

1 个回答

你已经有正确的'João'了。我觉得这里的区别在于 >>> 'Jo\xc3\xa3o' 和 >>> print 'Jo\xc3\xa3o'。前者是对这个对象调用了 repr，而后者是调用了 str（在你的情况下可能是 unicode）。这只是字符串的不同表示方式。

一些例子可能会让这个更清楚：

>>> print 'Jo\xc3\xa3o'.decode('utf-8')
João
>>> 'Jo\xc3\xa3o'.decode('utf-8')
u'Jo\xe3o'
>>> print repr('Jo\xc3\xa3o'.decode('utf-8'))
u'Jo\xe3o'

注意第二个和第三个结果是一样的。原来的 ldap_username 目前是一个ASCII字符串。你可以在Python提示符下看到这一点：当它显示一个ASCII对象时，会显示为 'ASCII string'，而Unicode对象则显示为 u'Unicode string'——关键是前面的 u。

所以，当你的 ldap_username 显示为 'Jo\xc3\xa3o'，并且是一个ASCII字符串时，以下内容适用：

>>> 'Jo\xc3\xa3o'.decode('utf-8')
u'Jo\xe3o'
>>> print 'Jo\xc3\xa3o'.decode('utf-8') # To Unicode...
João
>>> u'João'.encode('utf-8')             # ... back to ASCII
'Jo\xc3\xa3o'

总结一下：你需要确定字符串的类型（如果不确定可以使用 type），然后根据类型决定是解码成Unicode，还是编码成ASCII。

回答于 2025-04-17 由 Python大师

分享举报

cx_Oracle - 将查询结果编码为Raw

1 个回答

撰写回答