正确处理str/unicode的Python保存序列化？

>>> json.loads(json.dumps([u"x", "x"])) [u'x', u'x'] # Both unicode >>> msgpack.loads(msgpack.dumps([u"x", "x"])) ['x', 'x'] # Neither are unicode >>> bson.loads(bson.dumps({"x": [u"x", "x"]})) {u'x': [u'x', 'x']} # Dict keys become unicode >>> pyamf.decode(pyamf.encode([u"x", "x"])).next() [u'x', u'x'] # Both are unicode

3条回答

网友

1楼 · 编辑于 2024-05-15 20:39:27

你试过bert吗？在

>>> import bert
>>> bert.decode(bert.encode([u"x", "x"]))
[u'x', 'x']
>>> bert.decode(bert.encode({"x":[u"x", "x"]}))
{'x': [u'x', 'x']}

（要安装，必须先手动安装erlastic，因为this outstanding pull request）

网友

2楼 · 编辑于 2024-05-15 20:39:27

也许只需使用Python的repr来存储该值并使用ast.literal_eval方法反序列化它：

In [7]: ast.literal_eval (repr({"d": ["x", u"x"]}))
Out[7]: {'d': ['x', u'x']}

网友

3楼 · 编辑于 2024-05-15 20:39:27

寻找同样的东西，我发现msgpack python0.4现在支持str/unicode，并使用use-bin-type/encoding参数：

>>> msgpack.unpackb(msgpack.packb(["uu\x00u", u"adsa\xe4"], use_bin_type=True, encoding="utf-8"), encoding="utf-8")
['uu\x00u', u'adsa\xe4']

相关问题更多 >

编程相关推荐

热门问题

热门文章