我正在清理一个pandas数据帧,遇到了unicode字符串,它里面有一个反斜杠,而我需要替换它
u'\u2014'.replace('\u','')
Result: u'\u2014'
我尝试过将其编码为utf-8
,然后解码,但这没用,我觉得肯定有更简单的方法来解决这个问题。在
熊猫代码
^{pr2}$
错误
UnicodeEncodeError: 'ascii' codec can't encode character u'\u2014' in position 0: ordinal not in range(128)
Tags:
是的,它不是一个字符串,而是一个字符串。在
有助于:
希望这有帮助。在
u'\u2014'
实际上是-
。不是数字。它是一个utf-8
字符。尝试使用print关键字打印它。你会知道的这是ipython中的输出:
根据你的评论,这是你做错了什么 “-”与“EM Dash”Unicode字符(u'\u2014'不同)
所以,你应该做以下事情
^{pr2}$那就行了
编辑: 由于您使用的是python2.x,因此必须使用utf-8对其进行编码,如下所示
相关问题 更多 >
编程相关推荐